Анализ изображений 2025 — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Важные ссылки)
 
(не показаны 3 промежуточные версии 2 участников)
Строка 18: Строка 18:
 
= Важные ссылки =
 
= Важные ссылки =
  
'''Чат курса:''' <code>t.me/+1RcsnP7s8jA1OGNi</code> (удалить пробелы).
+
'''Чат курса:''' <code>t.me / +1RcsnP7s8jA1OGNi</code> (удалить пробелы).
  
 
Дальнейшие инструкции для регистрации на курс, ссылки на материалы курса и прочая организационная информация будут опубликованы в этом чате, в топике "Анонсы".
 
Дальнейшие инструкции для регистрации на курс, ссылки на материалы курса и прочая организационная информация будут опубликованы в этом чате, в топике "Анонсы".
Строка 31: Строка 31:
 
'''Критерии оценки'''.<br>
 
'''Критерии оценки'''.<br>
 
Приблизительные критерии в процентах от макс. балла (исходя из прошлогодних результатов):<br>
 
Приблизительные критерии в процентах от макс. балла (исходя из прошлогодних результатов):<br>
75% — отлично<br>
+
80% — отлично<br>
65% — хорошо<br>
+
70% — хорошо<br>
55% — удовлетворительно<br>
+
60% — удовлетворительно<br>
 
Настоящие пороги будут опубликованы ближе к концу курса и могут отличаться от приблизительных.<br>
 
Настоящие пороги будут опубликованы ближе к концу курса и могут отличаться от приблизительных.<br>
  
Строка 58: Строка 58:
 
|-
 
|-
 
| 1
 
| 1
| 11.09.2025
+
| 18.09.2025
| Цифровое изображение
+
| Введение в предмет, Цифровое изображение, Свет и цвет
| Введение в практическую часть курса, Работа с numpy
+
| Тестовая система, Работа с NumPy
 
| Демозаикинг<br />Прокудин-Горский
 
| Демозаикинг<br />Прокудин-Горский
 
|-
 
|-
 
| 2
 
| 2
| 18.09.2025
+
| 25.09.2025
 +
| Основы обработки изображений
 
| Основы обработки изображений
 
| Основы обработки изображений
| Базовая обработка изображений
 
 
|  
 
|  
 
|-
 
|-
 
| 3
 
| 3
| 25.09.2025
+
| 02.10.2025
 
| Сжатие изображений, Преобразование Фурье
 
| Сжатие изображений, Преобразование Фурье
 
| Преобразование Фурье
 
| Преобразование Фурье
| Сжатие изображение (PCA, JPEG)<br />Обратная свертка
+
| Сжатие изображение<br />Обратная свертка
 
|-
 
|-
 
| 4
 
| 4
| 02.10.2025
+
| 09.10.2025
| Классификация изображений. Введение в нейросети
+
| Классификация изображений, Введение в нейросети
| Иерархия абстракций: numpy, pytorch, pytorch-lightning
+
| Обучение нейросетей: NumPy, PyTorch
| Реализация нейросети на numpy
+
| Реализация нейросети
 
|-
 
|-
 
| 5
 
| 5
| 09.10.2025
+
| 16.10.2025
 
| Сверточные нейросетевые архитектуры
 
| Сверточные нейросетевые архитектуры
| Нейросетевые задания курса, Базовое обучение нейросетей
+
| Нейросетевые задания курса, Обучение нейросетей: Базовые приемы
 
| Регрессия точек лица
 
| Регрессия точек лица
 
|-
 
|-
 
| 6
 
| 6
| 16.10.2025
+
| 23.10.2025
 
| Трансформеры и сверточные нейронные сети с большими ядрами
 
| Трансформеры и сверточные нейронные сети с большими ядрами
| Разбор устройства ViT, Приемы для дообучения нейросетей
+
| Обучение нейросетей: Продвинутые приемы, Разбор устройства ViT
| Дообучение нейросети
+
| Дообучение классификатора
 
|-
 
|-
 
| 7
 
| 7
| 23.10.2025
+
| 30.10.2025
 
| Поиск похожих изображений
 
| Поиск похожих изображений
| Метрическое обучение, Эффективность тензорных вычислений
+
| Метрическое обучение
 
| Классификация редких дорожных знаков
 
| Классификация редких дорожных знаков
 
|-
 
|-
 
| 8
 
| 8
| 30.10.2025
+
| 06.11.2025
 
| Детекторы объектов
 
| Детекторы объектов
| Детектирование объектов
+
| Практические аспекты CV/ML в индустрии
| Простой нейросетевой детектор
+
| Простой детектор машин
 
|-
 
|-
 
| 9
 
| 9
| 06.11.2025
+
| 13.11.2025
 
| Сегментация изображений
 
| Сегментация изображений
| Простая нейросеть для сегментации
 
 
| Сегментация изображений
 
| Сегментация изображений
 +
| Интерактивная сегментация
 
|-
 
|-
 
| 10
 
| 10
| 13.11.2025
+
| 20.11.2025
 
| Основы обработки видео
 
| Основы обработки видео
| Работа с видео
+
| Работа с видео, Оптический поток
 
| Трекинг объектов
 
| Трекинг объектов
 
|-
 
|-
 
| 11
 
| 11
| 20.11.2025
+
| 27.11.2025
| Self-supervised learning, foundation models
+
| Обучение без разметки, Фундаментальные модели
| Self-supervised learning
+
| Обучение без разметки, Метод MoCo
|  
+
| Квантование нейросетей
 
|-
 
|-
 
| 12
 
| 12
| 27.11.2025
+
| 04.12.2025
| Перенос стиля, superresolution, GAN, VAE (начало)
+
| Перенос стиля, Синтез изображений
| AE, VAE, GAN
+
| Вариационные автоэнкодеры, Генеративно-состязательные сети
| GAN
+
| Генерация кроссовок
 
|-
 
|-
 
| 13
 
| 13
| 04.12.2025
+
| 11.12.2025
| VAE (продолжение), Diffusion
+
| Вариационные автоэнкодеры, Диффузионные генеративные модели
| Diffusion
+
| Диффузионные генеративные модели
 
|  
 
|  
 
|-
 
|-
 
| 14
 
| 14
| 11.12.2025
+
| 18.12.2025
 +
| Чтение статей CV/ML
 +
|
 
|  
 
|  
| Чтение статей, организация семинара, выбор аспирантуры
 
| Квантование простой нейросети
 
 
|}
 
|}
  

Текущая версия на 16:41, 19 сентября 2025

Факультетский курс. Параллельно читается в трех местах: МФТИ, ШАД, ВМК МГУ. Занятия проходят онлайн (Zoom) по четвергам с 17:05 до 18:30 (лекция) и с 18:35 до 20:00 (семинар). Первое занятие 11 сентября. Записи занятий будут доступны для просмотра.

Общие сведения

Семестр: 9 (пятый курс)
Форма контроля: экзамен

Краткое описание

Курс посвящен методам и алгоритмам компьютерного зрения, т.е. извлечения информации из изображений и видео. Для большинства задач будем обсуждать современные нейросетевые модели, сверточные и трансформеры. Курс в большей степени является практическим, а не теоретическим. Поэтому все лекции снабжены лабораторными и домашними работами, которые позволяют попробовать на практике большинство из рассматриваемых методов. Работы выполняются на языке Python, с использованием различных библиотек.

Команда курса

Лектор: Влад Шахуро
Семинарист: Андрей Стоцкий (@ruroruro)

Важные ссылки

Чат курса: t.me / +1RcsnP7s8jA1OGNi (удалить пробелы).

Дальнейшие инструкции для регистрации на курс, ссылки на материалы курса и прочая организационная информация будут опубликованы в этом чате, в топике "Анонсы".

Обратите внимание! Актуальная информация по курсу будет в первую очередь появляться в телеграм-чате курса. Чтобы не пропустить важную информацию, не отключайте уведомления в топике "Анонсы".

Критерии оценки за курс

Оценка по курсу получается за выполнение домашних заданий (1-2 штуки в неделю). Всего порядка 12 заданий, в среднем 10 баллов за задание. Задания можно сдавать после дедлайна до конца курса, но тогда оценка будет ограничиваться 60% от базовой.

Итоговая оценка за курс проставляется по 5-бальной шкале: неуд(2), удовл(3), хор(4), отл(5). Если в ведомости требуется оценка по 10-бальной шкале, то итоговая оценка за курс конвертируется неуд → 2/10, удовл → 4/10, хор → 7/10, отл → 10/10.

Критерии оценки.
Приблизительные критерии в процентах от макс. балла (исходя из прошлогодних результатов):
≥ 80% — отлично
≥ 70% — хорошо
≥ 60% — удовлетворительно
Настоящие пороги будут опубликованы ближе к концу курса и могут отличаться от приблизительных.

Перезачет. Если вы уже проходили наш курс в другом месте (или будете проходить его параллельно в этом семестре), то вы можете перезачесть оценку за весь курс или часть заданий. Перезачет делается в индивидуальном порядке (пишите @ruroruro в телеграм). Перезачесть вместо наших заданий "похожие" задания из других курсов НЕЛЬЗЯ.

Пересдача. Если до конца курса вы не набираете баллов на оценку «удовл», то вам нужно будет досдавать/пересдавать задания до тех пор, пока вы не наберете достаточно баллов. Обратите внимание! На пересдаче нельзя получить оценку выше «удовл» (даже если вы наберете достаточно баллов). Кроме того, на пересдаче все ещё применяются штрафы за просроченные дедлайны (60%). В результате, сдать курс "с нуля" на пересдаче, не выполняя задания во время семестра - практически невозможно. Пожалуйста, не откладывайте выполнение заданий на потом.

Плагиат. В нашем курсе не допускается заимствование решений или фрагментов кода из интернета или у других студентов. Перед подведением итогов в конце семестра, все студенческие решения обрабатываются автоматической системой анти-плагиата. В зависимости от результатов ручной проверки срабатываний анти-плагиата и объема/значительности выявленных заимствований, могут быть сняты баллы или даже проставлен штраф (отрицательный балл) за задание с выявленными заимствованиями.

Пожалуйста, не выкладывайте содержание заданий и ваши решения в открытый доступ (Github и т.п.). Подготовка качественных заданий требует много времени и сил, которые таким образом обесцениваются.

План курса

План курса предварительный, в процессе чтения может меняться.

# Дата Лекция Семинар Домашнее задание
1 18.09.2025 Введение в предмет, Цифровое изображение, Свет и цвет Тестовая система, Работа с NumPy Демозаикинг
Прокудин-Горский
2 25.09.2025 Основы обработки изображений Основы обработки изображений
3 02.10.2025 Сжатие изображений, Преобразование Фурье Преобразование Фурье Сжатие изображение
Обратная свертка
4 09.10.2025 Классификация изображений, Введение в нейросети Обучение нейросетей: NumPy, PyTorch Реализация нейросети
5 16.10.2025 Сверточные нейросетевые архитектуры Нейросетевые задания курса, Обучение нейросетей: Базовые приемы Регрессия точек лица
6 23.10.2025 Трансформеры и сверточные нейронные сети с большими ядрами Обучение нейросетей: Продвинутые приемы, Разбор устройства ViT Дообучение классификатора
7 30.10.2025 Поиск похожих изображений Метрическое обучение Классификация редких дорожных знаков
8 06.11.2025 Детекторы объектов Практические аспекты CV/ML в индустрии Простой детектор машин
9 13.11.2025 Сегментация изображений Сегментация изображений Интерактивная сегментация
10 20.11.2025 Основы обработки видео Работа с видео, Оптический поток Трекинг объектов
11 27.11.2025 Обучение без разметки, Фундаментальные модели Обучение без разметки, Метод MoCo Квантование нейросетей
12 04.12.2025 Перенос стиля, Синтез изображений Вариационные автоэнкодеры, Генеративно-состязательные сети Генерация кроссовок
13 11.12.2025 Вариационные автоэнкодеры, Диффузионные генеративные модели Диффузионные генеративные модели
14 18.12.2025 Чтение статей CV/ML

Рекомендуемая литература

  1. W. Burger, M. Burge. Principles of Digital Image Processing. Springer 2009, 2013. Fundamental Techniques, Core Algorithms, Advanced Methods.
  2. M. Nielsen. Neural Networks and Deep Learning.
  3. A. Zhang, Z. Lipton, Mu Li, A. Smola. Dive into Deep Learning. 2020.
  4. I. Goodfellow, Y. Bengio, A. Courville. Deep learning. MIT Press 2016.
  5. R. Szeliski. Computer Vision: Algorithms and Applications. 2020
  6. R. Hartley, A. Zisserman. Multiple View Geometry in Computer Vision. Cambridge University Press, 2004.