CV 2023 — различия между версиями
Vshakhuro (обсуждение | вклад) (→Предварительный план курса (может поменяться в процессe)) |
Vshakhuro (обсуждение | вклад) |
||
Строка 33: | Строка 33: | ||
= Предварительный план курса (может поменяться в процессe) = | = Предварительный план курса (может поменяться в процессe) = | ||
− | + | |} | |
+ | |||
{| class="wikitable" | {| class="wikitable" | ||
|- | |- | ||
Строка 133: | Строка 134: | ||
|} | |} | ||
+ | {| width="900px" style="text-align:justify;" | ||
+ | | | ||
== Рекомендуемая литература == | == Рекомендуемая литература == | ||
# W. Burger, M. Burge. Principles of Digital Image Processing. Springer 2009, 2013. [https://link.springer.com/content/pdf/10.1007%2F978-1-84800-191-6.pdf Fundamental Techniques], [https://link.springer.com/content/pdf/10.1007%2F978-1-84800-195-4.pdf Core Algorithms], [https://link.springer.com/content/pdf/10.1007%2F978-1-84882-919-0.pdf Advanced Methods]. | # W. Burger, M. Burge. Principles of Digital Image Processing. Springer 2009, 2013. [https://link.springer.com/content/pdf/10.1007%2F978-1-84800-191-6.pdf Fundamental Techniques], [https://link.springer.com/content/pdf/10.1007%2F978-1-84800-195-4.pdf Core Algorithms], [https://link.springer.com/content/pdf/10.1007%2F978-1-84882-919-0.pdf Advanced Methods]. | ||
Строка 140: | Строка 143: | ||
# R. Szeliski. [http://szeliski.org/Book/2ndEdition.htm Computer Vision: Algorithms and Applications]. 2020 | # R. Szeliski. [http://szeliski.org/Book/2ndEdition.htm Computer Vision: Algorithms and Applications]. 2020 | ||
# R. Hartley, A. Zisserman. [http://cvrs.whu.edu.cn/downloads/ebooks/Multiple%20View%20Geometry%20in%20Computer%20Vision%20(Second%20Edition).pdf Multiple View Geometry in Computer Vision]. Cambridge University Press, 2004. | # R. Hartley, A. Zisserman. [http://cvrs.whu.edu.cn/downloads/ebooks/Multiple%20View%20Geometry%20in%20Computer%20Vision%20(Second%20Edition).pdf Multiple View Geometry in Computer Vision]. Cambridge University Press, 2004. | ||
− | |||
|} | |} |
Версия 10:08, 25 августа 2023
Факультетский курс. Параллельно читается в трех местах: МФТИ, ШАД, ВМК МГУ. Занятия проходят онлайн (Zoom) по средам с 18:00 до 19:20 (лекция) и с 19:30 до 20:50 (семинар). Записи занятий будут доступны для просмотра. СодержаниеОбщие сведенияСеместр: 9 (пятый курс) Краткое описаниеКурс посвящен методам и алгоритмам компьютерного зрения, т.е. извлечения информации из изображений и видео. Для большинства задач будем обсуждать современные нейросетевые модели, сверточные и трансформеры. Курс в большей степени является практическим, а не теоретическим. Поэтому все лекции снабжены лабораторными и домашними работами, которые позволяют попробовать на практике большинство из рассматриваемых методов. Работы выполняются на языке Python, с использованием различных библиотек. Команда курса
Важные ссылки
Критерии получения оценкиОценка по курсу получается за выполнение следующих заданий:
Критерии оценки TODO Предварительный план курса (может поменяться в процессe) |
# | Дата | Лекция | Семинар | Домашнее задание |
---|---|---|---|---|
1 | 13.09.2023 | Цифровое изображение и тональная коррекция | Работа с изображениями в python | Демозаикинг Прокудин-Горский |
2 | 20.09.2023 | Основы обработки изображений | Базовая обработка изображений | |
3 | 27.09.2023 | Продвинутая обработка изображений. PNG, JPEG, преобразование Фурье, Лапласовская пирамида. Сэмплирование |
Преобразование Фурье Геометрические преобразования изображений |
Сжатие изображение (PCA, JPEG) Обратная свертка |
4 | 04.10.2023 | Введение в свёрточные нейросети и трансформеры. Классификация изображений | Обратное распространение ошибки Numpy, pytorch, lightning |
Реализация нейросети на numpy |
5 | 11.10.2023 | Обратное распространение ошибки: базовые принципы и основные слои | Lightning. Обучение простого классификатора | Регрессия точек лица |
6 | 18.10.2023 | Бэкбоны для классификации (CNN и трансформеры) | Дообучение нейросети | Дообучение нейросети |
7 | 25.10.2023 | Поиск по изображениям, metric learning | Metric learning | Классификация редких дорожных знаков |
8 | 01.11.2023 | Детекторы объектов | Детектирование объектов | Простой нейросетевой детектор |
9 | 08.11.2023 | Сегментация изображений | Простая нейросеть для сегментации | Сегментация изображений |
10 | 15.11.2023 | Основы обработки видео | Работа с видео | Трекинг объектов |
11 | 22.11.2023 | Self-supervised learning, foundation models | Self-supervised learning | |
12 | 29.11.2023 | Перенос стиля, superresolution, GAN, VAE (начало) | AE, VAE, GAN | GAN |
13 | 06.12.2023 | VAE (продолжение), Diffusion | Diffusion | |
14 | 13.12.2023 | Research pipeline: чтение статей, проведение экспериментов, написание статьи Нейросети в проде: mixed precision, дистилляция, архитектуры, pruning, quantization, ONNX |
Разметка данных, управление экспериментами | Квантование простой нейросети |
15 | 20.12.2023 | Итоговая контрольная | Гостевая лекция / обзор свежих интересных работ |
Рекомендуемая литература
|