Параллельные и распределенные вычисления 2021
Содержание
Общие сведения
- Семестр: 5 (третий курс)
- Форма контроля: диф. зачет
- Форма регистрации на курс.
- План лекций, семинаров, контрольных
- Таблица с оценками
- Телеграм-чат курса
Материалы занятий
Доступ открыт для всех аккаунтов @phystech.edu.
Лекции
Семинары
Технические ссылки
- Форма для проблем с инфраструктурой АТП
- В случае проблем с кластером MPI, пишите на parallel-cluster-atp@googlegroups.com.
Сервер Gitlab
На данный момент сервер находится по адресу https://gitlab2.atp-fivt.org/, на котором наблюдаются проблемы с сертификатом SSL.
Если вы наблюдаете проблемуfatal: unable to access 'https://gitlab2.atp-fivt.org/...': server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none, временно отключите проверку сертификата
git config --global http.sslVerify "false".
Сервера
- MPI & OpenMP:
ssh <user>@calc.cod.phystech.edu
- CUDA:
ssh <user>@lorien.atp-fivt.org
- Hadoop ecosystem:
ssh <user>@mipt-client.atp-fivt.org
Преподаватели
- Лекторы
- Долуденко Алексей
- Ахтямов Павел
- Ивченко Олег
- Липовский Роман
- 1 приглашенный лектор
- Семинаристы
- Ахтямов Павел Ибрагимович
- Бабин Олег Борисович
- Вручтель Серафима Вильямовна
- Иванова Юлия Александровна
- Ивченко Олег Николаевич
- Цион Михаил
- Чернецкий Аркадий
- Учебные ассистенты
- Гриб Александр
- Копец Максим
- Горбунов Сергей
- Павлов Дмитрий
Критерии получения оценки
Формально по курсу экзамен. Он выставляется на основании баллов, полученных в течение семестра.
Домашние задания
Планируется 7 домашних (6 основных и 1 бонусное) заданий. Проверка включает 2 этапа:
- прохождение автоматических тестов (начиная с ДЗ по HDFS).
- code review при условии выполненного п.1. Исправления по code review можно делать в течение 1 месяца после 1-го комментария.
- Штраф за опоздание по soft deadline: -50%
- Штраф за опоздание по hard deadline: -75%
Мини-контрольные
Состоятся 3 теста. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
Название | Дата | Длительность |
---|---|---|
PD-2021. HDFS & MapReduce | 1.12 | 15 мин. |
PD-2021. Hive & Spark | 8.12 | 15 мин. |
PD-2021. Kafka, Zookeeper | 15.12 | 15 мин. |
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится в январе 2022:
- PD-2020. Дописывание. HDFS & MAPREDUCE
- PD-2020. Дописывание. Hive & Spark
- PD-2020. Дописывание. Zookeeper, Kafka, Cassandra
Каждое дописывание длится 15 минут.
Литература
MPI & OpenMP
- Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.
CUDA
- Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
- Курс "GPU programming" в Caltech.
- Лекция по Scan курсе по комп. графике, Ben-Gurion university
- Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia
- Книги от Nvidia: GPU gems, GPU gems 2, GPU gems 3. Особенно интересна глава 39 из GPU Gems про Scan.
HDFS
- T. White. "Hadoop. The definitive guide", гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
- Статья про архитектуру HDFS от Константина Швачко (Yahoo!)
- Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))
- Что в действительности делает SNN
- Выдержка из курсов Яндекс про HDFS