Параллельные и распределенные вычисления 2023s — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Лекции)
 
(не показано 27 промежуточных версий 4 участников)
Строка 2: Строка 2:
 
* Семестр: 6 (третий курс)
 
* Семестр: 6 (третий курс)
 
* Форма контроля: диф. зачет
 
* Форма контроля: диф. зачет
* '''[ Форма регистрации на курс].
+
* '''[https://forms.gle/ZvHCCKLpML14ue1TA Форма регистрации на курс].
* [https://docs.google.com/spreadsheets/d/1qaaB9S6nbZ-773MWlGjxo7D2cKOrFnelopH0BQeTRCo/edit?usp=sharing План лекций, семинаров, контрольных]
+
* [https://docs.google.com/spreadsheets/d/1qaaB9S6nbZ-773MWlGjxo7D2cKOrFnelopH0BQeTRCo/edit?usp=sharing План лекций, семинаров,домашних работ, контрольных]
* [https://docs.google.com/spreadsheets/d/1qEcaMjCSkp1GsQQONe_GBlU3gD-4l1KoBa3HS7smY0s/edit?usp=share_link Таблица с оценками]
+
* [https://docs.google.com/spreadsheets/d/1qaaB9S6nbZ-773MWlGjxo7D2cKOrFnelopH0BQeTRCo/edit#gid=77548513 Расписание семинаров]
 +
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vQBur7fe5AKiirDdjp6mMzWyPo5RUD5-Wjwhz7lIOFryA4x_rkC7OfTa8-GQ-j3VdanmKZC0wfCBklq/pubhtml?gid=1942469843&single=true Таблица с оценками]
 +
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vQBur7fe5AKiirDdjp6mMzWyPo5RUD5-Wjwhz7lIOFryA4x_rkC7OfTa8-GQ-j3VdanmKZC0wfCBklq/pubhtml?gid=2011248437&single=true Статус проверки домашних заданий]
 
* [https://t.me/+5QH5IIWrErJhZmRi Телеграм-чат курса]
 
* [https://t.me/+5QH5IIWrErJhZmRi Телеграм-чат курса]
  
Строка 11: Строка 13:
  
 
===== Лекции =====
 
===== Лекции =====
* [ Видео лекций].  
+
* [https://drive.google.com/drive/folders/1arIrxYGJ144cHpZ72uGI5mBsFWolczfF?usp=share_link Видео лекций].
 +
** [https://youtube.com/playlist?list=PLfibPMPn-PgyfrdrfmxvEAXtcjw7yfZmL Скринкасты лекций по CUDA]
 
* [https://drive.google.com/drive/folders/1eH2pePnbu3KqiRYtcBpDFffZXMXGA6-H?usp=share_link Слайды презентаций]
 
* [https://drive.google.com/drive/folders/1eH2pePnbu3KqiRYtcBpDFffZXMXGA6-H?usp=share_link Слайды презентаций]
 +
* 2020 г.
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfk1jdUQ4YnZtRWNCbl9YVHlvSHZjRERrOVlNVlU5dDZYWU0tN2dCRjgxVzA?resourcekey=0-cn9bfvH8nBixE3aiWvTfgA&usp=sharing Лекции]
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfm54OF8zMmd6aVQ0U0Y0MjFsdWdudFkxODJRVWFUcUt6bmdHUkNsYmMxRHM?resourcekey=0-wyYPEDg_OIF6mj1-4o8bLw&usp=sharing Семинары]
 +
* 2021 г.
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfnNPS3JFdEdpTHM5aVFZR3dmdnlrdFNKcjlfa0dLY0lFb2l3cmtsM2VXT2s?resourcekey=0-rE3AAeTCn3pf0dgfGS86Qg&usp=sharing Лекции]
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfjBkRmhxc2o3d3NEdzN0RUhFeGtNSmJ6RFl3bzhOSEgzX0ViV2tXNFljbHc?resourcekey=0-t0UekU9AD2iQO6vKFmLUcg&usp=sharing Семинары]
 +
* 2022 г. весна
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdflFRaUJveTdvR2REdDVxTkp1cm1VRnRNWmdsSGcxWlI4Y1kyVTJmZWtBWE0?resourcekey=0-sk8F-iNm8_2O8g7SDG24IA&usp=sharing Лекции]
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfllmTmtMbk44V0ZkT2xtc0dXbWoweGlDQmRSTE5lT0o5dk1yd3FaOTFZOEE?resourcekey=0-P5pBLFMpgXuVvFn8dB4nXA&usp=sharing Семинары]
  
 
===== Семинары =====
 
===== Семинары =====
* [ Видео семинаров]
+
* [https://disk.yandex.ru/d/MP6j3LdmHlUhOQ Видео семинаров]
* [ Коды и презентации семинаров]
+
* [https://gitlab.com/fpmi-atp/pd2022a-supplementary Коды и презентации семинаров]
  
*[ '''Домашние задания''']
+
*[https://gitlab.com/fpmi-atp/pd2022a-supplementary/global/-/tree/main/homeworks '''Домашние задания''']
 
*[https://docs.google.com/spreadsheets/d/1rxr465J4VtRxXnRtID1aRy0RzhpBltpjJYKximAQMB8/edit#gid=0 Интересные ссылки]
 
*[https://docs.google.com/spreadsheets/d/1rxr465J4VtRxXnRtID1aRy0RzhpBltpjJYKximAQMB8/edit#gid=0 Интересные ссылки]
  
 
== Технические ссылки ==
 
== Технические ссылки ==
* [https://forms.gle/PWhsFdPR9iVrsXbs9 Форма для проблем с инфраструктурой АТП]
+
* [https://docs.google.com/forms/d/e/1FAIpQLSd_JxfMFOcWdaXKLC8sydJlDtwRG-B6Puiia_h3GqORXEDUKA/viewform?usp=sf_link Форма для проблем с инфраструктурой АТП]
 
* В случае проблем с кластером MPI, пишите на '''parallel-cluster-atp@googlegroups.com'''.
 
* В случае проблем с кластером MPI, пишите на '''parallel-cluster-atp@googlegroups.com'''.
==== Сервер Gitlab ====
 
На данный момент сервер находится по адресу https://gitlab.atp-fivt.org/, на котором наблюдаются проблемы с сертификатом SSL.
 
 
Если вы наблюдаете проблему <pre> fatal: unable to access 'https://gitlab.atp-fivt.org/...': server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none </pre>, временно отключите проверку сертификата <pre>git config --global http.sslVerify "false"</pre>.
 
  
 
==== Сервера ====
 
==== Сервера ====
Строка 37: Строка 45:
 
* '''Лекторы'''
 
* '''Лекторы'''
 
** Ивченко Олег
 
** Ивченко Олег
 +
** Долуденко Алексей
 +
** Ахтямов Павел
 +
** Липовский Роман
  
 
* '''Семинаристы'''
 
* '''Семинаристы'''
 +
** Пономаренко Роман
 +
** Фирсов Андрей
 +
** Ахтямов Павел
 +
** Чернецкий Аркадий
 +
** Ирина Кочурова
  
 
* '''Учебные ассистенты'''
 
* '''Учебные ассистенты'''
 
+
** Манаков Данила
 +
** Тугунчинов Максим
 +
** Копец Максим
 +
** Эвелина Емельянова
 +
** Дмитрий Николотов
  
 
= Критерии получения оценки =
 
= Критерии получения оценки =
Строка 51: Строка 71:
 
# code review при условии выполненного п.1. Исправления по code review можно делать в течение '''1 месяца''' после 1-го комментария.
 
# code review при условии выполненного п.1. Исправления по code review можно делать в течение '''1 месяца''' после 1-го комментария.
  
[ Репозиторий с домашками]
+
{|  class="wikitable"
 +
|-
 +
! Название
 +
! Мягкий дедлайн
 +
! Жёсткий дедлайн
 +
|-
 +
| PD-2022. MPI || 13.03.2023 || 20.03.2023
 +
|-
 +
| PD-2022. CUDA || 27.03.2023 || 03.04.2023
 +
|-
 +
| PD-2022. HDFS || 17.04.2023 || 24.04.2023
 +
|-
 +
| PD-2022. Map-Reduce || 01.05.2023 || 08.05.2023
 +
|-
 +
| PD-2022. Hive || 08.05.2023 || 16.05.2023
 +
|-
 +
| PD-2022. Spark || 16.05.2023 || 23.05.2023
 +
|}
 +
 
 +
[https://gitlab.com/fpmi-atp/pd2022a-supplementary/global/-/tree/main/homeworks Репозиторий с домашками]
  
 
* Штраф за опоздание по soft deadline: -50%
 
* Штраф за опоздание по soft deadline: -50%
 
* Штраф за опоздание по hard deadline: -75%
 
* Штраф за опоздание по hard deadline: -75%
  
Сдавать и исправлять домашки можно до начала сессии.
+
Сдавать и исправлять домашки можно 11.06, 23:59.
  
 
== Мини-контрольные ==
 
== Мини-контрольные ==
Строка 67: Строка 106:
 
! Длительность
 
! Длительность
 
|-
 
|-
| PD-2023s. HDFS & MapReduce || || 15 мин.
+
| PD-2023s. HDFS & MapReduce || 24.04.23 || 15 мин.
 
|-
 
|-
 
| PD-2023s. Hive & Spark ||  || 20 мин.
 
| PD-2023s. Hive & Spark ||  || 20 мин.

Текущая версия на 16:49, 9 июня 2023

Общие сведения

Материалы занятий

Доступ открыт для всех аккаунтов @phystech.edu.

Лекции
Семинары

Технические ссылки

Сервера

  • MPI & OpenMP:
    ssh <user>@calc.cod.phystech.edu
  • CUDA:
    ssh <user>@lorien.atp-fivt.org
  • Hadoop ecosystem:
    ssh <user>@mipt-client.atp-fivt.org

Преподаватели

  • Лекторы
    • Ивченко Олег
    • Долуденко Алексей
    • Ахтямов Павел
    • Липовский Роман
  • Семинаристы
    • Пономаренко Роман
    • Фирсов Андрей
    • Ахтямов Павел
    • Чернецкий Аркадий
    • Ирина Кочурова
  • Учебные ассистенты
    • Манаков Данила
    • Тугунчинов Максим
    • Копец Максим
    • Эвелина Емельянова
    • Дмитрий Николотов

Критерии получения оценки

Зачет выставляется на основании баллов, полученных в течение семестра.

Домашние задания

Планируется 6 домашних заданий. Проверка включает 2 этапа:

  1. прохождение автоматических тестов (начиная с ДЗ по CUDA).
  2. code review при условии выполненного п.1. Исправления по code review можно делать в течение 1 месяца после 1-го комментария.
Название Мягкий дедлайн Жёсткий дедлайн
PD-2022. MPI 13.03.2023 20.03.2023
PD-2022. CUDA 27.03.2023 03.04.2023
PD-2022. HDFS 17.04.2023 24.04.2023
PD-2022. Map-Reduce 01.05.2023 08.05.2023
PD-2022. Hive 08.05.2023 16.05.2023
PD-2022. Spark 16.05.2023 23.05.2023

Репозиторий с домашками

  • Штраф за опоздание по soft deadline: -50%
  • Штраф за опоздание по hard deadline: -75%

Сдавать и исправлять домашки можно 11.06, 23:59.

Мини-контрольные

Состоятся 3 теста. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.

Название Дата Длительность
PD-2023s. HDFS & MapReduce 24.04.23 15 мин.
PD-2023s. Hive & Spark 20 мин.
PD-2023s. Zookeeper, Kafka, Cassandra 15 мин.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание.

  • PD-2023s. Дописывание. HDFS & MAPREDUCE
  • PD-2023s. Дописывание. Hive & Spark

Литература

MPI & OpenMP

  1. Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.

CUDA

  1. Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
  2. Курс "GPU programming" в Caltech.
  3. Лекция по Scan курсе по комп. графике, Ben-Gurion university
  4. Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia
  5. Книги от Nvidia: GPU gems, GPU gems 2, GPU gems 3. Особенно интересна глава 39 из GPU Gems про Scan.

HDFS

  1. T. White. "Hadoop. The definitive guide", гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
  2. Статья про архитектуру HDFS от Константина Швачко (Yahoo!)
  3. Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))
  4. Что в действительности делает SNN
  5. Выдержка из курсов Яндекс про HDFS