Параллельные и распределенные вычисления 2022 осень — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Лекции)
 
(не показано 18 промежуточных версий 3 участников)
Строка 1: Строка 1:
 
= Общие сведения =
 
= Общие сведения =
 
* Семестр: 5 (третий курс)
 
* Семестр: 5 (третий курс)
* Форма контроля: диф. зачет
+
* Форма контроля: Экзамен в форме диф. зачет
* '''[https://docs.google.com/forms/d/1z_NK9sEI8fOe03mBf4eZDOzJxypMz1l23VHACUw9eko/edit?usp=sharing Форма регистрации на курс].
+
* '''[https://docs.google.com/forms/d/e/1FAIpQLScNYtfGstKgX3_OrR3Ysym-7wC9xSdR4ucOLKJky1i2ypYLPA/viewform?usp=sf_link Форма регистрации на курс].
* [https://docs.google.com/spreadsheets/d/1mlCZEKPL5cn9etwAH-O6lyxPwlKUYB2llZl0om7yvxM/edit?usp=sharing План лекций, семинаров, контрольных]
+
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vQo2dBxiF80B19Mys-QGPcb8PdnJhjZekofpjG9Q5kr7NJ3UST_7-DzvhCwaRFCFWQcrZPK5qGgIfkC/pubhtml?gid=0&single=true План лекций, семинаров, контрольных]
* [https://docs.google.com/spreadsheets/d/1e4tzLOdmOlQBlXKQHpZPyEwsF1IU38U5os91tQnEtLY/edit?usp=sharing Таблица с оценками]
+
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRPoSdeLaSX2Tli_RgW91JkGqrsl7kCpvF7734u-l_ovXJFJvvmFdYnYowm1UPv50MLhVYxPlUZxokz/pubhtml?gid=1942469843&single=true Таблица с оценками]
* https://t.me/+lcRdIVyu8DJjZWVi Телеграм-чат курса]
+
* [https://t.me/+lcRdIVyu8DJjZWVi Телеграм-чат курса]
  
 
=== Материалы занятий ===
 
=== Материалы занятий ===
Строка 12: Строка 12:
 
===== Лекции =====
 
===== Лекции =====
 
* [https://disk.yandex.ru/d/yjhnWduu-kuf3A Видео лекций]
 
* [https://disk.yandex.ru/d/yjhnWduu-kuf3A Видео лекций]
* [https://docs.google.com/presentation/d/1wx-ekbEC5zbj8d4Kt75iEHoifBw0GQpg/edit?usp=sharing&ouid=118421469324776401628&rtpof=true&sd=true Слайды презентаций]
+
* [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfjVqTkdPT3ZvWU9FRXVscWY0VzlWazZYOG1lemh5dW96UG1OekRzcjVCVm8?resourcekey=0-_OvBdqyPGV816JLXCtIz1Q&usp=sharing Видео модуля Романа Липовского] (2021 г)
 +
* [https://drive.google.com/drive/folders/1XkAGnViPUf-t7M3zuw1E3z-sMf--87SY?usp=sharing Слайды презентаций]
  
 
===== Семинары =====
 
===== Семинары =====
* [https://drive.google.com/drive/folders/1oitGu8qV-ONZa74pbqYvTKBUG4cSxNRn?usp=sharing Видео семинаров]
+
* [https://disk.yandex.ru/d/nUDdk1k5scK2vQ Видео семинаров]
* [https://gitlab.com/fpmi-atp/pd2021-supplementary Коды и презентации семинаров]
+
* [https://gitlab.com/fpmi-atp/pd2022a-supplementary Коды и презентации семинаров]
  
*[https://gitlab.com/fpmi-atp/pd2021-supplementary/global/-/tree/master/homeworks '''Домашние задания''']
+
*[https://gitlab.com/fpmi-atp/pd2022a-supplementary/global/-/tree/main/homeworks '''Домашние задания''']
 
*[https://docs.google.com/spreadsheets/d/1rxr465J4VtRxXnRtID1aRy0RzhpBltpjJYKximAQMB8/edit#gid=0 Интересные ссылки]
 
*[https://docs.google.com/spreadsheets/d/1rxr465J4VtRxXnRtID1aRy0RzhpBltpjJYKximAQMB8/edit#gid=0 Интересные ссылки]
  
Строка 25: Строка 26:
 
* В случае проблем с кластером MPI, пишите на '''parallel-cluster-atp@googlegroups.com'''.
 
* В случае проблем с кластером MPI, пишите на '''parallel-cluster-atp@googlegroups.com'''.
 
==== Сервер Gitlab ====
 
==== Сервер Gitlab ====
На данный момент сервер находится по адресу https://gitlab2.atp-fivt.org/, на котором наблюдаются проблемы с сертификатом SSL.
+
На данный момент сервер находится по адресу https://gitlab.atp-fivt.org/.
 
 
Если вы наблюдаете проблему <pre> fatal: unable to access 'https://gitlab2.atp-fivt.org/...': server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none </pre>, временно отключите проверку сертификата <pre>git config --global http.sslVerify "false"</pre>.
 
  
 
==== Сервера ====
 
==== Сервера ====
Строка 39: Строка 38:
 
** Ахтямов Павел
 
** Ахтямов Павел
 
** Ивченко Олег
 
** Ивченко Олег
** Липовский Роман
+
** Липовский Роман (?)
** ''1 приглашенный лектор''
 
  
 
* '''Семинаристы'''
 
* '''Семинаристы'''
Строка 50: Строка 48:
  
 
* '''Учебные ассистенты'''
 
* '''Учебные ассистенты'''
** Гриб Александр
 
** Копец Максим
 
** Горбунов Сергей
 
** Павлов Дмитрий
 
  
 
= Критерии получения оценки =
 
= Критерии получения оценки =
Строка 59: Строка 53:
  
 
== Домашние задания ==
 
== Домашние задания ==
Планируется 7 домашних (6 основных и 1 бонусное) заданий. Проверка включает 2 этапа:
+
Планируется 6 домашних заданий. Проверка включает 2 этапа:
# прохождение автоматических тестов (начиная с ДЗ по HDFS).
+
# прохождение автоматических тестов (Для ДЗ начиная с HDFS).
 
# code review при условии выполненного п.1. Исправления по code review можно делать в течение '''1 месяца''' после 1-го комментария.
 
# code review при условии выполненного п.1. Исправления по code review можно делать в течение '''1 месяца''' после 1-го комментария.
  
[https://gitlab.com/fpmi-atp/pd2021-supplementary/global/-/tree/master/homeworks Репозиторий с домашками]
+
{|  class="wikitable"
 +
|-
 +
! Название
 +
! Мягкий дедлайн
 +
! Жёсткий дедлайн
 +
|-
 +
| PD-2022. MPI || 20.10.2022 || 27.10.2022
 +
|-
 +
| PD-2022. CUDA || 02.11.2022 || 09.11.2022
 +
|-
 +
| PD-2022. HDFS || 19.11.2022 (продлён до 19.12.2022) || 26.11.2022 (продлён до 26.12.2022)
 +
|-
 +
| PD-2022. Map-Reduce || 02.12.2022 (продлён до 19.12.2022) || 09.12.2022 (продлён до 26.12.2022)
 +
|-
 +
| PD-2022. Hive || 11.12.2022 (продлён до 26.12.2022)|| 18.12.2022 (продлён до 01.01.2023, дай бог дожить)
 +
|-
 +
| PD-2022. Spark || 30.12.2022 || 10.01.2023
 +
|}
 +
 
 +
[https://gitlab.com/fpmi-atp/pd2022a-supplementary/global/-/tree/main/homeworks Репозиторий с домашками]
  
 
* Штраф за опоздание по soft deadline: -50%
 
* Штраф за опоздание по soft deadline: -50%
 
* Штраф за опоздание по hard deadline: -75%
 
* Штраф за опоздание по hard deadline: -75%
 
Сдавать и исправлять домашки можно до '''16.01.2023, 23:59'''.
 
  
 
== Мини-контрольные ==
 
== Мини-контрольные ==
Строка 79: Строка 90:
 
! Длительность
 
! Длительность
 
|-
 
|-
| PD-2021. HDFS & MapReduce || ? || 15 мин.
+
| PD-2022. HDFS & MapReduce || ? || 15 мин.
 
|-
 
|-
| PD-2021. Hive & Spark || ? || 15 мин.
+
| PD-2022. Hive & Spark || ? || 15 мин.
 
|-
 
|-
| PD-2021. Kafka, Zookeeper || ? || 15 мин.
+
| PD-2022. Kafka, Zookeeper || ? || 15 мин.
 
|}
 
|}
  
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить [https://docs.google.com/forms/d/1djg04Vv0FWNVM2YIRDPzpNOnvSwiSFtdH1Iu-g1ue84/edit '''форму на дописывание''']. Дописывание состоится в январе 2023:
+
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить [https://docs.google.com/forms/d/17zHStcrQQ5z3byn4kKj3gyI8nFXhUzbNbspoyBCKQF8/edit?usp=sharing '''форму на дописывание''']. Дописывание состоится в январе 2023:
* PD-2020. Дописывание. HDFS & MAPREDUCE
+
* PD-2022. Дописывание. HDFS & MAPREDUCE
* PD-2020. Дописывание. Hive & Spark
+
* PD-2022. Дописывание. Hive & Spark
* PD-2020. Дописывание. Zookeeper, Kafka, Cassandra
+
* PD-2022. Дописывание. Zookeeper, Kafka, Cassandra
  
Каждое дописывание длится ? минут.
+
Каждое дописывание длится 15 минут.
  
 
= Литература =
 
= Литература =

Текущая версия на 23:25, 6 декабря 2022

Общие сведения

Материалы занятий

Доступ открыт для всех аккаунтов @phystech.edu.

Лекции
Семинары

Технические ссылки

Сервер Gitlab

На данный момент сервер находится по адресу https://gitlab.atp-fivt.org/.

Сервера

  • MPI & OpenMP:
    ssh <user>@calc.cod.phystech.edu
  • CUDA:
    ssh <user>@lorien.atp-fivt.org
  • Hadoop ecosystem:
    ssh <user>@mipt-client.atp-fivt.org

Преподаватели

  • Лекторы
    • Долуденко Алексей
    • Ахтямов Павел
    • Ивченко Олег
    • Липовский Роман (?)
  • Семинаристы
    • Ахтямов Павел Ибрагимович
    • Бабин Олег Борисович
    • Павлов Дмитрий Владимирович
    • Чернецкий Аркадий


  • Учебные ассистенты

Критерии получения оценки

Формально по курсу экзамен. Он выставляется на основании баллов, полученных в течение семестра.

Домашние задания

Планируется 6 домашних заданий. Проверка включает 2 этапа:

  1. прохождение автоматических тестов (Для ДЗ начиная с HDFS).
  2. code review при условии выполненного п.1. Исправления по code review можно делать в течение 1 месяца после 1-го комментария.
Название Мягкий дедлайн Жёсткий дедлайн
PD-2022. MPI 20.10.2022 27.10.2022
PD-2022. CUDA 02.11.2022 09.11.2022
PD-2022. HDFS 19.11.2022 (продлён до 19.12.2022) 26.11.2022 (продлён до 26.12.2022)
PD-2022. Map-Reduce 02.12.2022 (продлён до 19.12.2022) 09.12.2022 (продлён до 26.12.2022)
PD-2022. Hive 11.12.2022 (продлён до 26.12.2022) 18.12.2022 (продлён до 01.01.2023, дай бог дожить)
PD-2022. Spark 30.12.2022 10.01.2023

Репозиторий с домашками

  • Штраф за опоздание по soft deadline: -50%
  • Штраф за опоздание по hard deadline: -75%

Мини-контрольные

Состоятся 3 теста. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.

Название Дата Длительность
PD-2022. HDFS & MapReduce  ? 15 мин.
PD-2022. Hive & Spark  ? 15 мин.
PD-2022. Kafka, Zookeeper  ? 15 мин.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится в январе 2023:

  • PD-2022. Дописывание. HDFS & MAPREDUCE
  • PD-2022. Дописывание. Hive & Spark
  • PD-2022. Дописывание. Zookeeper, Kafka, Cassandra

Каждое дописывание длится 15 минут.

Литература

MPI & OpenMP

  1. Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.

CUDA

  1. Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
  2. Курс "GPU programming" в Caltech.
  3. Лекция по Scan курсе по комп. графике, Ben-Gurion university
  4. Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia
  5. Книги от Nvidia: GPU gems, GPU gems 2, GPU gems 3. Особенно интересна глава 39 из GPU Gems про Scan.

HDFS

  1. T. White. "Hadoop. The definitive guide", гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
  2. Статья про архитектуру HDFS от Константина Швачко (Yahoo!)
  3. Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))
  4. Что в действительности делает SNN
  5. Выдержка из курсов Яндекс про HDFS