Параллельные и распределенные вычисления 2024s — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Преподаватели)
(не показаны 3 промежуточные версии 2 участников)
Строка 6: Строка 6:
 
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vTqe7Q05mo8L3n3scSkgHHK3kV5caPrJ_rSORf-zsTzH2gNLjwrbKJo_8VexJb_2Tad7nMZoynE3D6J/pubhtml?gid=803165062&single=true Таблица с оценками]
 
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vTqe7Q05mo8L3n3scSkgHHK3kV5caPrJ_rSORf-zsTzH2gNLjwrbKJo_8VexJb_2Tad7nMZoynE3D6J/pubhtml?gid=803165062&single=true Таблица с оценками]
 
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vTqe7Q05mo8L3n3scSkgHHK3kV5caPrJ_rSORf-zsTzH2gNLjwrbKJo_8VexJb_2Tad7nMZoynE3D6J/pubhtml?gid=2017840457&single=true Статус проверки домашних заданий]
 
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vTqe7Q05mo8L3n3scSkgHHK3kV5caPrJ_rSORf-zsTzH2gNLjwrbKJo_8VexJb_2Tad7nMZoynE3D6J/pubhtml?gid=2017840457&single=true Статус проверки домашних заданий]
* [https://forms.gle/TqQcUntpu3gxjLXx9 Продление дедлайнов]
+
* [https://forms.gle/RF6DB7hXZ5uqo4gF9 Продление дедлайнов и дописывание КР]
 
* [https://t.me/+aGl2qhrfDDU5Y2My Телеграм-чат курса]
 
* [https://t.me/+aGl2qhrfDDU5Y2My Телеграм-чат курса]
  
Строка 82: Строка 82:
 
| PD-2022. HDFS || 15.04.2024 || 22.04.2024
 
| PD-2022. HDFS || 15.04.2024 || 22.04.2024
 
|-
 
|-
| PD-2022. Map-Reduce || 29.04.2024 || 06.05.2024
+
| PD-2022. Map-Reduce || 30.04.2024 || 07.05.2024
 
|-
 
|-
| PD-2022. Hive || 06.05.2024 || 13.05.2024
+
| PD-2022. Hive || 07.05.2024 || 14.05.2024
 
|-
 
|-
| PD-2022. Spark || 27.05.2024 || 03.06.2024
+
| PD-2022. Spark || 28.05.2024 || 03.06.2024
 
|}
 
|}
  
Строка 97: Строка 97:
  
 
== Мини-контрольные ==
 
== Мини-контрольные ==
Состоятся 3 теста. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
+
Состоятся 3 теста. На контрольных нельзя пользоваться ничем и никем, кроме разрешённых смотрящими вещей. Код писать не потребуется.
  
 
{|  class="wikitable"
 
{|  class="wikitable"
Строка 112: Строка 112:
 
|}
 
|}
  
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить [https://forms.gle/TqQcUntpu3gxjLXx9 '''форму на дописывание'''].  
+
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить [https://forms.gle/RF6DB7hXZ5uqo4gF9 '''форму на дописывание'''].  
 
* PD-2024s. Дописывание. HDFS & MAPREDUCE
 
* PD-2024s. Дописывание. HDFS & MAPREDUCE
 
* PD-2024s. Дописывание. Hive & Spark
 
* PD-2024s. Дописывание. Hive & Spark

Версия 11:36, 22 апреля 2024

Общие сведения

Материалы занятий

Доступ открыт для всех аккаунтов @phystech.edu.

Лекции
Семинары

Технические ссылки

Сервера

  • MPI & OpenMP:
    ssh <user>@calc.cod.phystech.edu
  • CUDA:
    ssh <user>@lorien.atp-fivt.org
  • Hadoop ecosystem:
    ssh <user>@mipt-client.atp-fivt.org

Преподаватели

  • Лекторы
    • Ивченко Олег
    • Долуденко Алексей
    • Ахтямов Павел
    • Липовский Роман
  • Семинаристы
    • Ахтямов Павел
    • Чернецкий Аркадий
    • Изабелла Затикян
  • Учебные ассистенты

Критерии получения оценки

Зачет выставляется на основании баллов, полученных в течение семестра.

Домашние задания

Планируется 6 домашних заданий. Проверка включает 2 этапа:

  1. прохождение автоматических тестов (начиная с ДЗ по CUDA).
  2. code review при условии выполненного п.1. Исправления по code review можно делать в течение 1 месяца после 1-го комментария.
Название Мягкий дедлайн Жёсткий дедлайн
PD-2022. MPI 04.03.2024 11.03.2024
PD-2022. CUDA 25.03.2024 01.04.2024
PD-2022. HDFS 15.04.2024 22.04.2024
PD-2022. Map-Reduce 30.04.2024 07.05.2024
PD-2022. Hive 07.05.2024 14.05.2024
PD-2022. Spark 28.05.2024 03.06.2024

Репозиторий с домашками

  • Штраф за опоздание по soft deadline: -50%
  • Штраф за опоздание по hard deadline: -75%

Сдавать и исправлять домашки можно до .

Мини-контрольные

Состоятся 3 теста. На контрольных нельзя пользоваться ничем и никем, кроме разрешённых смотрящими вещей. Код писать не потребуется.

Название Дата Длительность
PD-2024s. HDFS & MapReduce 15.04.24 15 мин.
PD-2024s. Hive & Spark 27.05.24 20 мин.
PD-2024s. Zookeeper, Kafka, Cassandra 03.06.24 15 мин.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание.

  • PD-2024s. Дописывание. HDFS & MAPREDUCE
  • PD-2024s. Дописывание. Hive & Spark

Литература

MPI & OpenMP

  1. Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.

CUDA

  1. Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
  2. Курс "GPU programming" в Caltech.
  3. Лекция по Scan курсе по комп. графике, Ben-Gurion university
  4. Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia
  5. Книги от Nvidia: GPU gems, GPU gems 2, GPU gems 3. Особенно интересна глава 39 из GPU Gems про Scan.

HDFS

  1. T. White. "Hadoop. The definitive guide", гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
  2. Статья про архитектуру HDFS от Константина Швачко (Yahoo!)
  3. Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))
  4. Что в действительности делает SNN
  5. Выдержка из курсов Яндекс про HDFS