Параллельные и распределенные вычисления 2022s — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Общие сведения)
(Общие сведения)
 
(не показана 1 промежуточная версия этого же участника)
Строка 11: Строка 11:
  
 
===== Лекции =====
 
===== Лекции =====
* [https://drive.google.com/drive/folders/11U_3grzJTdIH30GWLMW33MpxYc8JB13b?usp=sharing Видео лекций].  
+
* [https://drive.google.com/drive/folders/0B2n4K2J_6IZdflFRaUJveTdvR2REdDVxTkp1cm1VRnRNWmdsSGcxWlI4Y1kyVTJmZWtBWE0?resourcekey=0-sk8F-iNm8_2O8g7SDG24IA&usp=sharing Видео лекций].  
 
* [https://drive.google.com/drive/folders/1HCJLJBEH1eZgDOu104-OIF4cXPC--hgF?usp=sharing Слайды презентаций]
 
* [https://drive.google.com/drive/folders/1HCJLJBEH1eZgDOu104-OIF4cXPC--hgF?usp=sharing Слайды презентаций]
  
Строка 74: Строка 74:
 
! Длительность
 
! Длительность
 
|-
 
|-
| PD-2022s. HDFS & MapReduce || 13.04 || 15 мин.
+
| PD-2022s. HDFS & MapReduce || 20.04 || 15 мин.
 
|-
 
|-
 
| PD-2022s. Hive & Spark || 11.05 || 20 мин.
 
| PD-2022s. Hive & Spark || 11.05 || 20 мин.

Текущая версия на 12:08, 19 октября 2022

Общие сведения

Материалы занятий

Доступ открыт для всех аккаунтов @phystech.edu.

Лекции
Семинары

Технические ссылки

Сервер Gitlab

На данный момент сервер находится по адресу https://gitlab2.atp-fivt.org/, на котором наблюдаются проблемы с сертификатом SSL.

Если вы наблюдаете проблему
 fatal: unable to access 'https://gitlab2.atp-fivt.org/...': server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none 
, временно отключите проверку сертификата
git config --global http.sslVerify "false"
.

Сервера

  • MPI & OpenMP:
    ssh <user>@calc.cod.phystech.edu
  • CUDA:
    ssh <user>@lorien.atp-fivt.org
  • Hadoop ecosystem:
    ssh <user>@mipt-client.atp-fivt.org

Преподаватели

  • Лекторы
    • Долуденко Алексей
    • Ахтямов Павел
    • Ивченко Олег
    • Липовский Роман
  • Семинаристы
    • Иванова Юлия Александровна
    • Госткин Евгений
    • Чернецкий Аркадий
  • Учебные ассистенты
    • Копец Максим
    • Павлов Дмитрий

Критерии получения оценки

Зачет выставляется на основании баллов, полученных в течение семестра.

Домашние задания

Планируется 6 домашних заданий. Проверка включает 2 этапа:

  1. прохождение автоматических тестов (начиная с ДЗ по CUDA).
  2. code review при условии выполненного п.1. Исправления по code review можно делать в течение 1 месяца после 1-го комментария.

Репозиторий с домашками

  • Штраф за опоздание по soft deadline: -50%
  • Штраф за опоздание по hard deadline: -75%

Сдавать и исправлять домашки можно до начала сессии.

Мини-контрольные

Состоятся 3 теста. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.

Название Дата Длительность
PD-2022s. HDFS & MapReduce 20.04 15 мин.
PD-2022s. Hive & Spark 11.05 20 мин.
PD-2022s. Zookeeper, Kafka, Cassandra 25.05 15 мин.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание.

  • PD-2022s. Дописывание. HDFS & MAPREDUCE
  • PD-2022s. Дописывание. Hive & Spark

Литература

MPI & OpenMP

  1. Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.

CUDA

  1. Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
  2. Курс "GPU programming" в Caltech.
  3. Лекция по Scan курсе по комп. графике, Ben-Gurion university
  4. Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia
  5. Книги от Nvidia: GPU gems, GPU gems 2, GPU gems 3. Особенно интересна глава 39 из GPU Gems про Scan.

HDFS

  1. T. White. "Hadoop. The definitive guide", гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
  2. Статья про архитектуру HDFS от Константина Швачко (Yahoo!)
  3. Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))
  4. Что в действительности делает SNN
  5. Выдержка из курсов Яндекс про HDFS