Параллельные и распределенные вычисления 2020 — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Материалы занятий)
(Мини-контрольные)
 
(не показаны 23 промежуточные версии этого же участника)
Строка 3: Строка 3:
 
* Форма контроля: диф. зачет
 
* Форма контроля: диф. зачет
 
* '''[http://gg.gg/pd20-signup Форма регистрации на курс].''' Заполняется '''ТОЛЬКО в том случае''' если вас нет в списках и вам не приходят доступы на кластер.
 
* '''[http://gg.gg/pd20-signup Форма регистрации на курс].''' Заполняется '''ТОЛЬКО в том случае''' если вас нет в списках и вам не приходят доступы на кластер.
 +
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vQ5lJKo23U1gE0JhLiAYCg9LMls3c3xUo-h4CeS5ppDpUtqUlNYgvgqSynQJV3rRRNje7VJyBnqLJzq/pubhtml?gid=1899496936&single=true План лекций, семинаров, контрольных]
 
* [https://docs.google.com/spreadsheets/d/15YOBHYnDK4Ppbc4jMYzuySg0nVS3b31peYG2zqSZ8LU/edit Таблица с оценками]
 
* [https://docs.google.com/spreadsheets/d/15YOBHYnDK4Ppbc4jMYzuySg0nVS3b31peYG2zqSZ8LU/edit Таблица с оценками]
 
* [http://gg.gg/pd20-join Телеграм-чат курса]
 
* [http://gg.gg/pd20-join Телеграм-чат курса]
 
== Технические ссылки ==
 
* [https://forms.gle/SSL2e7FhE5iEdSoa9 Форма для проблем с инфраструктурой АТП]
 
* В случае проблем с кластером MPI, пишите на '''parallel-cluster-atp@googlegroups.com'''.
 
==== Сервера ====
 
* MPI & OpenMP: <pre>ssh <user>@calc.cod.phystech.edu</pre>
 
* CUDA: <pre>ssh <user>@lorien.atp-fivt.org</pre>
 
* Hadoop ecosystem: <pre>ssh <user>@mipt-client.atp-fivt.org</pre>
 
  
 
=== Материалы занятий ===
 
=== Материалы занятий ===
Строка 28: Строка 21:
 
* [https://gitlab.com/pd2020-supplementary Коды семинаров]
 
* [https://gitlab.com/pd2020-supplementary Коды семинаров]
  
[https://gitlab.com/pd2020-supplementary/8xx-GLOBAL '''Домашние задания''']
+
*[https://gitlab.com/pd2020-supplementary/8xx-GLOBAL '''Домашние задания''']
[https://docs.google.com/spreadsheets/d/1rxr465J4VtRxXnRtID1aRy0RzhpBltpjJYKximAQMB8/edit#gid=0 Интересные ссылки]
+
*[https://docs.google.com/spreadsheets/d/1rxr465J4VtRxXnRtID1aRy0RzhpBltpjJYKximAQMB8/edit#gid=0 Интересные ссылки]
 +
 
 +
 
 +
== Технические ссылки ==
 +
* [https://forms.gle/SSL2e7FhE5iEdSoa9 Форма для проблем с инфраструктурой АТП]
 +
* В случае проблем с кластером MPI, пишите на '''parallel-cluster-atp@googlegroups.com'''.
 +
==== Сервера ====
 +
* MPI & OpenMP: <pre>ssh <user>@calc.cod.phystech.edu</pre>
 +
* CUDA: <pre>ssh <user>@lorien.atp-fivt.org</pre>
 +
* Hadoop ecosystem: <pre>ssh <user>@mipt-client.atp-fivt.org</pre>
  
 
= Преподаватели =
 
= Преподаватели =
Строка 62: Строка 64:
 
= Критерии получения оценки =
 
= Критерии получения оценки =
 
Зачёт выставляется на основании баллов, полученных в течение семестра.
 
Зачёт выставляется на основании баллов, полученных в течение семестра.
 +
 +
== Домашние задания ==
 +
Планируется 7 домашних (6 основных и 1 бонусное) заданий. Проверка включает 2 этапа:
 +
# прохождение автоматических тестов (начиная с ДЗ по HDFS).
 +
# code review при условии выполненного п.1. Исправления по code review можно делать в течение '''1 месяца''' после 1-го комментария.
 +
 +
[https://gitlab.com/pd2020-supplementary/8xx-GLOBAL Репозиторий с домашками]
 +
 +
== Мини-контрольные ==
 +
Состоятся 3 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна [https://drive.google.com/file/d/1n0iR-IaPnT4EeEEUCksODQnjl34L8Xlc/view?usp=sharing инструкция пользователя].
 +
На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
 +
 +
{|  class="wikitable"
 +
|-
 +
! Название события на http://exams.mipt.ru/
 +
! Дата
 +
! Длительность
 +
|-
 +
| PD-2020. HDFS & MapReduce || 02.11.2020 || 15 мин.
 +
|-
 +
| PD-2020. Hive & Spark || 26.11.2020 || 15 мин.
 +
|-
 +
| PD-2020. Kafka, Zookeeper || 14.12.2020 || 15 мин.
 +
|}
 +
 +
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить [https://forms.gle/iYUgzuV83hF3H2Lo8 '''форму на дописывание''']. Дописывание состоится 13.01.2021:
 +
* 13.01.2021, 10:00 для PD-2020. Дописывание. HDFS & MAPREDUCE
 +
* 13.01.2021, 10:20 для PD-2020. Дописывание. Hive & Spark
 +
* 13.01.2021, 10:40 для PD-2020. Дописывание. Zookeeper, Kafka, Cassandra
 +
 +
Каждое дописывание длится 15 минут.
 +
 +
= Литература =
 +
=== MPI & OpenMP ===
 +
# Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.
 +
 +
=== CUDA ===
 +
# Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
 +
# [http://courses.cms.caltech.edu/cs179/ Курс "GPU programming" в Caltech].
 +
# [https://www.cs.bgu.ac.il/~graph161/wiki.files/09f-GPU%20-%20Scans.pdf Лекция по Scan курсе по комп. графике, Ben-Gurion university]
 +
# [http://developer.download.nvidia.com/compute/cuda/1.1-Beta/x86_website/projects/scan/doc/scan.pdf Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia]
 +
# Книги от Nvidia: [https://developer.nvidia.com/gpugems/gpugems/contributors GPU gems], [https://developer.nvidia.com/gpugems/gpugems2/inside-front-cover GPU gems 2], [https://developer.nvidia.com/gpugems/gpugems3/foreword GPU gems 3]. Особенно интересна глава 39 из [https://developer.nvidia.com/gpugems/gpugems3/part-vi-gpu-computing/chapter-39-parallel-prefix-sum-scan-cuda GPU Gems] про Scan.
 +
 +
=== HDFS ===
 +
# [https://www.oreilly.com/library/view/hadoop-the-definitive/9781491901687/ T. White. "Hadoop. The definitive guide"], гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
 +
# [https://storageconference.us/2010/Papers/MSST/Shvachko.pdf Статья про архитектуру HDFS от Константина Швачко (Yahoo!)]
 +
# [http://www.blogjava.net/DLevin/archive/2015/01/25/422428.html Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))]
 +
# [http://blog.madhukaraphatak.com/secondary-namenode---what-it-really-do/ Что в действительности делает SNN]
 +
# [https://nancyyanyu.github.io/posts/49a14c15/ Выдержка из курсов Яндекс про HDFS]

Текущая версия на 12:28, 12 января 2021

Общие сведения

Материалы занятий

Доступ открыт для всех аккаунтов @phystech.edu.

Лекции
Семинары


Технические ссылки

Сервера

  • MPI & OpenMP:
    ssh <user>@calc.cod.phystech.edu
  • CUDA:
    ssh <user>@lorien.atp-fivt.org
  • Hadoop ecosystem:
    ssh <user>@mipt-client.atp-fivt.org

Преподаватели

  • Лекторы
    • Долуденко Алексей
    • Ахтямов Павел
    • Ивченко Олег
    • Липовский Роман
    • Захаров Николай (приглашённый)
    • Инанц Гайк (приглашённый)
  • Семинаристы
    • Ахтямов Павел Ибрагимович
    • Бабин Олег Борисович
    • Вручтель Серафима Вильямовна
    • Госткин Евгений
    • Иванова Юлия Александровна
    • Ивченко Олег Николаевич
    • Лескин Иван
    • Чернецкий Аркадий
  • Учебные ассистенты
    • Акжигитова Юлия
    • Арутюн Барсегян
    • Гуров Роман
    • Миллер Татьяна
    • Пономарев Алексей
    • Содиков Махмуд
    • Феофанова Мария
    • Цион Михаил

Критерии получения оценки

Зачёт выставляется на основании баллов, полученных в течение семестра.

Домашние задания

Планируется 7 домашних (6 основных и 1 бонусное) заданий. Проверка включает 2 этапа:

  1. прохождение автоматических тестов (начиная с ДЗ по HDFS).
  2. code review при условии выполненного п.1. Исправления по code review можно делать в течение 1 месяца после 1-го комментария.

Репозиторий с домашками

Мини-контрольные

Состоятся 3 контрольные, которые будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.

Название события на http://exams.mipt.ru/ Дата Длительность
PD-2020. HDFS & MapReduce 02.11.2020 15 мин.
PD-2020. Hive & Spark 26.11.2020 15 мин.
PD-2020. Kafka, Zookeeper 14.12.2020 15 мин.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. Дописывание состоится 13.01.2021:

  • 13.01.2021, 10:00 для PD-2020. Дописывание. HDFS & MAPREDUCE
  • 13.01.2021, 10:20 для PD-2020. Дописывание. Hive & Spark
  • 13.01.2021, 10:40 для PD-2020. Дописывание. Zookeeper, Kafka, Cassandra

Каждое дописывание длится 15 минут.

Литература

MPI & OpenMP

  1. Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.

CUDA

  1. Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
  2. Курс "GPU programming" в Caltech.
  3. Лекция по Scan курсе по комп. графике, Ben-Gurion university
  4. Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia
  5. Книги от Nvidia: GPU gems, GPU gems 2, GPU gems 3. Особенно интересна глава 39 из GPU Gems про Scan.

HDFS

  1. T. White. "Hadoop. The definitive guide", гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
  2. Статья про архитектуру HDFS от Константина Швачко (Yahoo!)
  3. Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))
  4. Что в действительности делает SNN
  5. Выдержка из курсов Яндекс про HDFS