Параллельные и распределенные вычисления весна 2025 — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Новая страница: «Test»)
 
 
Строка 1: Строка 1:
Test
+
= Общие сведения =
 +
* Семестр: 5 (третий курс)
 +
* Форма контроля: диф. зачет
 +
* '''[https://forms.gle/nMWSMJZJVTugmKCE6 Форма регистрации на курс].
 +
* [https://docs.google.com/spreadsheets/d/1qKqtrO3-Cx68hL63GRm_iCL1pjCnK5DCgNxKyAjvETU/pubhtml?gid=397546993&single=true План лекций, семинаров,домашних работ, контрольных]
 +
* [https://docs.google.com/spreadsheets/d/1qKqtrO3-Cx68hL63GRm_iCL1pjCnK5DCgNxKyAjvETU/pubhtml?gid=2040051800&single=true Таблица с оценками]
 +
* [https://docs.google.com/spreadsheets/d/1qKqtrO3-Cx68hL63GRm_iCL1pjCnK5DCgNxKyAjvETU/pubhtml?gid=633420430&single=true Статус проверки домашних заданий]
 +
* [https://forms.gle/B73K4MYzpVf9izP1A Продление дедлайнов и дописывание КР]
 +
* [https://t.me/+wnu4eAfEXrE0MTdi Телеграм-чат курса]
 +
 
 +
=== Материалы занятий ===
 +
Доступ открыт для всех аккаунтов @phystech.edu.
 +
 
 +
===== Лекции =====
 +
* 2024 г. осень
 +
* [https://drive.google.com/drive/folders/1kgzEzb6MNp5AuCVhWSAYZDwCRnUbf2ao Видео лекций].
 +
* [https://drive.google.com/drive/folders/1WukRMRs74gcn5lEo5yNu6mz-AWBkkrIg?usp=sharing Видео лекций].
 +
* [https://drive.google.com/drive/folders/1EjlJPwShH2UkMsxaFLIfvkYoAcKH3pnW?usp=sharing Слайды презентаций]
 +
 
 +
* 2024 г. весна
 +
* [https://www.youtube.com/playlist?list=PL4_hYwCyhAvaZsPvosV8WBajIgflGK44j Видео лекций YouTube].
 +
* [https://drive.google.com/drive/folders/1WukRMRs74gcn5lEo5yNu6mz-AWBkkrIg?usp=sharing Видео лекций].
 +
* [https://drive.google.com/drive/folders/1EjlJPwShH2UkMsxaFLIfvkYoAcKH3pnW?usp=sharing Слайды презентаций]
 +
 
 +
* 2023 г. весна
 +
* [https://drive.google.com/drive/folders/1arIrxYGJ144cHpZ72uGI5mBsFWolczfF?usp=share_link Видео лекций].
 +
** [https://youtube.com/playlist?list=PLfibPMPn-PgyfrdrfmxvEAXtcjw7yfZmL Скринкасты лекций по CUDA]
 +
* [https://drive.google.com/drive/folders/1eH2pePnbu3KqiRYtcBpDFffZXMXGA6-H?usp=share_link Слайды презентаций]
 +
 
 +
* 2023 г. осень
 +
* [https://www.youtube.com/playlist?list=PL4_hYwCyhAvaZsPvosV8WBajIgflGK44j Видео лекций].
 +
* [https://drive.google.com/drive/folders/1diehaQajFhzbYTLAAqmT0R_NRqU25JJX?usp=sharing Слайды презентаций]
 +
 
 +
* 2022 г. весна
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdflFRaUJveTdvR2REdDVxTkp1cm1VRnRNWmdsSGcxWlI4Y1kyVTJmZWtBWE0?resourcekey=0-sk8F-iNm8_2O8g7SDG24IA&usp=sharing Лекции]
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfllmTmtMbk44V0ZkT2xtc0dXbWoweGlDQmRSTE5lT0o5dk1yd3FaOTFZOEE?resourcekey=0-P5pBLFMpgXuVvFn8dB4nXA&usp=sharing Семинары]
 +
 
 +
* 2021 г.
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfnNPS3JFdEdpTHM5aVFZR3dmdnlrdFNKcjlfa0dLY0lFb2l3cmtsM2VXT2s?resourcekey=0-rE3AAeTCn3pf0dgfGS86Qg&usp=sharing Лекции]
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfjBkRmhxc2o3d3NEdzN0RUhFeGtNSmJ6RFl3bzhOSEgzX0ViV2tXNFljbHc?resourcekey=0-t0UekU9AD2iQO6vKFmLUcg&usp=sharing Семинары]
 +
 
 +
* 2020 г.
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfk1jdUQ4YnZtRWNCbl9YVHlvSHZjRERrOVlNVlU5dDZYWU0tN2dCRjgxVzA?resourcekey=0-cn9bfvH8nBixE3aiWvTfgA&usp=sharing Лекции]
 +
** [https://drive.google.com/drive/folders/0B2n4K2J_6IZdfm54OF8zMmd6aVQ0U0Y0MjFsdWdudFkxODJRVWFUcUt6bmdHUkNsYmMxRHM?resourcekey=0-wyYPEDg_OIF6mj1-4o8bLw&usp=sharing Семинары]
 +
 
 +
===== Семинары =====
 +
* [https://gitlab.atp-fivt.org/courses-public/pd/global/-/tree/main/materials?ref_type=heads Коды и презентации семинаров]
 +
 
 +
*[https://gitlab.atp-fivt.org/courses-public/pd/global/-/tree/main/homeworks?ref_type=heads '''Домашние задания''']
 +
*[https://docs.google.com/spreadsheets/d/1rxr465J4VtRxXnRtID1aRy0RzhpBltpjJYKximAQMB8/edit#gid=0 Интересные ссылки]
 +
 
 +
== Технические ссылки ==
 +
* В случае проблем с кластерами пишите на '''servers@atp-fivt.org'''
 +
 
 +
==== Сервера ====
 +
* MPI & OpenMP: <pre>ssh <user>@185.81.248.52 -p 2222</pre>
 +
* CUDA: <pre>ssh <user>@lorien.atp-fivt.org</pre>
 +
* Hadoop ecosystem: <pre>ssh <user>@mipt-client.atp-fivt.org</pre>
 +
 
 +
= Преподаватели =
 +
* '''Руководитель курса'''
 +
** Чернецкий Аркадий
 +
 
 +
* '''Лекторы'''
 +
** Ивченко Олег
 +
** Долуденко Алексей
 +
** Ахтямов Павел
 +
** Изабелла Затикян
 +
** Леонид Меркин
 +
** Вадим Опольский
 +
 
 +
* '''Семинаристы'''
 +
** Чернецкий Аркадий
 +
** Ахтямов Павел
 +
** Кочурова Ирина
 +
 
 +
* '''Учебные ассистенты'''
 +
 
 +
==== Контакт для организационных вопросов ====
 +
Куратор курса [https://t.me/atpfpmi_curators @atpfpmi_curators]
 +
 
 +
= Критерии получения оценки =
 +
Зачет выставляется на основании баллов, полученных в течение семестра.
 +
 
 +
== Домашние задания ==
 +
Планируется 6 домашних заданий. Проверка включает 2 этапа:
 +
# прохождение автоматических тестов (начиная с ДЗ по CUDA).
 +
# code review при условии выполненного п.1. Исправления по code review можно делать в течение '''1 месяца''' после 1-го комментария.
 +
 
 +
{|  class="wikitable"
 +
|-
 +
! Название
 +
! Мягкий дедлайн
 +
! Жёсткий дедлайн
 +
|-
 +
| PD-2024a. MPI || 30.09.2024 || 07.10.2024
 +
|-
 +
| PD-2024a. CUDA || 21.10.2024 || 28.10.2024
 +
|-
 +
| PD-2024a. HDFS || 11.11.2024 || 18.11.2024
 +
|-
 +
| PD-2024a. Map-Reduce || 02.12.2024 || 09.12.2024
 +
|-
 +
| PD-2024a. Hive || 16.12.2024 || 23.12.2024
 +
|-
 +
| PD-2024a. Spark || 30.12.2024 || 06.01.2024
 +
|}
 +
 
 +
[https://gitlab.atp-fivt.org/courses-public/pd/global/-/tree/main/homeworks?ref_type=heads Репозиторий с домашками]
 +
 
 +
* Штраф за опоздание по soft deadline: -50%
 +
* Штраф за опоздание по hard deadline: -75%
 +
 
 +
Сдавать и исправлять домашки можно до .
 +
 
 +
== Мини-контрольные ==
 +
Состоятся 3 теста. На контрольных нельзя пользоваться ничем и никем, кроме разрешённых смотрящими вещей. Код писать не потребуется.
 +
 
 +
{|  class="wikitable"
 +
|-
 +
! Название
 +
! Дата
 +
! Длительность
 +
|-
 +
| PD-2024a. HDFS & MapReduce  || 15 мин.
 +
|-
 +
| PD-2024a. Hive & Spark || 20 мин.
 +
|-
 +
| PD-2024a. Zookeeper, Kafka, Cassandra || 15 мин.
 +
|}
 +
 
 +
В случае если вы не сможете написать КР в указанную дату, или не получается сдать домашнее задание вовремя по технической или другой уважительной причине, просьба заполнить [https://forms.gle/WxCKSuf8GmdFyR4K9 '''форму на дописывание'''].
 +
* PD-2025a. Дописывание. HDFS & MAPREDUCE
 +
* PD-2025a. Дописывание. Hive & Spark
 +
 
 +
= Литература =
 +
=== MPI & OpenMP ===
 +
# Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.
 +
 
 +
=== CUDA ===
 +
# Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
 +
# [http://courses.cms.caltech.edu/cs179/ Курс "GPU programming" в Caltech].
 +
# [https://www.cs.bgu.ac.il/~graph161/wiki.files/09f-GPU%20-%20Scans.pdf Лекция по Scan курсе по комп. графике, Ben-Gurion university]
 +
# [http://developer.download.nvidia.com/compute/cuda/1.1-Beta/x86_website/projects/scan/doc/scan.pdf Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia]
 +
# Книги от Nvidia: [https://developer.nvidia.com/gpugems/gpugems/contributors GPU gems], [https://developer.nvidia.com/gpugems/gpugems2/inside-front-cover GPU gems 2], [https://developer.nvidia.com/gpugems/gpugems3/foreword GPU gems 3]. Особенно интересна глава 39 из [https://developer.nvidia.com/gpugems/gpugems3/part-vi-gpu-computing/chapter-39-parallel-prefix-sum-scan-cuda GPU Gems] про Scan.
 +
 
 +
=== HDFS ===
 +
# [https://www.oreilly.com/library/view/hadoop-the-definitive/9781491901687/ T. White. "Hadoop. The definitive guide"], гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
 +
# [https://storageconference.us/2010/Papers/MSST/Shvachko.pdf Статья про архитектуру HDFS от Константина Швачко (Yahoo!)]
 +
# [http://www.blogjava.net/DLevin/archive/2015/01/25/422428.html Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))]
 +
# [http://blog.madhukaraphatak.com/secondary-namenode---what-it-really-do/ Что в действительности делает SNN]
 +
# [https://nancyyanyu.github.io/posts/49a14c15/ Выдержка из курсов Яндекс про HDFS]

Текущая версия на 11:29, 19 декабря 2024

Общие сведения

Материалы занятий

Доступ открыт для всех аккаунтов @phystech.edu.

Лекции
Семинары

Технические ссылки

  • В случае проблем с кластерами пишите на servers@atp-fivt.org

Сервера

  • MPI & OpenMP:
    ssh <user>@185.81.248.52 -p 2222
  • CUDA:
    ssh <user>@lorien.atp-fivt.org
  • Hadoop ecosystem:
    ssh <user>@mipt-client.atp-fivt.org

Преподаватели

  • Руководитель курса
    • Чернецкий Аркадий
  • Лекторы
    • Ивченко Олег
    • Долуденко Алексей
    • Ахтямов Павел
    • Изабелла Затикян
    • Леонид Меркин
    • Вадим Опольский
  • Семинаристы
    • Чернецкий Аркадий
    • Ахтямов Павел
    • Кочурова Ирина
  • Учебные ассистенты

Контакт для организационных вопросов

Куратор курса @atpfpmi_curators

Критерии получения оценки

Зачет выставляется на основании баллов, полученных в течение семестра.

Домашние задания

Планируется 6 домашних заданий. Проверка включает 2 этапа:

  1. прохождение автоматических тестов (начиная с ДЗ по CUDA).
  2. code review при условии выполненного п.1. Исправления по code review можно делать в течение 1 месяца после 1-го комментария.
Название Мягкий дедлайн Жёсткий дедлайн
PD-2024a. MPI 30.09.2024 07.10.2024
PD-2024a. CUDA 21.10.2024 28.10.2024
PD-2024a. HDFS 11.11.2024 18.11.2024
PD-2024a. Map-Reduce 02.12.2024 09.12.2024
PD-2024a. Hive 16.12.2024 23.12.2024
PD-2024a. Spark 30.12.2024 06.01.2024

Репозиторий с домашками

  • Штраф за опоздание по soft deadline: -50%
  • Штраф за опоздание по hard deadline: -75%

Сдавать и исправлять домашки можно до .

Мини-контрольные

Состоятся 3 теста. На контрольных нельзя пользоваться ничем и никем, кроме разрешённых смотрящими вещей. Код писать не потребуется.

Название Дата Длительность
PD-2024a. HDFS & MapReduce 15 мин.
PD-2024a. Hive & Spark 20 мин.
PD-2024a. Zookeeper, Kafka, Cassandra 15 мин.

В случае если вы не сможете написать КР в указанную дату, или не получается сдать домашнее задание вовремя по технической или другой уважительной причине, просьба заполнить форму на дописывание.

  • PD-2025a. Дописывание. HDFS & MAPREDUCE
  • PD-2025a. Дописывание. Hive & Spark

Литература

MPI & OpenMP

  1. Антонов А.С. Технологии параллельного программирования MPI и OpenMP: Учеб. пособие. Предисл.: В.А.Садовничий. - М.: Издательство Московского университета, 2012.

CUDA

  1. Дж. Сандерс, Э. Кэррот. Технология CUDA в примерах и задачах, 2013 (рус).
  2. Курс "GPU programming" в Caltech.
  3. Лекция по Scan курсе по комп. графике, Ben-Gurion university
  4. Parallel Prefix Sum (Scan) with CUDA, Mark Harris, NVidia
  5. Книги от Nvidia: GPU gems, GPU gems 2, GPU gems 3. Особенно интересна глава 39 из GPU Gems про Scan.

HDFS

  1. T. White. "Hadoop. The definitive guide", гл. 3 "Hadoop distributed filesystem". (есть русский перевод). 4е издание
  2. Статья про архитектуру HDFS от Константина Швачко (Yahoo!)
  3. Статья про архитектуру HDFS в блоге HortonWorks (Китайская копия :))
  4. Что в действительности делает SNN
  5. Выдержка из курсов Яндекс про HDFS