Параллельные и распределённые вычисления 2019 — различия между версиями
(→План курса) |
(→План курса) |
||
| Строка 30: | Строка 30: | ||
= План курса = | = План курса = | ||
{| class="wikitable" | {| class="wikitable" | ||
| − | |- ! Дата | + | |- |
| − | |- | 29.10 || Пилипенко А. || Hive, продолжение || Контрольная по HDFS & MapReduce | + | ! Дата |
| − | |- | 05.11 || Лахвич Д. || Spark, начало || Выдача домашки по Hive | + | ! Лектор |
| − | |- | 12.11 || Леонов Я. || Лекция: Модель распределённых систем || Семинар: продолжение Spark | + | ! Тема лекций и семинаров |
| − | |- | 19.11 | + | ! Дополнительные активности |
| − | |- | 26.11 | + | |- |
| − | |- | 03.12 | + | | 29.10 |
| − | |- | 10.12 | + | || Пилипенко А. |
| + | || Hive, продолжение | ||
| + | || Контрольная по HDFS & MapReduce | ||
| + | |- | ||
| + | | 05.11 | ||
| + | || Лахвич Д. | ||
| + | || Spark, начало | ||
| + | || Выдача домашки по Hive | ||
| + | |- | ||
| + | | 12.11 | ||
| + | |rowspan="5"| Леонов Я. | ||
| + | || Лекция: Модель распределённых систем | ||
| + | || Семинар: продолжение Spark | ||
| + | |- | ||
| + | | 19.11 | ||
| + | || AB, FLP, CAP. | ||
| + | || Контрольная по Hive & Spark. Выдача домашки по Zookeeper | ||
| + | |- | ||
| + | | 26.11 | ||
| + | ||Распределённые конфигурации. Zookeeper | ||
| + | || | ||
| + | |- | ||
| + | | 03.12 | ||
| + | ||Dynamo-подобные системы. Cassandra | ||
| + | || | ||
| + | |- | ||
| + | | 10.12 | ||
| + | ||Очереди в распределённых вычислениях. Kafka. | ||
| + | || Контрольная по Cassandra. Kafka, Zookeeper. | ||
|} | |} | ||
Версия 15:56, 24 октября 2019
Содержание
Общие сведения
- Семестр: 5 (третий курс)
- Форма контроля: зачет
- Форма регистрации на курс
- Таблица с оценками
- Телеграм-чат курса
Материалы занятий
Преподаватели
- Лекторы:
- Долуденко Алексей (tg: @adoludenko)
- Ивченко Олег (tg: @velkerr)
- Семинаристы:
- Бабин Олег (791)
- Булгакова Дарья (792)
- Долуденко Алексей (793, 796)
- Ахтямов Павел (794)
- Чернецкий Аркадий (795)
- Иванова Юлия (797)
- Ивченко Олег (798, 7910)
Критерии получения оценки
После дедлайна задачи можно сдавать лишь с -50% от максимальной оценки.
План курса
| Дата | Лектор | Тема лекций и семинаров | Дополнительные активности |
|---|---|---|---|
| 29.10 | Пилипенко А. | Hive, продолжение | Контрольная по HDFS & MapReduce |
| 05.11 | Лахвич Д. | Spark, начало | Выдача домашки по Hive |
| 12.11 | Леонов Я. | Лекция: Модель распределённых систем | Семинар: продолжение Spark |
| 19.11 | AB, FLP, CAP. | Контрольная по Hive & Spark. Выдача домашки по Zookeeper | |
| 26.11 | Распределённые конфигурации. Zookeeper | ||
| 03.12 | Dynamo-подобные системы. Cassandra | ||
| 10.12 | Очереди в распределённых вычислениях. Kafka. | Контрольная по Cassandra. Kafka, Zookeeper. |
Список рекомендуемых материалов
- Параллельная часть
- Распределённая часть (лекции)
- Распределённые файловые системы (GFS, HDFS). Её составляющие. Их достоинства, недостатки и сфера применения. Чтение и запись в HDFS. HDFS APIs: WebUI, shell, Java API
- Парадигма MapReduce. Основная идея, формальное описание. Обзор реализаций. API для работы с Hadoop (Native Java API vs. Streaming), примеры
- Типы Join'ов и их реализации в парадигме MR. Паттерны проекттирования MR (pairs, stripes, составные ключи). PageRank в MR. Планировщик задач в YARN
- SQL поверх BigData
- Распределённая часть (семинары)
- Устройство Hadoop-кластера, HDFS CLI, Web API, внутреннее устройство HDFS
- Hadoop streaming API. Простейшая программа на MapReduce (подсчёт слов в тексте). Её модификации. Инструменты отладки в MapReduce.
- Advanced HDFS shell. Hadoop Java API, Joins в MapReduce, Счётчики в MapReduce
- Apache Hive. Язык HiveQL, его расширения (Hive Streaming, User defined functions)