Параллельные и распределённые вычисления 2019
Версия от 11:58, 8 октября 2019; Shajdurova.es (обсуждение | вклад) (→Список рекомендуемых материалов)
Содержание
Общие сведения
- Форма контроля: зачет
- Форма регистрации на курс
- Таблица с оценками
- Телеграм-чат курса
Материалы занятий
Преподаватели
- Лекторы:
- Долуденко Алексей
- Ивченко Олег
- Семинаристы:
- Бабин Олег (791)
- Булгакова Дарья (792)
- Долуденко Алексей (793, 796)
- Ахтямов Павел (794)
- Чернецкий Аркадий (795)
- Иванова Юлия (797)
- Ивченко Олег (798, 7910)
Критерии получения оценки
После дедлайна задачи можно сдавать лишь с -50% от максимальной оценки.
Список рекомендуемых материалов
- Параллельная часть
- Распределенная часть
- Распределённые файловые системы (GFS, HDFS). Её составляющие. Их достоинства, недостатки и сфера применения. Чтение и запись в HDFS. HDFS APIs: WebUI, shell, Java API.
- Парадигма MapReduce. Основная идея, формальное описание. Обзор реализаций. API для работы с Hadoop (Native Java API vs. Streaming), примеры.
- Типы Join'ов и их реализации в парадигме MR. Паттерны проекттирования MR (pairs, stripes, составные ключи). PageRank в MR. Планировщик задач в YARN.
- SQL поверх BigData.