Параллельные и распределённые вычисления — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
м (VeLKerr переименовал страницу МВС 2018 в Параллельные и распределённые вычисления: Изменение названия курса)
Строка 1: Строка 1:
= Параллельные и распределённые вычисления =
+
= Общие сведения =
 
 
== Общие сведения ==
 
 
* Семестр: 5 (третий курс)
 
* Семестр: 5 (третий курс)
 
* Форма контроля: экзамен
 
* Форма контроля: экзамен
Строка 15: Строка 13:
 
* [http://gitlab.atp-fivt.org Gitlab для автоматического тестирования ДЗ]
 
* [http://gitlab.atp-fivt.org Gitlab для автоматического тестирования ДЗ]
  
== Распределённая часть ==
+
= Распределённая часть =
=== Преподаватели ===
+
== Преподаватели ==
 
* '''Модуль "Обработка больших данных":'''  
 
* '''Модуль "Обработка больших данных":'''  
 
** Ивченко Олег,  
 
** Ивченко Олег,  
Строка 23: Строка 21:
 
** Липовский Роман
 
** Липовский Роман
  
=== Семинаристы ===
+
== Семинаристы ==
 
* Долуденко Алексей
 
* Долуденко Алексей
 
* Ивченко Олег
 
* Ивченко Олег
Строка 30: Строка 28:
 
* Сурин Михаил
 
* Сурин Михаил
  
=== Теоретический трек (лекции) ===
+
== Теоретический трек (лекции) ==
 
# [https://docs.google.com/presentation/d/1206T54F84HDhKbScxrDFzLnERRGwu0oLrbWEJ3mT9GI Распределённые файловые системы (GFS, HDFS). Её составляющие. Их достоинства, недостатки и сфера применения. Чтение и запись в HDFS. HDFS APIs: WebUI, shell, Java API].
 
# [https://docs.google.com/presentation/d/1206T54F84HDhKbScxrDFzLnERRGwu0oLrbWEJ3mT9GI Распределённые файловые системы (GFS, HDFS). Её составляющие. Их достоинства, недостатки и сфера применения. Чтение и запись в HDFS. HDFS APIs: WebUI, shell, Java API].
 
# Парадигма MapReduce. Основная идея, формальное описание. Обзор реализаций.  API для работы с Hadoop (Native Java API vs. Streaming), примеры.
 
# Парадигма MapReduce. Основная идея, формальное описание. Обзор реализаций.  API для работы с Hadoop (Native Java API vs. Streaming), примеры.
Строка 36: Строка 34:
 
# SQL поверх BigData.
 
# SQL поверх BigData.
  
=== Практический трек (семинары) ===
+
== Практический трек (семинары) ==
 
# [https://gitlab.com/VeLKerr/pardistrib/blob/master/practice/01-hdfs.md Устройство Hadoop-кластера, HDFS CLI, Web API, внутреннее устройство HDFS].
 
# [https://gitlab.com/VeLKerr/pardistrib/blob/master/practice/01-hdfs.md Устройство Hadoop-кластера, HDFS CLI, Web API, внутреннее устройство HDFS].
 
# Hadoop Java API, Hadoop streaming API. Простейшая программа на MapReduce (подсчёт слов в тексте). Её модификации.
 
# Hadoop Java API, Hadoop streaming API. Простейшая программа на MapReduce (подсчёт слов в тексте). Её модификации.
Строка 42: Строка 40:
 
# Apache Hive. Язык HiveQL, его расширения (Hive Streaming, User defined functions).
 
# Apache Hive. Язык HiveQL, его расширения (Hive Streaming, User defined functions).
  
== Параллельная часть ==
+
= Параллельная часть =
=== Преподаватели ===
+
== Преподаватели ==
 
Сальников Алексей Николаевич
 
Сальников Алексей Николаевич
  
=== Семинаристы ===
+
== Семинаристы ==
 
* Долуденко Алексей
 
* Долуденко Алексей
 
* Сальников Алексей Николаевич
 
* Сальников Алексей Николаевич
Строка 52: Строка 50:
 
* Сурин Михаил  
 
* Сурин Михаил  
  
=== Теоретический трек (лекции) ===
+
== Теоретический трек (лекции) ==
  
=== Практический трек (семинары) ===
+
== Практический трек (семинары) ==
  
 
== P.S. ==
 
== P.S. ==
 
Если имеются проблемы с доступами на какой-нибудь из сервисов, напишите [https://goo.gl/forms/r5TC8njYkjiY9X7X2 сюда].
 
Если имеются проблемы с доступами на какой-нибудь из сервисов, напишите [https://goo.gl/forms/r5TC8njYkjiY9X7X2 сюда].

Версия 22:22, 9 сентября 2018

Общие сведения

Материалы занятий

Распределённая часть

Преподаватели

  • Модуль "Обработка больших данных":
    • Ивченко Олег,
    • Штохов Александр
  • Модуль "Отказоустойчивые распределенные системы":
    • Липовский Роман

Семинаристы

  • Долуденко Алексей
  • Ивченко Олег
  • Ахтямов Павел
  • Емельянов Антон
  • Сурин Михаил

Теоретический трек (лекции)

  1. Распределённые файловые системы (GFS, HDFS). Её составляющие. Их достоинства, недостатки и сфера применения. Чтение и запись в HDFS. HDFS APIs: WebUI, shell, Java API.
  2. Парадигма MapReduce. Основная идея, формальное описание. Обзор реализаций. API для работы с Hadoop (Native Java API vs. Streaming), примеры.
  3. Типы Join'ов и их реализации в парадигме MR. Паттерны проекттирования MR (pairs, stripes, составные ключи). PageRank в MR. Планировщик задач в YARN.
  4. SQL поверх BigData.

Практический трек (семинары)

  1. Устройство Hadoop-кластера, HDFS CLI, Web API, внутреннее устройство HDFS.
  2. Hadoop Java API, Hadoop streaming API. Простейшая программа на MapReduce (подсчёт слов в тексте). Её модификации.
  3. Joins в MapReduce, инструменты отладки в MapReduce.
  4. Apache Hive. Язык HiveQL, его расширения (Hive Streaming, User defined functions).

Параллельная часть

Преподаватели

Сальников Алексей Николаевич

Семинаристы

  • Долуденко Алексей
  • Сальников Алексей Николаевич
  • Котельников Алексей
  • Сурин Михаил

Теоретический трек (лекции)

Практический трек (семинары)

P.S.

Если имеются проблемы с доступами на какой-нибудь из сервисов, напишите сюда.