Параллельные и распределённые вычисления — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
Строка 32: Строка 32:
 
=== Теоретический трек (лекции) ===
 
=== Теоретический трек (лекции) ===
 
# Распределённые файловые системы (GFS, HDFS). Её составляющие. Их достоинства, недостатки и сфера применения. Чтение и запись в HDFS. HDFS APIs: WebUI, shell, Java.
 
# Распределённые файловые системы (GFS, HDFS). Её составляющие. Их достоинства, недостатки и сфера применения. Чтение и запись в HDFS. HDFS APIs: WebUI, shell, Java.
 +
# Парадигма MapReduce. Основная идея, формальное описание. Обзор реализаций.  API для работы с Hadoop (Native Java API vs. Streaming), примеры.
 +
# Типы Join'ов и их реализации в парадигме MR. Паттерны проекттирования MR (pairs, stripes, составные ключи). PageRank в MR.
 +
Hadoop vs. YARN. Нововведения в последних версиях Hadoop. Планировщик задач в YARN.
  
 
=== Практический трек (семинары) ===
 
=== Практический трек (семинары) ===

Версия 22:14, 9 сентября 2018

Параллельные и распределённые вычисления

Общие сведения

Материалы занятий

Распределённая часть

Преподаватели

  • Модуль "Обработка больших данных":
    • Ивченко Олег,
    • Штохов Александр
  • Модуль "Отказоустойчивые распределенные системы":
    • Липовский Роман

Семинаристы

  • Долуденко Алексей
  • Ивченко Олег
  • Ахтямов Павел
  • Емельянов Антон
  • Сурин Михаил

Теоретический трек (лекции)

  1. Распределённые файловые системы (GFS, HDFS). Её составляющие. Их достоинства, недостатки и сфера применения. Чтение и запись в HDFS. HDFS APIs: WebUI, shell, Java.
  2. Парадигма MapReduce. Основная идея, формальное описание. Обзор реализаций. API для работы с Hadoop (Native Java API vs. Streaming), примеры.
  3. Типы Join'ов и их реализации в парадигме MR. Паттерны проекттирования MR (pairs, stripes, составные ключи). PageRank в MR.

Hadoop vs. YARN. Нововведения в последних версиях Hadoop. Планировщик задач в YARN.

Практический трек (семинары)

  1. Устройство Hadoop-кластера, HDFS CLI, Web API, внутреннее устройство HDFS.

Параллельная часть

Преподаватели

Сальников Алексей Николаевич

Семинаристы

  • Долуденко Алексей
  • Сальников Алексей Николаевич
  • Котельников Алексей
  • Сурин Михаил

Теоретический трек (лекции)

Практический трек (семинары)

P.S.

Если имеются проблемы с доступами на какой-нибудь из сервисов, напишите сюда.