Хранение и обработка больших объемов данных

Материал из Public ATP Wiki
Перейти к: навигация, поиск

Общие сведения

  • Семестр: 10 (пятый курс)
  • Форма контроля: экзамен

Важные ссылки

Материалы

Команда курса

  • Преподаватели
    • Ивченко Олег, MIPT, YSDA, HSE
    • Пилипенко Антон, LaModa
    • Лахвич Дмитрий, Tele2
    • Липовский Роман, MIPT
    • Ахтямов Павел, MIPT, VicMan
  • Учебные ассистенты
    • Проверяющие
      • Вручтель Серафима
      • Чернецкий Аркадий
    • Поддержка тестов
      • Екатерина Шайдурова
      • Госткин Евгений

Список рекомендуемых материалов

Основная

  1. Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
  2. Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
  3. Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.

Дополнительная

  1. Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
  2. Alex Holmes , "Hadoop in Practice", 2012
  3. Martin Fowler, "NoSQL", 2013
  4. Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
  5. Jonathan Leibiusky, "Getting Started with Storm", 2012
  6. Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
  7. Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
  8. Spark Core Programming. TutorialsPoint, 2015.
  9. Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
  10. Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
  11. Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
  12. Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.