HOBOD 2022
Содержание
Общие сведения
- Семестр: 10 (5й курс)
- Форма контроля: экзамен
Важные ссылки
Технические ссылки
- Форма для проблем с инфраструктурой АТП
- В случае проблем с кластером MPI, пишите на parallel-cluster-atp@googlegroups.com.
Сервер Gitlab
На данный момент сервер находится по адресу https://gitlab2.atp-fivt.org/, на котором наблюдаются проблемы с сертификатом SSL.
Если вы наблюдаете проблемуfatal: unable to access 'https://gitlab2.atp-fivt.org/...': server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none, временно отключите проверку сертификата
git config --global http.sslVerify "false".
Материалы
Домашние задания
Если нет ни одной домашки, будет неуд. даже если вы набрали > 2.5.
Планируется 6 домашних заданий.
- Каждое оценивается максимум в 1,5 балла.
- За сдачу позже мягкого дедлайна -50%
- За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до экзамена.
Дедлайны по домашкам
Домашка | Мягкий deadline | Жёсткий deadline |
---|---|---|
MapReduce | -- | -- |
Hive | -- | -- |
Spark | -- | -- |
RealTime & Kafka | -- | -- |
HBase / Casssandra | -- | -- |
Google Spanner | -- | -- |
В идеальном случае за домашние задания можно получить 9 баллов.
Бонус
Бонус начисляется за:
- активное участие в семинарах,
- помощь коллегам в чате курса.
Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.
Экзамен
Экзамен состоится 30.06 в 10:00. Он будет проходить через Прокторинг.
Является необязательным.
- вопросы по всему курсу,
- 30 минут времени
- возможна устная защита по окончанию 30 минут
- Максимальная оценка: 2 балла.
Перезачет курса
Если вы хотите перпезачесть курс, просьба заполнить форму до 29.06.2022.
Курс PD-2019 (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
Список рекомендуемых материалов
Основная
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная
- Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
- Alex Holmes , "Hadoop in Practice", 2012
- Martin Fowler, "NoSQL", 2013
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
- Jonathan Leibiusky, "Getting Started with Storm", 2012
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
- Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.