Хранение и обработка больших объемов данных — различия между версиями
VeLKerr (обсуждение | вклад) (→Важные ссылки) |
VeLKerr (обсуждение | вклад) (→Критерии получения оценки) |
||
(не показаны 22 промежуточные версии этого же участника) | |||
Строка 4: | Строка 4: | ||
=== Важные ссылки === | === Важные ссылки === | ||
+ | * '''[http://bit.ly/mipt_bigdata20_plan План курса]''' | ||
* '''[http://bit.ly/hobod_tpos_20_signup Форма регистрации на курс]''' | * '''[http://bit.ly/hobod_tpos_20_signup Форма регистрации на курс]''' | ||
− | |||
* [http://bit.ly/bigdata20-join Чат курса] | * [http://bit.ly/bigdata20-join Чат курса] | ||
− | * Таблица с оценками | + | * [https://docs.google.com/spreadsheets/d/1drBKWwL94ef2I2d3gnE5t3unRFvTKssU5Yk2NgBtOsg Таблица с оценками] |
* [https://piazza.com/class/k6antn1wshy45e Q&A Форум Piazza] | * [https://piazza.com/class/k6antn1wshy45e Q&A Форум Piazza] | ||
Строка 14: | Строка 14: | ||
* [https://drive.google.com/drive/folders/1ikiEdV8PnH2V_XsZq57o5KztDMMVEEiy?usp=sharing Видео лекций] | * [https://drive.google.com/drive/folders/1ikiEdV8PnH2V_XsZq57o5KztDMMVEEiy?usp=sharing Видео лекций] | ||
* [https://gitlab.com/VeLKerr/hobod-practice Материалы семинаров] | * [https://gitlab.com/VeLKerr/hobod-practice Материалы семинаров] | ||
− | * Домашние задания | + | * [https://drive.google.com/drive/folders/1zE-Zdo8wzfjzIe7o8KCiSgSe0u4T9pjo?usp=sharing Домашние задания] |
= Команда курса = | = Команда курса = | ||
* '''Преподаватели''' | * '''Преподаватели''' | ||
− | ** Ивченко Олег, ''MIPT, | + | ** '''Ивченко Олег''', ''MIPT, Yandex, HSE'' |
** Пилипенко Антон, ''LaModa'' | ** Пилипенко Антон, ''LaModa'' | ||
** Лахвич Дмитрий, ''Tele2'' | ** Лахвич Дмитрий, ''Tele2'' | ||
** Липовский Роман, ''MIPT'' | ** Липовский Роман, ''MIPT'' | ||
** Ахтямов Павел, ''MIPT, VicMan'' | ** Ахтямов Павел, ''MIPT, VicMan'' | ||
+ | ** Жестов Анатолий, ''Exante, ведущий системный инженер'' | ||
* '''Учебные ассистенты''' | * '''Учебные ассистенты''' | ||
** Проверяющие | ** Проверяющие | ||
*** Вручтель Серафима | *** Вручтель Серафима | ||
*** Чернецкий Аркадий | *** Чернецкий Аркадий | ||
− | ** | + | ** Разработчки тестов |
− | *** | + | *** Иванова Юлия |
− | *** | + | |
+ | = Критерии получения оценки = | ||
+ | |||
+ | === Домашние задания === | ||
+ | Планируется 6 домашних заданий (5 условно-обязательных, 1 бонусное). | ||
+ | * Каждое оценивается максимум в 1,5 балла. | ||
+ | * За сдачу позже мягкого дедлайна -50% | ||
+ | * За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать '''до 17.06, 23:59'''. | ||
+ | ==== Дедлайны по домашкам ==== | ||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Домашка | ||
+ | ! Мягкий deadline | ||
+ | ! Жёсткий deadline | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1ltPJXsZHwwGATfS4rIaxZWbl3OmjJUSMHWg5wCN2D9o/edit MapReduce] || 09.03, 23:59 || 16.03, 23:59 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1VqRe7fgfJKcbLKpg8zOLPSyNsGagv2dITP3UoOYu864/edit Hive] || 05.04, 23:59 || 12.04, 23:59 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1nArtdVDU1-Ulw-GUQYTJ4eYScnSvQ1Ldxq6058-55ZY Spark] || 27.04, 23:59 || 04.05, 23:59 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1IExbU6ECHVbecTtRuaKq8FFmwlnxFtYbiYtA5a9vFo0 RealTime & Kafka] || 10.05 (13.05 для задачи 2), 23:59 || 17.05, 23:59 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1etxcohHNQSZHr89_QXEuMkOEsdUY5FbdHvl5tTqHP34 HBase] || 22.05, 23:59 || 29.05, 23:59 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1NcwxoZVsxfUmNO69u_n4Uj4kvcmvJbXF8JDyTTjypd0/edit# Google Spanner] || 23.06, 23:59 || -- | ||
+ | |} | ||
+ | |||
+ | В идеальном случае за домашние задания можно получить '''9 баллов'''. | ||
+ | |||
+ | === Мини-контрольные работы (Quiz'ы) === | ||
+ | Планируется 5 мини-контрольных (см. план курса). Каждая контрольная: | ||
+ | * проводится на семинарах (т.е. в четверга в 18:30). | ||
+ | * содержит 2-3 вопроса, | ||
+ | * длится 15-20 мин., | ||
+ | * оценивается максимум в 1 балл. | ||
+ | В идеальном случае за контрольные можно получить '''5 баллов'''. | ||
+ | |||
+ | === Бонус === | ||
+ | Бонус начисляется за: | ||
+ | * активное участие в семинарах, | ||
+ | * помощь коллегам в чате курса. | ||
+ | Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено. | ||
+ | |||
+ | === Экзамен === | ||
+ | Является '''необязательным'''. | ||
+ | * 6 вопросов по всему курсу, | ||
+ | * 45 минут времени | ||
+ | * возможна устная защита по окончанию 45 минут | ||
+ | * Максимальная оценка: 2 балла. | ||
+ | |||
+ | = Список рекомендуемых материалов = | ||
+ | === Основная === | ||
+ | # Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015 | ||
+ | # Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis | ||
+ | # Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015. | ||
+ | === Дополнительная === | ||
+ | # Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011. | ||
+ | # Alex Holmes , "Hadoop in Practice", 2012 | ||
+ | # Martin Fowler, "NoSQL", 2013 | ||
+ | # Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012 | ||
+ | # Jonathan Leibiusky, "Getting Started with Storm", 2012 | ||
+ | # Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013. | ||
+ | # Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014. | ||
+ | # Spark Core Programming. TutorialsPoint, 2015. | ||
+ | # Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012. | ||
+ | # Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012. | ||
+ | # Lars George. HBase: The Definitive Guide. O’Reilly, 2011. | ||
+ | # Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011. |
Текущая версия на 22:06, 3 февраля 2021
Содержание
Общие сведения
- Семестр: 10 (пятый курс)
- Форма контроля: экзамен
Важные ссылки
Материалы
Команда курса
- Преподаватели
- Ивченко Олег, MIPT, Yandex, HSE
- Пилипенко Антон, LaModa
- Лахвич Дмитрий, Tele2
- Липовский Роман, MIPT
- Ахтямов Павел, MIPT, VicMan
- Жестов Анатолий, Exante, ведущий системный инженер
- Учебные ассистенты
- Проверяющие
- Вручтель Серафима
- Чернецкий Аркадий
- Разработчки тестов
- Иванова Юлия
- Проверяющие
Критерии получения оценки
Домашние задания
Планируется 6 домашних заданий (5 условно-обязательных, 1 бонусное).
- Каждое оценивается максимум в 1,5 балла.
- За сдачу позже мягкого дедлайна -50%
- За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 17.06, 23:59.
Дедлайны по домашкам
Домашка | Мягкий deadline | Жёсткий deadline |
---|---|---|
MapReduce | 09.03, 23:59 | 16.03, 23:59 |
Hive | 05.04, 23:59 | 12.04, 23:59 |
Spark | 27.04, 23:59 | 04.05, 23:59 |
RealTime & Kafka | 10.05 (13.05 для задачи 2), 23:59 | 17.05, 23:59 |
HBase | 22.05, 23:59 | 29.05, 23:59 |
Google Spanner | 23.06, 23:59 | -- |
В идеальном случае за домашние задания можно получить 9 баллов.
Мини-контрольные работы (Quiz'ы)
Планируется 5 мини-контрольных (см. план курса). Каждая контрольная:
- проводится на семинарах (т.е. в четверга в 18:30).
- содержит 2-3 вопроса,
- длится 15-20 мин.,
- оценивается максимум в 1 балл.
В идеальном случае за контрольные можно получить 5 баллов.
Бонус
Бонус начисляется за:
- активное участие в семинарах,
- помощь коллегам в чате курса.
Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.
Экзамен
Является необязательным.
- 6 вопросов по всему курсу,
- 45 минут времени
- возможна устная защита по окончанию 45 минут
- Максимальная оценка: 2 балла.
Список рекомендуемых материалов
Основная
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная
- Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
- Alex Holmes , "Hadoop in Practice", 2012
- Martin Fowler, "NoSQL", 2013
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
- Jonathan Leibiusky, "Getting Started with Storm", 2012
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
- Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.