HOBOD 2021 — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Новая страница: «= Общие сведения = * Семестр: 10 (пятый курс) * Форма контроля: экзамен»)
 
(Экзамен)
 
(не показано 56 промежуточных версий этого же участника)
Строка 2: Строка 2:
 
* Семестр: 10 (пятый курс)
 
* Семестр: 10 (пятый курс)
 
* Форма контроля: экзамен
 
* Форма контроля: экзамен
 +
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRgbPJ1eI4f4rUnGYNDqd_Tz1PS838oN9wTdG0fARbiO3_nE4qc-iXP_diQgFXkdmaFcZK0h2tAOg5O/pubhtml?gid=359301262&single=true '''План курса''']
 +
* [https://t.me/joinchat/IYbBl5bdUze_j1Pi Телеграм-чат курса]
 +
* [https://forms.gle/a4ihZhVEpZGKzTGKA Форма регистрации]. Заполняют только те, кому '''не пришли письма''' от automation@atp-fivt.org
 +
* [https://docs.google.com/spreadsheets/d/1qb0EZcxhxvRfM518rHJdw6WAfVQ4f-4k0y_tM2Kroz8/edit?usp=sharing Таблица с оценками]
 +
 +
== Материалы занятий ==
 +
* [https://drive.google.com/drive/folders/1UF5bifzoJkrjsFdfn2lWeS0LizPm67Gz?usp=sharing Презентации лекций]
 +
* [https://gitlab.com/hobod/hobod-practice Коды семинаров]
 +
* [https://drive.google.com/drive/folders/1zDlS6rmCv2_F1UoTPxgC4OWnqoiqMIAE?usp=sharing Видео занятий]. Для доступа зайдите в аккаунт на @phystech.edu.
 +
* [https://drive.google.com/drive/folders/1C2RDCMUkO6eXGt4kgHBsZV3O8UxpxGw9?usp=sharing Домашние задания].
 +
 +
== Инфраструктура ==
 +
* [https://forms.gle/skSoR3P2xYKFJpUJ7 Форма для проблем с инфраструктурой]
 +
* Сервер GitLab: <pre>http://gitlab.atp-fivt.org</pre>
 +
* [https://docs.google.com/presentation/d/1eDxnTeBWSB1OrA3BwEUa2vJAJm3_OJMuoRxyA13RzTY/edit#slide=id.p Презентация "как сдавать домашки"]
 +
* [https://drive.google.com/file/d/1TxzwDMHFPG3sz3xXiTNDnCHiB_BkNtwa/view?usp=sharing Видео инструкция о том как смотреть логи]
 +
 +
==== Основной кластер Hadoop ====
 +
* Hostname клиента: <pre>ssh <user>@mipt-client.atp-fivt.org</pre>
 +
* [https://docs.google.com/document/d/1dmb8o3M2ZCsjPq3rJQqd-jNLQhiBXWbWZcTn9aYUAp8 Как работать с Juputer и Spark на кластере МФТИ]
 +
 +
==== Резервный кластер Hadoop ====
 +
* Hostname клиента: <pre>ssh <user>@sber-client.atp-fivt.org</pre>
 +
* [https://gitlab.com/VeLKerr/hobod-practice/-/blob/master/00-additional-cluster-guide.md Инструкция пользователя].
 +
 +
==== Сервер для работы с Docker ====
 +
* Hostname сервера: <pre>ssh hob2021XXX@environ01.atp-fivt.org</pre>
 +
* XXX - [001, 285]. Номер см. в таблице с оценками.
 +
* пароль см. в чате курса. Рекомендуется при первом входе сбросить его командой passwd.
 +
 +
= Команда курса =
 +
=== Преподаватели ===
 +
* Ивченко Олег
 +
* Лахвич Дмитрий
 +
* Ташоян Арсений
 +
* Роман Липовский
 +
* Пономарёв Иван
 +
* Ахтямов Павел
 +
* Федотов Иван
 +
* Жестов Анатолий
 +
 +
=== Учебные ассистенты ===
 +
* Чернецкий Аркадий (проверка ДЗ)
 +
* Якушева Софья (проверка ДЗ)
 +
* Воропаев Роберт (разработка тестов)
 +
* Цион Михаил (разработка тестов)
 +
 +
= Критерии получения оценки =
 +
Суммарно за все активности курса (домашки, контрольные, экзамены и бонус) можно получить 17 / 10. Для получения положительной оценки нужно сдать хотя бы 1 ДЗ. '''Если нет ни одной домашки, будет неуд. даже если вы набрали > 2.5'''.
 +
=== Домашние задания ===
 +
Планируется 6 домашних заданий.
 +
* Каждое оценивается максимум в 1,5 балла.
 +
* За сдачу позже мягкого дедлайна -50%
 +
* За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до экзамена.
 +
 +
==== Дедлайны по домашкам ====
 +
{|  class="wikitable"
 +
|-
 +
! Домашка
 +
! Мягкий deadline
 +
! Жёсткий deadline
 +
|-
 +
|[https://docs.google.com/document/d/1FViOqe_szEp1idZ3mJ0yUe1W7tZEgo1Cmp74JC5_ky0 MapReduce] || 09.03, 23:59 || 14.03, 23:59
 +
|-
 +
|[https://docs.google.com/document/d/14NuJRSHoFFj8ND2zOM_ZfKXgahstmz4PMiUUCVQFG_o Hive] || 21.03, 23:59 || 28.03, 23:59
 +
|-
 +
|[https://docs.google.com/document/d/1OP8x8lPFCHcDBbxZ-Ny7W1uagrCzk8Ez1OWCTONzcLQ Spark] || 04.04, 23:59 || 11.05, 23:59
 +
|-
 +
|[https://docs.google.com/document/d/1fljwR-DKlo91NZIHIgMxtVqaTTaWh5-MzJeDBTO3bAw RealTime & Kafka] || 25.04, 23:59 ''(02.05 для Kafka Streams)'' || 02.05, 23:59 ''(11.05 для Kafka Streams)''
 +
|-
 +
|[https://docs.google.com/document/d/1Js0C2aSa-acffSIANZc-I7nc4147N-92suw8vr9HUrw HBase / Casssandra] || 11.05, 23:59 || 16.05, 23:59
 +
|-
 +
|[https://docs.google.com/document/d/1sY9ZCztEzbqLQSjOGtsJ8vQQohrk4ZgyNcN122D-wMc Google Spanner] || 30.05, 23:59 || 06.06, 23:59
 +
|}
 +
 +
В идеальном случае за домашние задания можно получить '''9 баллов'''.
 +
 +
=== Мини-контрольные работы (Quiz'ы) ===
 +
Планируется 5 мини-контрольных (см. план курса). Они будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна [https://drive.google.com/file/d/1n0iR-IaPnT4EeEEUCksODQnjl34L8Xlc/view?usp=sharing инструкция пользователя].
 +
На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.
 +
 +
Каждая контрольная:
 +
* проводится на занятиях.
 +
* содержит 10-15 вопросов с выбором вариантов ответа,
 +
* длится 10-15 мин.,
 +
* оценивается максимум в 1 балл.
 +
 +
{|  class="wikitable"
 +
|-
 +
! Название события на http://exams.mipt.ru/
 +
! Дата
 +
! Результаты
 +
! Результаты дописывания
 +
|-
 +
| ХОБОД-2021. HDFS, MapReduce, YARN || 11.03.21 || http://gg.gg/hobod21-test1 ||
 +
|-
 +
| ХОБОД-2021. SQL over BigData || 18.03.21 || http://gg.gg/hobod21-test2 ||
 +
|-
 +
| ХОБОД-2021. Spark RDD & DF || 01.04.21 || http://gg.gg/hobod21-test3 ||
 +
|-
 +
| ХОБОД-2021. Realtime & Kafka, Kafka Streams || 13.05.21 || http://gg.gg/hobod21-test4 ||
 +
|-
 +
| ХОБОД-2021. NoSQL || 20.05.21 || http://gg.gg/hobod21-test5 || не предусмотрено
 +
|}
 +
 +
В идеальном случае за контрольные можно получить '''5 баллов'''.
 +
 +
В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить [https://forms.gle/86jyRTU7g8FAy7zf7 '''форму на дописывание''']. После этого вы появитесь в [https://docs.google.com/spreadsheets/d/e/2PACX-1vQSYmcLvl9jTyb2QS_7nbp5FqkabRJDuiBtpDhGgu_lieSHKV6HZrYDHBOiKiFhSBGVCto6L2hGl7nT/pubhtml?gid=429526285&single=true таблице].
 +
 +
Дописывание состоится 20.05:
 +
* 17:00 для 1-го Quiz'a,
 +
* 17:15 для 2-го,
 +
* 17:30 для 3-го,
 +
* 17:45 для 4-го.
 +
* 5й Quiz пройдет в 18:35, дописывания у него нет.
 +
 +
=== Бонус ===
 +
Бонус начисляется за:
 +
* активное участие в семинарах,
 +
* помощь коллегам в чате курса.
 +
Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.
 +
 +
=== Экзамен ===
 +
Экзамен состоится '''17.06 в 10:00'''. Он будет проходить через Прокторинг.
 +
 +
Является '''необязательным'''.
 +
* вопросы по всему курсу,
 +
* 30 минут времени
 +
* возможна устная защита по окончанию 30 минут
 +
* Максимальная оценка: 2 балла.
 +
 +
=== Перезачет курса ===
 +
Если вы хотите перпезачесть курс, просьба заполнить [https://forms.gle/1niBmRpP968H3VzVA форму] до '''4.03.2021'''.
 +
 +
Курс PD-2018 (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
 +
 +
= Список рекомендуемых материалов =
 +
=== Основная ===
 +
# Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale,  Publisher: O'Reilly, Media Release Date: April 2015
 +
# Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
 +
# Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
 +
=== Дополнительная ===
 +
# Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
 +
# Alex Holmes , "Hadoop in Practice", 2012
 +
# Martin Fowler, "NoSQL", 2013
 +
# Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
 +
# Jonathan Leibiusky, "Getting Started with Storm", 2012
 +
# Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
 +
# Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
 +
# Spark Core Programming. TutorialsPoint, 2015.
 +
# Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
 +
# Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
 +
# Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
 +
# Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.
 +
 +
* '''[https://docs.google.com/spreadsheets/d/1X7lhS8aYlyhX9gb1yT6t3A8K7OfCA-x0GJRfMcykDJk/edit?usp=sharing Интересные ссылки]'''

Текущая версия на 00:38, 13 июня 2021

Общие сведения

Материалы занятий

Инфраструктура

Основной кластер Hadoop

Резервный кластер Hadoop

Сервер для работы с Docker

  • Hostname сервера:
    ssh hob2021XXX@environ01.atp-fivt.org
  • XXX - [001, 285]. Номер см. в таблице с оценками.
  • пароль см. в чате курса. Рекомендуется при первом входе сбросить его командой passwd.

Команда курса

Преподаватели

  • Ивченко Олег
  • Лахвич Дмитрий
  • Ташоян Арсений
  • Роман Липовский
  • Пономарёв Иван
  • Ахтямов Павел
  • Федотов Иван
  • Жестов Анатолий

Учебные ассистенты

  • Чернецкий Аркадий (проверка ДЗ)
  • Якушева Софья (проверка ДЗ)
  • Воропаев Роберт (разработка тестов)
  • Цион Михаил (разработка тестов)

Критерии получения оценки

Суммарно за все активности курса (домашки, контрольные, экзамены и бонус) можно получить 17 / 10. Для получения положительной оценки нужно сдать хотя бы 1 ДЗ. Если нет ни одной домашки, будет неуд. даже если вы набрали > 2.5.

Домашние задания

Планируется 6 домашних заданий.

  • Каждое оценивается максимум в 1,5 балла.
  • За сдачу позже мягкого дедлайна -50%
  • За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до экзамена.

Дедлайны по домашкам

Домашка Мягкий deadline Жёсткий deadline
MapReduce 09.03, 23:59 14.03, 23:59
Hive 21.03, 23:59 28.03, 23:59
Spark 04.04, 23:59 11.05, 23:59
RealTime & Kafka 25.04, 23:59 (02.05 для Kafka Streams) 02.05, 23:59 (11.05 для Kafka Streams)
HBase / Casssandra 11.05, 23:59 16.05, 23:59
Google Spanner 30.05, 23:59 06.06, 23:59

В идеальном случае за домашние задания можно получить 9 баллов.

Мини-контрольные работы (Quiz'ы)

Планируется 5 мини-контрольных (см. план курса). Они будут проводиться с помощью системы прокторинга http://exams.mipt.ru/. По ссылке доступна инструкция пользователя. На контрольных нельзя пользоваться IDE и интернетом. Код писать не потребуется.

Каждая контрольная:

  • проводится на занятиях.
  • содержит 10-15 вопросов с выбором вариантов ответа,
  • длится 10-15 мин.,
  • оценивается максимум в 1 балл.
Название события на http://exams.mipt.ru/ Дата Результаты Результаты дописывания
ХОБОД-2021. HDFS, MapReduce, YARN 11.03.21 http://gg.gg/hobod21-test1
ХОБОД-2021. SQL over BigData 18.03.21 http://gg.gg/hobod21-test2
ХОБОД-2021. Spark RDD & DF 01.04.21 http://gg.gg/hobod21-test3
ХОБОД-2021. Realtime & Kafka, Kafka Streams 13.05.21 http://gg.gg/hobod21-test4
ХОБОД-2021. NoSQL 20.05.21 http://gg.gg/hobod21-test5 не предусмотрено

В идеальном случае за контрольные можно получить 5 баллов.

В случае если вы не сможете написать КР в указанную дату по технической или другой уважительной причине, просьба заполнить форму на дописывание. После этого вы появитесь в таблице.

Дописывание состоится 20.05:

  • 17:00 для 1-го Quiz'a,
  • 17:15 для 2-го,
  • 17:30 для 3-го,
  • 17:45 для 4-го.
  • 5й Quiz пройдет в 18:35, дописывания у него нет.

Бонус

Бонус начисляется за:

  • активное участие в семинарах,
  • помощь коллегам в чате курса.

Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.

Экзамен

Экзамен состоится 17.06 в 10:00. Он будет проходить через Прокторинг.

Является необязательным.

  • вопросы по всему курсу,
  • 30 минут времени
  • возможна устная защита по окончанию 30 минут
  • Максимальная оценка: 2 балла.

Перезачет курса

Если вы хотите перпезачесть курс, просьба заполнить форму до 4.03.2021.

Курс PD-2018 (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.

Список рекомендуемых материалов

Основная

  1. Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
  2. Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
  3. Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.

Дополнительная

  1. Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
  2. Alex Holmes , "Hadoop in Practice", 2012
  3. Martin Fowler, "NoSQL", 2013
  4. Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
  5. Jonathan Leibiusky, "Getting Started with Storm", 2012
  6. Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
  7. Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
  8. Spark Core Programming. TutorialsPoint, 2015.
  9. Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
  10. Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
  11. Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
  12. Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.