HOBOD 2023 — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Важные ссылки)
Строка 22: Строка 22:
 
* Слайды презентаций
 
* Слайды презентаций
 
* Коды семинаров
 
* Коды семинаров
 +
 +
 +
=== Домашние задания ===
 +
'''Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.'''
 +
 +
Планируется 6 домашних заданий.
 +
* Каждое оценивается максимум в 1,5 балла.
 +
* За сдачу позже мягкого дедлайна - 50%
 +
* За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до экзамена.
 +
 +
==== Дедлайны по домашкам ====
 +
{|  class="wikitable"
 +
|-
 +
! Домашка
 +
! Мягкий deadline
 +
! Жёсткий deadline
 +
|-
 +
|[https://docs.google.com/document/d/1FViOqe_szEp1idZ3mJ0yUe1W7tZEgo1Cmp74JC5_ky0 MapReduce] || -- || --
 +
|-
 +
|[https://docs.google.com/document/d/14NuJRSHoFFj8ND2zOM_ZfKXgahstmz4PMiUUCVQFG_o Hive] || -- || --
 +
|-
 +
|[https://docs.google.com/document/d/1OP8x8lPFCHcDBbxZ-Ny7W1uagrCzk8Ez1OWCTONzcLQ Spark] || -- ||--
 +
|-
 +
|[https://docs.google.com/document/d/1fljwR-DKlo91NZIHIgMxtVqaTTaWh5-MzJeDBTO3bAw RealTime & Kafka] || -- || --
 +
|-
 +
|[https://docs.google.com/document/d/1Js0C2aSa-acffSIANZc-I7nc4147N-92suw8vr9HUrw HBase / Casssandra] || -- || --
 +
|-
 +
|[https://docs.google.com/document/d/1sY9ZCztEzbqLQSjOGtsJ8vQQohrk4ZgyNcN122D-wMc Google Spanner] || -- || --
 +
|}
 +
 +
В идеальном случае за домашние задания можно получить '''9 баллов'''.
 +
 +
=== Бонус ===
 +
Бонус начисляется за:
 +
* активное участие в семинарах,
 +
* помощь коллегам в чате курса.
 +
Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.
 +
 +
=== Экзамен ===
 +
Экзамен состоится '''Дата и время уточняется'''. Он будет проходить через Прокторинг.
 +
 +
Является '''необязательным'''.
 +
* вопросы по всему курсу
 +
* 30 минут времени
 +
* возможна устная защита по окончанию 30 минут
 +
* максимальная оценка: 2 балла.
 +
 +
=== Перезачет курса ===
 +
Если вы хотите перпезачесть курс, просьба заполнить [https://docs.google.com/forms/d/1aVgv1MPgd5Zh6AMGWgKAW6-6E2zF9-1UefTQAAwVGxg/prefill форму] до '''29.06.2023'''.
 +
 +
Курс PD-2019 (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
 +
 +
= Список рекомендуемых материалов =
 +
=== Основная ===
 +
# Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale,  Publisher: O'Reilly, Media Release Date: April 2015
 +
# Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
 +
# Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
 +
=== Дополнительная ===
 +
# Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
 +
# Alex Holmes , "Hadoop in Practice", 2012
 +
# Martin Fowler, "NoSQL", 2013
 +
# Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
 +
# Jonathan Leibiusky, "Getting Started with Storm", 2012
 +
# Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
 +
# Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
 +
# Spark Core Programming. TutorialsPoint, 2015.
 +
# Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
 +
# Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
 +
# Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
 +
# Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.
 +
 +
* '''[https://docs.google.com/spreadsheets/d/1X7lhS8aYlyhX9gb1yT6t3A8K7OfCA-x0GJRfMcykDJk/edit?usp=sharing Интересные ссылки]'''

Версия 02:20, 2 декабря 2022

Общие сведения

  • Семестр: 10 (5й курс)
  • Форма контроля: экзамен

Важные ссылки

Технические ссылки

Сервер Gitlab

На данный момент сервер находится по адресу https://gitlab2.atp-fivt.org/, на котором наблюдаются проблемы с сертификатом SSL.

Если вы наблюдаете проблему
 fatal: unable to access 'https://gitlab2.atp-fivt.org/...': server certificate verification failed. CAfile: /etc/ssl/certs/ca-certificates.crt CRLfile: none 
, временно отключите проверку сертификата
git config --global http.sslVerify "false"
.

Материалы

  • Видео занятий
  • Слайды презентаций
  • Коды семинаров


Домашние задания

Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.

Планируется 6 домашних заданий.

  • Каждое оценивается максимум в 1,5 балла.
  • За сдачу позже мягкого дедлайна - 50%
  • За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до экзамена.

Дедлайны по домашкам

Домашка Мягкий deadline Жёсткий deadline
MapReduce -- --
Hive -- --
Spark -- --
RealTime & Kafka -- --
HBase / Casssandra -- --
Google Spanner -- --

В идеальном случае за домашние задания можно получить 9 баллов.

Бонус

Бонус начисляется за:

  • активное участие в семинарах,
  • помощь коллегам в чате курса.

Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.

Экзамен

Экзамен состоится Дата и время уточняется. Он будет проходить через Прокторинг.

Является необязательным.

  • вопросы по всему курсу
  • 30 минут времени
  • возможна устная защита по окончанию 30 минут
  • максимальная оценка: 2 балла.

Перезачет курса

Если вы хотите перпезачесть курс, просьба заполнить форму до 29.06.2023.

Курс PD-2019 (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.

Список рекомендуемых материалов

Основная

  1. Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
  2. Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
  3. Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.

Дополнительная

  1. Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
  2. Alex Holmes , "Hadoop in Practice", 2012
  3. Martin Fowler, "NoSQL", 2013
  4. Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
  5. Jonathan Leibiusky, "Getting Started with Storm", 2012
  6. Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
  7. Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
  8. Spark Core Programming. TutorialsPoint, 2015.
  9. Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
  10. Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
  11. Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
  12. Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.