Хранение и обработка больших объёмов данных весна 2025 — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Новая страница: «Test»)
 
(Дедлайны по домашним заданиям)
 
(не показана 21 промежуточная версия 2 участников)
Строка 1: Строка 1:
Test
+
= Общие сведения =
 +
* Семестр: 10 (5й курс)
 +
* Форма контроля: экзамен
 +
* Дни и время занятий: четверг, лекция 17:05 - 18:30, семинар 18:35 - 20:00
 +
 
 +
== Важные ссылки ==
 +
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vQ8UUWKBHIvZM6FWiX4uwATgLcYNW77L8DdbgMseTA9xHaXzGxcEtZ1YzCsJGFr9BjXB08BFt9IV85c/pubhtml?gid=359301262&single=true План курса]
 +
* [https://t.me/+XeWTXxzq2fRmYzBi Чат курса]
 +
* [https://forms.gle/cRDuXJe4evLz9HSaA Регистрация на курс]
 +
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRC_kYhMpdAnuFC5BWAFngSoycSQJSCSqkGxbEHpRHe2W6tWUyL3smXbDC5z3b_naUmJiOX1hDD1Lps/pubhtml?gid=915915854&single=true '''Таблица с оценками''']
 +
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRC_kYhMpdAnuFC5BWAFngSoycSQJSCSqkGxbEHpRHe2W6tWUyL3smXbDC5z3b_naUmJiOX1hDD1Lps/pubhtml?gid=2075695586&single=true '''Очередь проверки ДЗ''']
 +
 
 +
== Доступы ==
 +
По вопросам доступов и работы Gitlab-сервера пишите в [https://docs.google.com/forms/d/e/1FAIpQLSd_JxfMFOcWdaXKLC8sydJlDtwRG-B6Puiia_h3GqORXEDUKA/viewform форму] или на почту servers@atp-fivt.org.
 +
 
 +
== Материалы ==
 +
* [https://plvideo.ru/playlist?list=1G4f2UZTUkiS'''Видео занятий''']
 +
* [https://drive.google.com/drive/folders/14N3sqp5zJs4bP6m84An3HSVNIsW-Qe02?usp=drive_link '''Слайды презентаций''']
 +
* [https://gitlab.atp-fivt.org/courses-public/bigdata/hobod2025 Коды семинаров 2025 г.]
 +
* [https://gitlab.com/hobod/hobod-practice Коды семинаров до 2024 г.]
 +
 
 +
=== Домашние задания ===
 +
'''Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.'''
 +
 
 +
Планируется 6 домашних заданий.
 +
* Каждое оценивается максимум в 1,5 балла.
 +
* За сдачу позже мягкого дедлайна - 50%
 +
* За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 29.06, 23:59.
 +
 
 +
5 мини-тестов (~10 мин.) на семинарах
 +
* в сумме 5 баллов
 +
 
 +
==== Дедлайны по домашним заданиям ====
 +
{|  class="wikitable"
 +
|-
 +
! Задание
 +
! Мягкий deadline
 +
! Жёсткий deadline
 +
|-
 +
|[https://docs.google.com/document/d/1PjGIcNOcRvkU5anC-PmQyXwDNVSZ0m47LG5NZQ8VaHA/edit?usp=drive_link MapReduce] || 23.03 || 30.03
 +
|-
 +
|[https://docs.google.com/document/d/1OFIe5kkdrfXJdknW8e1DfAly40_fkko2_PymACMpYmk/edit?usp=sharing Hive] || 13.04 || 20.04
 +
|-
 +
|[https://docs.google.com/document/d/12DrsxmvoShqWBePQtvEz9wC2sVoYAtapp5BG3hVHgNQ/edit?usp=drive_link Spark] || 20.04 ||27.04
 +
|-
 +
|[https://docs.google.com/document/d/1xAs-5NAM8zqISi7iWe3hHLNN46cZDEuRZJoIrAqr5Mw/edit?usp=drive_link RealTime & Kafka] || 15.05 || 25.05.
 +
|-
 +
|[https://docs.google.com/document/d/1GmfWacB33ACd7ms6Sb4TLOI7NhZ6pM0qev2Gd-_1fPg/edit?usp=drive_link HBase / Casssandra] || 01.06 || 08.06
 +
|-
 +
|[https://docs.google.com/document/d/1uZ9RZKXGhDi7jLFjm9guqu5RhxwSlKUtKH6BKADEuWI/edit?usp=drive_link Google Spanner] || 08.06 || 15.06
 +
|}
 +
 
 +
В идеальном случае за домашние задания можно получить '''9 баллов'''.
 +
 
 +
Как сдавать ДЗ:
 +
* [https://docs.google.com/presentation/d/1eDxnTeBWSB1OrA3BwEUa2vJAJm3_OJMuoRxyA13RzTY/edit#slide=id.g4f2997e0e1_1_24 презентация]
 +
* [https://drive.google.com/file/d/1gdGDUTavS34dd2Odw11eK89v7WLPGt_s/view?usp=drive_link видео]
 +
 
 +
Сдать ДЗ со штрафом, возможно до 22.06.2025
 +
 
 +
=== Бонус ===
 +
Бонус начисляется за:
 +
* активное участие в семинарах,
 +
* помощь коллегам в чате курса.
 +
Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.
 +
 
 +
=== Экзамен ===
 +
Экзамен состоится '''XX.06.2025'''. Он будет проходить через Прокторинг.
 +
 
 +
Является '''необязательным'''.
 +
* вопросы по всему курсу
 +
* письменная работа (6 вопросов по всему курсу) на 45 мин
 +
* возможна устная защита по окончанию 30 минут
 +
* максимальная оценка: 2 балла.
 +
 
 +
Итого
 +
*идеальный вариант: 9 + 5 + 2 + 1 = 17 из 10
 +
*но надо сделать хоть 1 ДЗ.
 +
 
 +
=== Перезачет курса ===
 +
Если вы хотите перпезачесть курс, просьба заполнить [https://forms.gle/mhoxgwrcmXc3Wq728 форму] до '''28.02.2025'''.
 +
 
 +
Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
 +
 
 +
=== Дописывание Quiz'ов  ===
 +
В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, [https://forms.gle/qdn5gLyFWn245GyP8 форму.]
 +
 
 +
= Список рекомендуемых материалов =
 +
=== Основная ===
 +
# Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale,  Publisher: O'Reilly, Media Release Date: April 2015
 +
# Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
 +
# Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
 +
=== Дополнительная ===
 +
# Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
 +
# Alex Holmes , "Hadoop in Practice", 2012
 +
# Martin Fowler, "NoSQL", 2013
 +
# Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
 +
# Jonathan Leibiusky, "Getting Started with Storm", 2012
 +
# Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
 +
# Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
 +
# Spark Core Programming. TutorialsPoint, 2015.
 +
# Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
 +
# Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
 +
# Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
 +
# Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.
 +
 
 +
* '''[https://docs.google.com/spreadsheets/d/1X7lhS8aYlyhX9gb1yT6t3A8K7OfCA-x0GJRfMcykDJk/edit?usp=sharing Интересные ссылки]'''

Текущая версия на 15:32, 19 марта 2025

Общие сведения

  • Семестр: 10 (5й курс)
  • Форма контроля: экзамен
  • Дни и время занятий: четверг, лекция 17:05 - 18:30, семинар 18:35 - 20:00

Важные ссылки

Доступы

По вопросам доступов и работы Gitlab-сервера пишите в форму или на почту servers@atp-fivt.org.

Материалы

Домашние задания

Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.

Планируется 6 домашних заданий.

  • Каждое оценивается максимум в 1,5 балла.
  • За сдачу позже мягкого дедлайна - 50%
  • За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 29.06, 23:59.

5 мини-тестов (~10 мин.) на семинарах

  • в сумме 5 баллов

Дедлайны по домашним заданиям

Задание Мягкий deadline Жёсткий deadline
MapReduce 23.03 30.03
Hive 13.04 20.04
Spark 20.04 27.04
RealTime & Kafka 15.05 25.05.
HBase / Casssandra 01.06 08.06
Google Spanner 08.06 15.06

В идеальном случае за домашние задания можно получить 9 баллов.

Как сдавать ДЗ:

Сдать ДЗ со штрафом, возможно до 22.06.2025

Бонус

Бонус начисляется за:

  • активное участие в семинарах,
  • помощь коллегам в чате курса.

Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.

Экзамен

Экзамен состоится XX.06.2025. Он будет проходить через Прокторинг.

Является необязательным.

  • вопросы по всему курсу
  • письменная работа (6 вопросов по всему курсу) на 45 мин
  • возможна устная защита по окончанию 30 минут
  • максимальная оценка: 2 балла.

Итого

  • идеальный вариант: 9 + 5 + 2 + 1 = 17 из 10
  • но надо сделать хоть 1 ДЗ.

Перезачет курса

Если вы хотите перпезачесть курс, просьба заполнить форму до 28.02.2025.

Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.

Дописывание Quiz'ов

В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, форму.

Список рекомендуемых материалов

Основная

  1. Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
  2. Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
  3. Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.

Дополнительная

  1. Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
  2. Alex Holmes , "Hadoop in Practice", 2012
  3. Martin Fowler, "NoSQL", 2013
  4. Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
  5. Jonathan Leibiusky, "Getting Started with Storm", 2012
  6. Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
  7. Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
  8. Spark Core Programming. TutorialsPoint, 2015.
  9. Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
  10. Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
  11. Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
  12. Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.