Хранение и обработка больших объёмов данных весна 2026 — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Важные ссылки)
(Материалы)
 
(не показано 12 промежуточных версий этого же участника)
Строка 6: Строка 6:
 
== Важные ссылки ==
 
== Важные ссылки ==
 
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRPAv4wjg6cXCDdNSUkm7G3LFuBW2C_n53N_0cy0mq5TTz0k-9UJgTMN8BYELxYW1TJ341da9WU3zTD/pubhtml?gid=359301262&single=true План курса]
 
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRPAv4wjg6cXCDdNSUkm7G3LFuBW2C_n53N_0cy0mq5TTz0k-9UJgTMN8BYELxYW1TJ341da9WU3zTD/pubhtml?gid=359301262&single=true План курса]
* [https://t.me/+XeWTXxzq2fRmYzBi Чат курса]
+
* [https://t.me/+KR6lGaiw_Pk1OTZi Чат курса]
 
* [https://forms.gle/N5PuLC5c7ea64DS56 Регистрация на курс]
 
* [https://forms.gle/N5PuLC5c7ea64DS56 Регистрация на курс]
 
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRkixkvsVS_xDhsFjScBIouKAjoCKhTJhEyTYgOStrG8SJq3wOZHqagGXD9PlgsWhhnX1s4F9-HgxGW/pubhtml?gid=915915854&single=true '''Таблица с оценками''']
 
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRkixkvsVS_xDhsFjScBIouKAjoCKhTJhEyTYgOStrG8SJq3wOZHqagGXD9PlgsWhhnX1s4F9-HgxGW/pubhtml?gid=915915854&single=true '''Таблица с оценками''']
Строка 15: Строка 15:
  
 
== Материалы ==
 
== Материалы ==
* [https://plvideo.ru/playlist?list=1G4f2UZTUkiS'''Видео занятий''']
+
* [https://drive.google.com/drive/folders/1_4PB9PQWmopq1hwF39MTKXpduaqCtbi8?usp=sharing '''Видео занятий''']
* [https://drive.google.com/drive/folders/14N3sqp5zJs4bP6m84An3HSVNIsW-Qe02?usp=drive_link '''Слайды презентаций''']
+
* [https://dzen.ru/id/6914713ea9b3de7cf99c3859 '''Видео занятий на ДЗЕН''']
* [https://gitlab.atp-fivt.org/courses-public/bigdata/hobod2025 Коды семинаров 2025 г.]
+
* [https://drive.google.com/drive/folders/1KnNhe8KTndZKjBH5YhulF3ch9l-cxIo3?usp=drive_link '''Слайды презентаций''']
* [https://gitlab.com/hobod/hobod-practice Коды семинаров до 2024 г.]
+
* [https://gitlab.atp-fivt.org/courses-public/bigdata/hobod2026 Коды семинаров 2026 г.]
 +
* [https://gitlab.com/hobod/hobod-practice Коды семинаров до 2025 г.]
  
 
=== Домашние задания ===
 
=== Домашние задания ===
Строка 26: Строка 27:
 
* Каждое оценивается максимум в 1,5 балла.
 
* Каждое оценивается максимум в 1,5 балла.
 
* За сдачу позже мягкого дедлайна - 50%
 
* За сдачу позже мягкого дедлайна - 50%
* За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 29.06, 23:59.
+
* За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 26.06, 23:59.
  
 
=== Мини-тесты ===
 
=== Мини-тесты ===
Строка 39: Строка 40:
 
! Жёсткий deadline
 
! Жёсткий deadline
 
|-
 
|-
|[https://docs.google.com/document/d/1PjGIcNOcRvkU5anC-PmQyXwDNVSZ0m47LG5NZQ8VaHA/edit?usp=drive_link MapReduce] || 23.03 || 30.03
+
|[https://docs.google.com/document/d/1IU5vQU5DVHQkI07uWQxaNGooyHl4dl5TzLXFaWcqHGY/edit?usp=drive_link MapReduce] || 22.03 || 29.03
 
|-
 
|-
|[https://docs.google.com/document/d/1OFIe5kkdrfXJdknW8e1DfAly40_fkko2_PymACMpYmk/edit?usp=sharing Hive] || 13.04 || 20.04
+
|[https://docs.google.com/document/d/1rapw2j1m4xt6d2DkVSTy6kRhxWVPFvZR_SqS3BUFYT8/edit?usp=drive_link Hive] || 12.04 || 19.04
 
|-
 
|-
|[https://docs.google.com/document/d/12DrsxmvoShqWBePQtvEz9wC2sVoYAtapp5BG3hVHgNQ/edit?usp=drive_link Spark] || 20.04 ||27.04
+
|[https://docs.google.com/document/d/1o5QVjeiKDfDk9zwDxwTMGjHDIDFqRpsmhUg_nR6I4hI/edit?usp=drive_link Spark] || 19.04 ||26.04
 
|-
 
|-
|[https://docs.google.com/document/d/1xAs-5NAM8zqISi7iWe3hHLNN46cZDEuRZJoIrAqr5Mw/edit?usp=drive_link RealTime & Kafka] || 15.05 || 25.05.
+
|[https://docs.google.com/document/d/1cTClqFFuMATPorrJPM12APk7RbMdm_emvrhGPjimpW0/edit?usp=drive_link RealTime & Kafka] || 15.05 || 24.05.
 
|-
 
|-
|[https://docs.google.com/document/d/1GmfWacB33ACd7ms6Sb4TLOI7NhZ6pM0qev2Gd-_1fPg/edit?usp=drive_link HBase / Casssandra] || 01.06 || 08.06
+
|[https://docs.google.com/document/d/1gidkon_9Mjmnjz2T5E6r3XBTvOYPe76Jut3hcden9Is/edit?usp=drive_link HBase / Casssandra] || 31.05 || 07.06
 
|-
 
|-
|[https://docs.google.com/document/d/1uZ9RZKXGhDi7jLFjm9guqu5RhxwSlKUtKH6BKADEuWI/edit?usp=drive_link Google Spanner] || 08.06 || 15.06
+
|[https://docs.google.com/document/d/1lwPdRx85FS3eWJEq4FPkeQELwqqJSyWgBbap2xZRW70/edit?usp=drive_link Google Spanner] || 07.06 || 14.06
 
|}
 
|}
  
Строка 65: Строка 66:
  
 
=== Экзамен ===
 
=== Экзамен ===
Экзамен состоится '''30.06.2025'''. Он будет проходить через Прокторинг.
+
Экзамен состоится '''ХХ.06.2025'''. Он будет проходить через Прокторинг.
  
 
Является '''необязательным'''.
 
Является '''необязательным'''.
Строка 78: Строка 79:
  
 
=== Перезачет курса ===
 
=== Перезачет курса ===
Если вы хотите перпезачесть курс, просьба заполнить [https://forms.gle/mhoxgwrcmXc3Wq728 форму] до '''28.02.2025'''.
+
Если вы хотите перпезачесть курс, просьба заполнить [https://forms.gle/rc9SQ6HRT6aXa5AR9 форму] до '''28.02.2026'''.
  
 
Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
 
Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
  
 
=== Дописывание Quiz'ов  ===
 
=== Дописывание Quiz'ов  ===
В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, [https://forms.gle/qdn5gLyFWn245GyP8 форму.] до 27.06, 23:59.
+
В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, [https://forms.gle/1Au5AkCmLnadDW816 форму.] до 25.06, 23:59.
  
Дописывание состоится 29.06 начиная с 10:00.
+
Дописывание состоится 26.06 начиная с 10:00.
  
 
{|  class="wikitable"
 
{|  class="wikitable"

Текущая версия на 14:12, 14 января 2026

Общие сведения

  • Семестр: 10 (5й курс)
  • Форма контроля: экзамен
  • Дни и время занятий: четверг, лекция 17:05 - 18:30, семинар 18:35 - 20:00

Важные ссылки

Доступы

По вопросам доступов и работы Gitlab-сервера пишите в форму или на почту servers@atp-fivt.org.

Материалы

Домашние задания

Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.

Планируется 6 домашних заданий.

  • Каждое оценивается максимум в 1,5 балла.
  • За сдачу позже мягкого дедлайна - 50%
  • За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 26.06, 23:59.

Мини-тесты

4 мини-тестов (~10 мин.) на семинарах

  • в сумме 5 баллов

Дедлайны по домашним заданиям

Задание Мягкий deadline Жёсткий deadline
MapReduce 22.03 29.03
Hive 12.04 19.04
Spark 19.04 26.04
RealTime & Kafka 15.05 24.05.
HBase / Casssandra 31.05 07.06
Google Spanner 07.06 14.06

В идеальном случае за домашние задания можно получить 9 баллов.

Как сдавать ДЗ:

Бонус

Бонус начисляется за:

  • активное участие в семинарах,
  • помощь коллегам в чате курса.

Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.

Экзамен

Экзамен состоится ХХ.06.2025. Он будет проходить через Прокторинг.

Является необязательным.

  • вопросы по всему курсу
  • Тест по всему курсу на 30 мин.
  • возможна устная защита по окончанию 30 минут
  • максимальная оценка: 2 балла.

Итого

  • идеальный вариант: 9 + 5 + 2 + 1 = 17 из 10
  • но надо сделать хоть 1 ДЗ.

Перезачет курса

Если вы хотите перпезачесть курс, просьба заполнить форму до 28.02.2026.

Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.

Дописывание Quiz'ов

В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, форму. до 25.06, 23:59.

Дописывание состоится 26.06 начиная с 10:00.

Тест Время начала
HDFS & MapReduce 10:00
SQL over BigData 10:15
Spark 10:30
Spark streaming, Kafka & NoSQL over BigData 10:40

Список рекомендуемых материалов

Основная

  1. Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
  2. Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
  3. Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.

Дополнительная

  1. Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
  2. Alex Holmes , "Hadoop in Practice", 2012
  3. Martin Fowler, "NoSQL", 2013
  4. Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
  5. Jonathan Leibiusky, "Getting Started with Storm", 2012
  6. Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
  7. Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
  8. Spark Core Programming. TutorialsPoint, 2015.
  9. Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
  10. Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
  11. Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
  12. Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.