Хранение и обработка больших объёмов данных весна 2025 — различия между версиями
(→Дедлайны по домашним заданиям) |
VeLKerr (обсуждение | вклад) (→Дедлайны по домашним заданиям) |
||
(не показано 9 промежуточных версий 2 участников) | |||
Строка 2: | Строка 2: | ||
* Семестр: 10 (5й курс) | * Семестр: 10 (5й курс) | ||
* Форма контроля: экзамен | * Форма контроля: экзамен | ||
− | + | * Дни и время занятий: четверг, лекция 17:05 - 18:30, семинар 18:35 - 20:00 | |
+ | |||
== Важные ссылки == | == Важные ссылки == | ||
− | * [https://docs.google.com/spreadsheets/d/ | + | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vQ8UUWKBHIvZM6FWiX4uwATgLcYNW77L8DdbgMseTA9xHaXzGxcEtZ1YzCsJGFr9BjXB08BFt9IV85c/pubhtml?gid=359301262&single=true План курса] |
* [https://t.me/+XeWTXxzq2fRmYzBi Чат курса] | * [https://t.me/+XeWTXxzq2fRmYzBi Чат курса] | ||
* [https://forms.gle/cRDuXJe4evLz9HSaA Регистрация на курс] | * [https://forms.gle/cRDuXJe4evLz9HSaA Регистрация на курс] | ||
− | * [https://docs.google.com/spreadsheets/d/ | + | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vRC_kYhMpdAnuFC5BWAFngSoycSQJSCSqkGxbEHpRHe2W6tWUyL3smXbDC5z3b_naUmJiOX1hDD1Lps/pubhtml?gid=915915854&single=true '''Таблица с оценками'''] |
− | * [https://docs.google.com/spreadsheets/d/ | + | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vRC_kYhMpdAnuFC5BWAFngSoycSQJSCSqkGxbEHpRHe2W6tWUyL3smXbDC5z3b_naUmJiOX1hDD1Lps/pubhtml?gid=2075695586&single=true '''Очередь проверки ДЗ'''] |
== Доступы == | == Доступы == | ||
Строка 16: | Строка 17: | ||
* [https://plvideo.ru/playlist?list=1G4f2UZTUkiS'''Видео занятий'''] | * [https://plvideo.ru/playlist?list=1G4f2UZTUkiS'''Видео занятий'''] | ||
* [https://drive.google.com/drive/folders/14N3sqp5zJs4bP6m84An3HSVNIsW-Qe02?usp=drive_link '''Слайды презентаций'''] | * [https://drive.google.com/drive/folders/14N3sqp5zJs4bP6m84An3HSVNIsW-Qe02?usp=drive_link '''Слайды презентаций'''] | ||
− | * [https://gitlab.com/hobod/hobod-practice Коды семинаров] | + | * [https://gitlab.atp-fivt.org/courses-public/bigdata/hobod2025 Коды семинаров 2025 г.] |
+ | * [https://gitlab.com/hobod/hobod-practice Коды семинаров до 2024 г.] | ||
=== Домашние задания === | === Домашние задания === | ||
Строка 36: | Строка 38: | ||
! Жёсткий deadline | ! Жёсткий deadline | ||
|- | |- | ||
− | |[https://docs.google.com/document/d/1PjGIcNOcRvkU5anC-PmQyXwDNVSZ0m47LG5NZQ8VaHA/edit?usp=drive_link MapReduce] || | + | |[https://docs.google.com/document/d/1PjGIcNOcRvkU5anC-PmQyXwDNVSZ0m47LG5NZQ8VaHA/edit?usp=drive_link MapReduce] || 23.03 || 30.03 |
|- | |- | ||
− | |[https://docs.google.com/document/d/1OFIe5kkdrfXJdknW8e1DfAly40_fkko2_PymACMpYmk/edit?usp=sharing Hive] || | + | |[https://docs.google.com/document/d/1OFIe5kkdrfXJdknW8e1DfAly40_fkko2_PymACMpYmk/edit?usp=sharing Hive] || 13.04 || 20.04 |
|- | |- | ||
− | |[https://docs.google.com/document/d/12DrsxmvoShqWBePQtvEz9wC2sVoYAtapp5BG3hVHgNQ/edit?usp=drive_link Spark] || | + | |[https://docs.google.com/document/d/12DrsxmvoShqWBePQtvEz9wC2sVoYAtapp5BG3hVHgNQ/edit?usp=drive_link Spark] || 20.04 ||27.04 |
|- | |- | ||
− | |[https://docs.google.com/document/d/1xAs-5NAM8zqISi7iWe3hHLNN46cZDEuRZJoIrAqr5Mw/edit?usp=drive_link RealTime & Kafka] || | + | |[https://docs.google.com/document/d/1xAs-5NAM8zqISi7iWe3hHLNN46cZDEuRZJoIrAqr5Mw/edit?usp=drive_link RealTime & Kafka] || 15.05 || 25.05. |
|- | |- | ||
− | |[https://docs.google.com/document/d/1GmfWacB33ACd7ms6Sb4TLOI7NhZ6pM0qev2Gd-_1fPg/edit?usp=drive_link HBase / Casssandra] || | + | |[https://docs.google.com/document/d/1GmfWacB33ACd7ms6Sb4TLOI7NhZ6pM0qev2Gd-_1fPg/edit?usp=drive_link HBase / Casssandra] || 01.06 || 08.06 |
|- | |- | ||
− | |[https://docs.google.com/document/d/1uZ9RZKXGhDi7jLFjm9guqu5RhxwSlKUtKH6BKADEuWI/edit?usp=drive_link Google Spanner] || | + | |[https://docs.google.com/document/d/1uZ9RZKXGhDi7jLFjm9guqu5RhxwSlKUtKH6BKADEuWI/edit?usp=drive_link Google Spanner] || 08.06 || 15.06 |
|} | |} | ||
Строка 55: | Строка 57: | ||
* [https://drive.google.com/file/d/1gdGDUTavS34dd2Odw11eK89v7WLPGt_s/view?usp=drive_link видео] | * [https://drive.google.com/file/d/1gdGDUTavS34dd2Odw11eK89v7WLPGt_s/view?usp=drive_link видео] | ||
− | Сдать ДЗ со штрафом, возможно до | + | Сдать ДЗ со штрафом, возможно до 22.06.2025 |
=== Бонус === | === Бонус === | ||
Строка 64: | Строка 66: | ||
=== Экзамен === | === Экзамен === | ||
− | Экзамен состоится ''' | + | Экзамен состоится '''XX.06.2025'''. Он будет проходить через Прокторинг. |
Является '''необязательным'''. | Является '''необязательным'''. |
Текущая версия на 15:32, 19 марта 2025
Содержание
[убрать]Общие сведения
- Семестр: 10 (5й курс)
- Форма контроля: экзамен
- Дни и время занятий: четверг, лекция 17:05 - 18:30, семинар 18:35 - 20:00
Важные ссылки
Доступы
По вопросам доступов и работы Gitlab-сервера пишите в форму или на почту servers@atp-fivt.org.
Материалы
Домашние задания
Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.
Планируется 6 домашних заданий.
- Каждое оценивается максимум в 1,5 балла.
- За сдачу позже мягкого дедлайна - 50%
- За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 29.06, 23:59.
5 мини-тестов (~10 мин.) на семинарах
- в сумме 5 баллов
Дедлайны по домашним заданиям
Задание | Мягкий deadline | Жёсткий deadline |
---|---|---|
MapReduce | 23.03 | 30.03 |
Hive | 13.04 | 20.04 |
Spark | 20.04 | 27.04 |
RealTime & Kafka | 15.05 | 25.05. |
HBase / Casssandra | 01.06 | 08.06 |
Google Spanner | 08.06 | 15.06 |
В идеальном случае за домашние задания можно получить 9 баллов.
Как сдавать ДЗ:
Сдать ДЗ со штрафом, возможно до 22.06.2025
Бонус
Бонус начисляется за:
- активное участие в семинарах,
- помощь коллегам в чате курса.
Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.
Экзамен
Экзамен состоится XX.06.2025. Он будет проходить через Прокторинг.
Является необязательным.
- вопросы по всему курсу
- письменная работа (6 вопросов по всему курсу) на 45 мин
- возможна устная защита по окончанию 30 минут
- максимальная оценка: 2 балла.
Итого
- идеальный вариант: 9 + 5 + 2 + 1 = 17 из 10
- но надо сделать хоть 1 ДЗ.
Перезачет курса
Если вы хотите перпезачесть курс, просьба заполнить форму до 28.02.2025.
Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
Дописывание Quiz'ов
В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, форму.
Список рекомендуемых материалов
Основная
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная
- Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
- Alex Holmes , "Hadoop in Practice", 2012
- Martin Fowler, "NoSQL", 2013
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
- Jonathan Leibiusky, "Getting Started with Storm", 2012
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
- Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.