Хранение и обработка больших объёмов данных весна 2026 — различия между версиями
(Новая страница: «= Общие сведения = * Семестр: 10 (5й курс) * Форма контроля: экзамен * Дни и время занятий: четв…») |
(→Материалы) |
||
| (не показано 13 промежуточных версий этого же участника) | |||
| Строка 6: | Строка 6: | ||
== Важные ссылки == | == Важные ссылки == | ||
* [https://docs.google.com/spreadsheets/d/e/2PACX-1vRPAv4wjg6cXCDdNSUkm7G3LFuBW2C_n53N_0cy0mq5TTz0k-9UJgTMN8BYELxYW1TJ341da9WU3zTD/pubhtml?gid=359301262&single=true План курса] | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vRPAv4wjg6cXCDdNSUkm7G3LFuBW2C_n53N_0cy0mq5TTz0k-9UJgTMN8BYELxYW1TJ341da9WU3zTD/pubhtml?gid=359301262&single=true План курса] | ||
| − | * [https://t.me/+ | + | * [https://t.me/+KR6lGaiw_Pk1OTZi Чат курса] |
| − | * [https://forms.gle/ | + | * [https://forms.gle/N5PuLC5c7ea64DS56 Регистрация на курс] |
| − | * [https://docs.google.com/spreadsheets/d/e/2PACX- | + | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vRkixkvsVS_xDhsFjScBIouKAjoCKhTJhEyTYgOStrG8SJq3wOZHqagGXD9PlgsWhhnX1s4F9-HgxGW/pubhtml?gid=915915854&single=true '''Таблица с оценками'''] |
| − | * [https://docs.google.com/spreadsheets/d/e/2PACX- | + | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vRkixkvsVS_xDhsFjScBIouKAjoCKhTJhEyTYgOStrG8SJq3wOZHqagGXD9PlgsWhhnX1s4F9-HgxGW/pubhtml?gid=2075695586&single=true '''Очередь проверки ДЗ'''] |
== Доступы == | == Доступы == | ||
| Строка 15: | Строка 15: | ||
== Материалы == | == Материалы == | ||
| − | * [https:// | + | * [https://drive.google.com/drive/folders/1_4PB9PQWmopq1hwF39MTKXpduaqCtbi8?usp=sharing '''Видео занятий'''] |
| − | * [https://drive.google.com/drive/folders/ | + | * [https://dzen.ru/id/6914713ea9b3de7cf99c3859 '''Видео занятий на ДЗЕН'''] |
| − | * [https://gitlab.atp-fivt.org/courses-public/bigdata/ | + | * [https://drive.google.com/drive/folders/1KnNhe8KTndZKjBH5YhulF3ch9l-cxIo3?usp=drive_link '''Слайды презентаций'''] |
| − | * [https://gitlab.com/hobod/hobod-practice Коды семинаров до | + | * [https://gitlab.atp-fivt.org/courses-public/bigdata/hobod2026 Коды семинаров 2026 г.] |
| + | * [https://gitlab.com/hobod/hobod-practice Коды семинаров до 2025 г.] | ||
=== Домашние задания === | === Домашние задания === | ||
| Строка 26: | Строка 27: | ||
* Каждое оценивается максимум в 1,5 балла. | * Каждое оценивается максимум в 1,5 балла. | ||
* За сдачу позже мягкого дедлайна - 50% | * За сдачу позже мягкого дедлайна - 50% | ||
| − | * За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до | + | * За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 26.06, 23:59. |
=== Мини-тесты === | === Мини-тесты === | ||
| Строка 39: | Строка 40: | ||
! Жёсткий deadline | ! Жёсткий deadline | ||
|- | |- | ||
| − | |[https://docs.google.com/document/d/ | + | |[https://docs.google.com/document/d/1IU5vQU5DVHQkI07uWQxaNGooyHl4dl5TzLXFaWcqHGY/edit?usp=drive_link MapReduce] || 22.03 || 29.03 |
|- | |- | ||
| − | |[https://docs.google.com/document/d/ | + | |[https://docs.google.com/document/d/1rapw2j1m4xt6d2DkVSTy6kRhxWVPFvZR_SqS3BUFYT8/edit?usp=drive_link Hive] || 12.04 || 19.04 |
|- | |- | ||
| − | |[https://docs.google.com/document/d/ | + | |[https://docs.google.com/document/d/1o5QVjeiKDfDk9zwDxwTMGjHDIDFqRpsmhUg_nR6I4hI/edit?usp=drive_link Spark] || 19.04 ||26.04 |
|- | |- | ||
| − | |[https://docs.google.com/document/d/ | + | |[https://docs.google.com/document/d/1cTClqFFuMATPorrJPM12APk7RbMdm_emvrhGPjimpW0/edit?usp=drive_link RealTime & Kafka] || 15.05 || 24.05. |
|- | |- | ||
| − | |[https://docs.google.com/document/d/ | + | |[https://docs.google.com/document/d/1gidkon_9Mjmnjz2T5E6r3XBTvOYPe76Jut3hcden9Is/edit?usp=drive_link HBase / Casssandra] || 31.05 || 07.06 |
|- | |- | ||
| − | |[https://docs.google.com/document/d/ | + | |[https://docs.google.com/document/d/1lwPdRx85FS3eWJEq4FPkeQELwqqJSyWgBbap2xZRW70/edit?usp=drive_link Google Spanner] || 07.06 || 14.06 |
|} | |} | ||
| Строка 65: | Строка 66: | ||
=== Экзамен === | === Экзамен === | ||
| − | Экзамен состоится ''' | + | Экзамен состоится '''ХХ.06.2025'''. Он будет проходить через Прокторинг. |
Является '''необязательным'''. | Является '''необязательным'''. | ||
| Строка 78: | Строка 79: | ||
=== Перезачет курса === | === Перезачет курса === | ||
| − | Если вы хотите перпезачесть курс, просьба заполнить [https://forms.gle/ | + | Если вы хотите перпезачесть курс, просьба заполнить [https://forms.gle/rc9SQ6HRT6aXa5AR9 форму] до '''28.02.2026'''. |
Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением. | Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением. | ||
=== Дописывание Quiz'ов === | === Дописывание Quiz'ов === | ||
| − | В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, [https://forms.gle/ | + | В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, [https://forms.gle/1Au5AkCmLnadDW816 форму.] до 25.06, 23:59. |
| − | Дописывание состоится | + | Дописывание состоится 26.06 начиная с 10:00. |
{| class="wikitable" | {| class="wikitable" | ||
Текущая версия на 14:12, 14 января 2026
Содержание
Общие сведения
- Семестр: 10 (5й курс)
- Форма контроля: экзамен
- Дни и время занятий: четверг, лекция 17:05 - 18:30, семинар 18:35 - 20:00
Важные ссылки
Доступы
По вопросам доступов и работы Gitlab-сервера пишите в форму или на почту servers@atp-fivt.org.
Материалы
- Видео занятий
- Видео занятий на ДЗЕН
- Слайды презентаций
- Коды семинаров 2026 г.
- Коды семинаров до 2025 г.
Домашние задания
Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.
Планируется 6 домашних заданий.
- Каждое оценивается максимум в 1,5 балла.
- За сдачу позже мягкого дедлайна - 50%
- За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 26.06, 23:59.
Мини-тесты
4 мини-тестов (~10 мин.) на семинарах
- в сумме 5 баллов
Дедлайны по домашним заданиям
| Задание | Мягкий deadline | Жёсткий deadline |
|---|---|---|
| MapReduce | 22.03 | 29.03 |
| Hive | 12.04 | 19.04 |
| Spark | 19.04 | 26.04 |
| RealTime & Kafka | 15.05 | 24.05. |
| HBase / Casssandra | 31.05 | 07.06 |
| Google Spanner | 07.06 | 14.06 |
В идеальном случае за домашние задания можно получить 9 баллов.
Как сдавать ДЗ:
Бонус
Бонус начисляется за:
- активное участие в семинарах,
- помощь коллегам в чате курса.
Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.
Экзамен
Экзамен состоится ХХ.06.2025. Он будет проходить через Прокторинг.
Является необязательным.
- вопросы по всему курсу
- Тест по всему курсу на 30 мин.
- возможна устная защита по окончанию 30 минут
- максимальная оценка: 2 балла.
Итого
- идеальный вариант: 9 + 5 + 2 + 1 = 17 из 10
- но надо сделать хоть 1 ДЗ.
Перезачет курса
Если вы хотите перпезачесть курс, просьба заполнить форму до 28.02.2026.
Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
Дописывание Quiz'ов
В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, форму. до 25.06, 23:59.
Дописывание состоится 26.06 начиная с 10:00.
| Тест | Время начала |
|---|---|
| HDFS & MapReduce | 10:00 |
| SQL over BigData | 10:15 |
| Spark | 10:30 |
| Spark streaming, Kafka & NoSQL over BigData | 10:40 |
Список рекомендуемых материалов
Основная
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная
- Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
- Alex Holmes , "Hadoop in Practice", 2012
- Martin Fowler, "NoSQL", 2013
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
- Jonathan Leibiusky, "Getting Started with Storm", 2012
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
- Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.