Хранение и обработка больших объёмов данных весна 2025 — различия между версиями
(Новая страница: «Test») |
VeLKerr (обсуждение | вклад) (→Дедлайны по домашним заданиям) |
||
(не показана 21 промежуточная версия 2 участников) | |||
Строка 1: | Строка 1: | ||
− | + | = Общие сведения = | |
+ | * Семестр: 10 (5й курс) | ||
+ | * Форма контроля: экзамен | ||
+ | * Дни и время занятий: четверг, лекция 17:05 - 18:30, семинар 18:35 - 20:00 | ||
+ | |||
+ | == Важные ссылки == | ||
+ | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vQ8UUWKBHIvZM6FWiX4uwATgLcYNW77L8DdbgMseTA9xHaXzGxcEtZ1YzCsJGFr9BjXB08BFt9IV85c/pubhtml?gid=359301262&single=true План курса] | ||
+ | * [https://t.me/+XeWTXxzq2fRmYzBi Чат курса] | ||
+ | * [https://forms.gle/cRDuXJe4evLz9HSaA Регистрация на курс] | ||
+ | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vRC_kYhMpdAnuFC5BWAFngSoycSQJSCSqkGxbEHpRHe2W6tWUyL3smXbDC5z3b_naUmJiOX1hDD1Lps/pubhtml?gid=915915854&single=true '''Таблица с оценками'''] | ||
+ | * [https://docs.google.com/spreadsheets/d/e/2PACX-1vRC_kYhMpdAnuFC5BWAFngSoycSQJSCSqkGxbEHpRHe2W6tWUyL3smXbDC5z3b_naUmJiOX1hDD1Lps/pubhtml?gid=2075695586&single=true '''Очередь проверки ДЗ'''] | ||
+ | |||
+ | == Доступы == | ||
+ | По вопросам доступов и работы Gitlab-сервера пишите в [https://docs.google.com/forms/d/e/1FAIpQLSd_JxfMFOcWdaXKLC8sydJlDtwRG-B6Puiia_h3GqORXEDUKA/viewform форму] или на почту servers@atp-fivt.org. | ||
+ | |||
+ | == Материалы == | ||
+ | * [https://plvideo.ru/playlist?list=1G4f2UZTUkiS'''Видео занятий'''] | ||
+ | * [https://drive.google.com/drive/folders/14N3sqp5zJs4bP6m84An3HSVNIsW-Qe02?usp=drive_link '''Слайды презентаций'''] | ||
+ | * [https://gitlab.atp-fivt.org/courses-public/bigdata/hobod2025 Коды семинаров 2025 г.] | ||
+ | * [https://gitlab.com/hobod/hobod-practice Коды семинаров до 2024 г.] | ||
+ | |||
+ | === Домашние задания === | ||
+ | '''Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.''' | ||
+ | |||
+ | Планируется 6 домашних заданий. | ||
+ | * Каждое оценивается максимум в 1,5 балла. | ||
+ | * За сдачу позже мягкого дедлайна - 50% | ||
+ | * За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 29.06, 23:59. | ||
+ | |||
+ | 5 мини-тестов (~10 мин.) на семинарах | ||
+ | * в сумме 5 баллов | ||
+ | |||
+ | ==== Дедлайны по домашним заданиям ==== | ||
+ | {| class="wikitable" | ||
+ | |- | ||
+ | ! Задание | ||
+ | ! Мягкий deadline | ||
+ | ! Жёсткий deadline | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1PjGIcNOcRvkU5anC-PmQyXwDNVSZ0m47LG5NZQ8VaHA/edit?usp=drive_link MapReduce] || 23.03 || 30.03 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1OFIe5kkdrfXJdknW8e1DfAly40_fkko2_PymACMpYmk/edit?usp=sharing Hive] || 13.04 || 20.04 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/12DrsxmvoShqWBePQtvEz9wC2sVoYAtapp5BG3hVHgNQ/edit?usp=drive_link Spark] || 20.04 ||27.04 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1xAs-5NAM8zqISi7iWe3hHLNN46cZDEuRZJoIrAqr5Mw/edit?usp=drive_link RealTime & Kafka] || 15.05 || 25.05. | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1GmfWacB33ACd7ms6Sb4TLOI7NhZ6pM0qev2Gd-_1fPg/edit?usp=drive_link HBase / Casssandra] || 01.06 || 08.06 | ||
+ | |- | ||
+ | |[https://docs.google.com/document/d/1uZ9RZKXGhDi7jLFjm9guqu5RhxwSlKUtKH6BKADEuWI/edit?usp=drive_link Google Spanner] || 08.06 || 15.06 | ||
+ | |} | ||
+ | |||
+ | В идеальном случае за домашние задания можно получить '''9 баллов'''. | ||
+ | |||
+ | Как сдавать ДЗ: | ||
+ | * [https://docs.google.com/presentation/d/1eDxnTeBWSB1OrA3BwEUa2vJAJm3_OJMuoRxyA13RzTY/edit#slide=id.g4f2997e0e1_1_24 презентация] | ||
+ | * [https://drive.google.com/file/d/1gdGDUTavS34dd2Odw11eK89v7WLPGt_s/view?usp=drive_link видео] | ||
+ | |||
+ | Сдать ДЗ со штрафом, возможно до 22.06.2025 | ||
+ | |||
+ | === Бонус === | ||
+ | Бонус начисляется за: | ||
+ | * активное участие в семинарах, | ||
+ | * помощь коллегам в чате курса. | ||
+ | Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено. | ||
+ | |||
+ | === Экзамен === | ||
+ | Экзамен состоится '''XX.06.2025'''. Он будет проходить через Прокторинг. | ||
+ | |||
+ | Является '''необязательным'''. | ||
+ | * вопросы по всему курсу | ||
+ | * письменная работа (6 вопросов по всему курсу) на 45 мин | ||
+ | * возможна устная защита по окончанию 30 минут | ||
+ | * максимальная оценка: 2 балла. | ||
+ | |||
+ | Итого | ||
+ | *идеальный вариант: 9 + 5 + 2 + 1 = 17 из 10 | ||
+ | *но надо сделать хоть 1 ДЗ. | ||
+ | |||
+ | === Перезачет курса === | ||
+ | Если вы хотите перпезачесть курс, просьба заполнить [https://forms.gle/mhoxgwrcmXc3Wq728 форму] до '''28.02.2025'''. | ||
+ | |||
+ | Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением. | ||
+ | |||
+ | === Дописывание Quiz'ов === | ||
+ | В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, [https://forms.gle/qdn5gLyFWn245GyP8 форму.] | ||
+ | |||
+ | = Список рекомендуемых материалов = | ||
+ | === Основная === | ||
+ | # Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015 | ||
+ | # Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis | ||
+ | # Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015. | ||
+ | === Дополнительная === | ||
+ | # Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011. | ||
+ | # Alex Holmes , "Hadoop in Practice", 2012 | ||
+ | # Martin Fowler, "NoSQL", 2013 | ||
+ | # Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012 | ||
+ | # Jonathan Leibiusky, "Getting Started with Storm", 2012 | ||
+ | # Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013. | ||
+ | # Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014. | ||
+ | # Spark Core Programming. TutorialsPoint, 2015. | ||
+ | # Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012. | ||
+ | # Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012. | ||
+ | # Lars George. HBase: The Definitive Guide. O’Reilly, 2011. | ||
+ | # Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011. | ||
+ | |||
+ | * '''[https://docs.google.com/spreadsheets/d/1X7lhS8aYlyhX9gb1yT6t3A8K7OfCA-x0GJRfMcykDJk/edit?usp=sharing Интересные ссылки]''' |
Текущая версия на 15:32, 19 марта 2025
Содержание
[убрать]Общие сведения
- Семестр: 10 (5й курс)
- Форма контроля: экзамен
- Дни и время занятий: четверг, лекция 17:05 - 18:30, семинар 18:35 - 20:00
Важные ссылки
Доступы
По вопросам доступов и работы Gitlab-сервера пишите в форму или на почту servers@atp-fivt.org.
Материалы
Домашние задания
Если ни одно домашнее задание не сдано - оценка неудовлетворительно, даже если вы набрали > 2.5.
Планируется 6 домашних заданий.
- Каждое оценивается максимум в 1,5 балла.
- За сдачу позже мягкого дедлайна - 50%
- За сдачу позже жёсткого -75%. Со штрафом -75% можно сдавать до 29.06, 23:59.
5 мини-тестов (~10 мин.) на семинарах
- в сумме 5 баллов
Дедлайны по домашним заданиям
Задание | Мягкий deadline | Жёсткий deadline |
---|---|---|
MapReduce | 23.03 | 30.03 |
Hive | 13.04 | 20.04 |
Spark | 20.04 | 27.04 |
RealTime & Kafka | 15.05 | 25.05. |
HBase / Casssandra | 01.06 | 08.06 |
Google Spanner | 08.06 | 15.06 |
В идеальном случае за домашние задания можно получить 9 баллов.
Как сдавать ДЗ:
Сдать ДЗ со штрафом, возможно до 22.06.2025
Бонус
Бонус начисляется за:
- активное участие в семинарах,
- помощь коллегам в чате курса.
Возможно получить до 1 балла. Количество студентов, которым может быть начислен бонус, неограничено.
Экзамен
Экзамен состоится XX.06.2025. Он будет проходить через Прокторинг.
Является необязательным.
- вопросы по всему курсу
- письменная работа (6 вопросов по всему курсу) на 45 мин
- возможна устная защита по окончанию 30 минут
- максимальная оценка: 2 балла.
Итого
- идеальный вариант: 9 + 5 + 2 + 1 = 17 из 10
- но надо сделать хоть 1 ДЗ.
Перезачет курса
Если вы хотите перпезачесть курс, просьба заполнить форму до 28.02.2025.
Курс PD (a.k.a. МВС) не перезасчитывается т.к. ХОБОД является его продолжением.
Дописывание Quiz'ов
В случае если вы не смогли написать Quiz в указанную дату по технической или другой уважительной причине, заполните, пожалуйста, форму.
Список рекомендуемых материалов
Основная
- Tom White, Hadoop: The Definitive Guide, 4th Edition Storage and Analysis at Internet Scale, Publisher: O'Reilly, Media Release Date: April 2015
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M, Learning Spark: Lightning-Fast Big Data Analysis
- Holden Karau et al. Learning Spark. Lightning-fast Data Analytics. Preview Edition. O’Reilly, 2015.
Дополнительная
- Chuck Lam. Hadoop in Action. New York: Manning Publications co., 2011.
- Alex Holmes , "Hadoop in Practice", 2012
- Martin Fowler, "NoSQL", 2013
- Eric Redmond, Jim R. Wilson, "Seven Databases in Seven Weeks", 2012
- Jonathan Leibiusky, "Getting Started with Storm", 2012
- Donald Miner, Adam Shook. MapReduce Design Patterns. O’Reilly, 2013.
- Arun C. Murthy et al. Apache Hadoop YARN. Addison-Wesley, 2014.
- Spark Core Programming. TutorialsPoint, 2015.
- Dario Simonassi, Gabriel Eisbruch, Jonathan Leibiusky. Getting Started with Storm. O’Reilly, 2012.
- Edward Capriolo, Dean Wampler, and Jason Rutherglen. Programming Hive. O’Reilly, 2012.
- Lars George. HBase: The Definitive Guide. O’Reilly, 2011.
- Eben Hewitt. Cassandra: The Definitive Guide. O’Reilly, 2011.