РЭШ. Наука о данных. Python и R 2025

Материал из Public ATP Wiki
Перейти к: навигация, поиск

Общие сведения

Основная цель курса - помочь студентам приобрести навыки сбора данных из различных источников и дальнейшего их анализа на основе инструментов Python. Основной упор сделан на работу с ситуациями, когда нет чистых данных и надо самому собирать и очищать данные.

Руководитель курса

Спицын Николай

Преподаватели курса

Спицын Николай Подзорова Полина

План курса

Блок 1. Окружение - Основы Git - Интерпретатор Python - Основы работы с Google Colab

Блок 2. Синтаксис Python - Циклы, условия - Генераторы, list comprehension - Контейнеры - Функции, лямбда-функции; классы. Основы ООП

Блок 3. Python для работы с данными - Numpy - Pandas - Matplotlib, seaborn - Работа с выборками в Python - Основы HTML. Веб-скрапинг - Работа с API

Блок 4. Основы R


Материалы занятий

Оценки

Оценка за семестр (предварительно, финальную уточнять у руководителя курса):

К + Л + Пр + Сем + Лек,

где

К - сумма баллов за контесты из блока 2, до 15% от итоговой оценки Л - сумма баллов за лабораторные работы из блока 3, до 50% от итоговой оценки Пр - балл за итоговый проект, до 25% от итоговой оценки Сем - сумма баллов за посещение семинаров, до 10% от итоговой оценки Лек - сумма баллов за посещение лекций, до 10% от итоговой оценки

Блоки К, Л, Пр - блокирующие, т.е. за каждый из них надо получить хотя бы 4/10 для получения положительной итоговой оценки.