РЭШ. Наука о данных. Python и R 2025 — различия между версиями

Материал из Public ATP Wiki
Перейти к: навигация, поиск
(Новая страница: «Test»)
 
 
(не показаны 3 промежуточные версии 1 участника)
Строка 1: Строка 1:
Test
+
= Общие сведения =
 +
Основная цель курса - помочь студентам приобрести навыки сбора данных из различных источников и дальнейшего их анализа на основе инструментов Python. Основной упор сделан на работу с ситуациями, когда нет чистых данных и надо самому собирать и очищать данные.
 +
 
 +
* Семестр: весенний семестр 2025
 +
* Начало курса 11.01.2025
 +
* Конец курса 25.03.2025
 +
* Формы контроля:
 +
* [https://docs.google.com/forms/d/e/1FAIpQLSdEEZLy1BjYzWC64reZXnCfO_fInDxW2DmZI3ibNf3L9gvQ3Q/viewform?usp=header Форма регистрации на курс]'''
 +
* [ Telegram-чат курса]
 +
 
 +
==== Руководитель курса====
 +
Спицын Николай
 +
 
 +
==== Преподаватели курса====
 +
Спицын Николай
 +
Подзорова Полина
 +
 
 +
==== План курса====
 +
Блок 1. Окружение
 +
- Основы Git
 +
- Интерпретатор Python
 +
- Основы работы с Google Colab
 +
 
 +
Блок 2. Синтаксис Python
 +
- Циклы, условия
 +
- Генераторы, list comprehension
 +
- Контейнеры
 +
- Функции, лямбда-функции; классы. Основы ООП
 +
 
 +
Блок 3. Python для работы с данными
 +
- Numpy
 +
- Pandas
 +
- Matplotlib, seaborn
 +
- Работа с выборками в Python
 +
- Основы HTML. Веб-скрапинг
 +
- Работа с API
 +
 
 +
Блок 4. Основы R
 +
 
 +
 
 +
=== Материалы занятий ===
 +
*[https://drive.google.com/drive/folders/17s8tYScwnmmZwjvEwUQ2nk8DAXXFKg86?usp=sharing Папка с материалами лекций, семинаров и домашними заданиями]
 +
 
 +
===== Оценки =====
 +
Оценка за семестр (предварительно, финальную уточнять у руководителя курса):
 +
 
 +
К + Л + Пр + Сем + Лек,
 +
 
 +
где
 +
 
 +
К - сумма баллов за контесты из блока 2, до 15% от итоговой оценки
 +
Л - сумма баллов за лабораторные работы из блока 3, до 50% от итоговой оценки
 +
Пр - балл за итоговый проект, до 25% от итоговой оценки
 +
Сем - сумма баллов за посещение семинаров, до 10% от итоговой оценки
 +
Лек - сумма баллов за посещение лекций, до 10% от итоговой оценки
 +
 
 +
Блоки  К, Л, Пр - блокирующие, т.е. за каждый из них надо получить хотя бы 4/10 для получения положительной итоговой оценки.

Текущая версия на 16:19, 7 февраля 2025

Общие сведения

Основная цель курса - помочь студентам приобрести навыки сбора данных из различных источников и дальнейшего их анализа на основе инструментов Python. Основной упор сделан на работу с ситуациями, когда нет чистых данных и надо самому собирать и очищать данные.

Руководитель курса

Спицын Николай

Преподаватели курса

Спицын Николай Подзорова Полина

План курса

Блок 1. Окружение - Основы Git - Интерпретатор Python - Основы работы с Google Colab

Блок 2. Синтаксис Python - Циклы, условия - Генераторы, list comprehension - Контейнеры - Функции, лямбда-функции; классы. Основы ООП

Блок 3. Python для работы с данными - Numpy - Pandas - Matplotlib, seaborn - Работа с выборками в Python - Основы HTML. Веб-скрапинг - Работа с API

Блок 4. Основы R


Материалы занятий

Оценки

Оценка за семестр (предварительно, финальную уточнять у руководителя курса):

К + Л + Пр + Сем + Лек,

где

К - сумма баллов за контесты из блока 2, до 15% от итоговой оценки Л - сумма баллов за лабораторные работы из блока 3, до 50% от итоговой оценки Пр - балл за итоговый проект, до 25% от итоговой оценки Сем - сумма баллов за посещение семинаров, до 10% от итоговой оценки Лек - сумма баллов за посещение лекций, до 10% от итоговой оценки

Блоки К, Л, Пр - блокирующие, т.е. за каждый из них надо получить хотя бы 4/10 для получения положительной итоговой оценки.