Python & R practice nes spr2023 — различия между версиями
(Актуализация плана) |
|||
| (не показана 1 промежуточная версия этого же участника) | |||
| Строка 118: | Строка 118: | ||
|1|| 21.04 || Вводная лекция. Основы языка R и базовые типы. | |1|| 21.04 || Вводная лекция. Основы языка R и базовые типы. | ||
|- | |- | ||
| − | |2|| 24.04/25.04 || Настройка RStudio/R. Продолжаем говорить о типах данных. | + | |2|| 24.04/25.04 || Настройка RStudio/R. Продолжаем говорить о типах данных. Векторизация. |
|- | |- | ||
|3|| 28.04 || Теория вероятностей и статистика. | |3|| 28.04 || Теория вероятностей и статистика. | ||
| Строка 126: | Строка 126: | ||
|5|| 5.05 || A/B-тестирование с примерчиком. "Философия" ggplot2, почему он крут и небольшая практика. | |5|| 5.05 || A/B-тестирование с примерчиком. "Философия" ggplot2, почему он крут и небольшая практика. | ||
|- | |- | ||
| − | |6|| 8.05/9.05 || Продолжение ggplot2. RMarkdown. | + | |6|| 8.05/9.05 || Продолжение ggplot2. Разведывательный анализ данных. RMarkdown. |
|- | |- | ||
|7|| 12.05 || Корреляционный, регрессионный и дисперсионный анализ. API, примеры и пример полноценного дашборда. | |7|| 12.05 || Корреляционный, регрессионный и дисперсионный анализ. API, примеры и пример полноценного дашборда. | ||
Текущая версия на 02:24, 25 апреля 2023
Содержание
Требования
- Аккаунт на GitHub
- Ноутбук на семинарах
План курса
| № | Дата | Тема |
|---|---|---|
| 1 | 13.01 | Знакомство с Python. Основные инструменты разработки |
| 2 | 16.01 / 19.01 | Базовые типы данных - практика. Базовый ввод / вывод. Условный оператор |
| 3 | 20.01 | Контейнеры. Списки, кортежи, словари, множества |
| 4 | 23.01 / 24.01 | Циклы `for` и `while` |
| 5 | 27.01 | Строки. Работа с файлами |
| 6 | 30.01 / 31.01 | Функции (часть 1). Базовый синтаксис, генераторы |
| 7 | 06.02 / 09.02 | Функции (часть 2). Области видимости, замыкания, декораторы |
| 8 | 10.02 | ООП. Основные принципы и определения и базовый синтаксис |
| 9 | 13.02 / 14.02 | ООП. Magic-методы. Декораторы для классов |
| 10 | 17.02 | Дополнительные темы Python. *Юнит-тестирование*. Обработка ошибок. Модули и пакеты |
| 11 | 20.02 / 21.02 | Регулярные выражения |
| 12 | 27.02 / 28.02 | Numpy |
| 13 | 03.03 | Оптимизация кода. Введение в Cython. Numba |
| 14 | 06.03 / 07.03 | Введение в Pandas |
| 15 | 10.03 | Продвинутый Pandas |
| 16 | 13.03 / 14.03 | Визуализация данных. Matplotlib |
| 17 | 17.03 | Web 101. REST API |
| 18 | 20.03 / 21.03 | Парсинг страниц. BeautifulSoup. Scrapy |
| 19 | 24.03 | Продвинутый парсинг. Selenium |
| 20 | 03.04 / 04.04 | Web серверы для демо. Streamlit |
| 21 | 07.04 | Работа с графовыми данными. NetworkX |
| 22 | 10.04 / 11.04 | Введение в базы данных. SQLite |
| 23 | 14.04 | Работа с геоданными. GeoPandas. Shapely. Folium |
| 24 | 17.04 / 18.04 | |
| 25 | 21.04 | |
| 26 | 24.04 / 25.04 | |
| 27 | 28.04 | |
| 28 | --- | |
| 29 | --- | |
| 30 | --- |
Оценивание
Оценка по курсу состоит из нескольких частей:
- Тесты
- Контесты
- Финальный проект
Тесты
- Небольшие тесты на 10 минут в начале почти каждого занятия
- Вопросы по материалам прошлого занятия
- За каждый тест - 10 баллов.
Контесты
- Набор задач с автоматической проверкой тестирующей системой Я.Контест
- Всего 6 контестов - после каждой темы базового блока
- Срок решения - 2 недели
- За каждый контест - 10 баллов
- Списывание детектируется и наказуемо!
Блок по R
Превью блока
На данном курсе мы с Вами обсудим язык R и его применение в задачах статистического анализа данных. Кроме того, посмотрим, какие средства этого языка помогают красиво демонстрировать извлеченную информацию.
Объявление
Перед первой лекцией стоит попробовать установить R/RStudio самостоятельно ЗАРАНЕЕ. Это делается нативно
на [[Windows][1]]: найдите большую кнопку Download R (номер версии) for Windows. на [Mac[2]]: если маку меньше, чем 5 лет, то смело ставьте *.pkg файл с последней версией. Если старше, то поищите на той же странице версию для вашей системы. на [Linux[3]]: также можно добавить зеркало и установить из командной строки: sudo apt-get install r-cran-base
Не факт, что на первой лекции на помощь с установкой будет время (на первом семинаре будет), но, если все сделать аккуратно и заранее, то чаще всего всё легко устанавливается:) На лекции будет полезно брать с собой ноутбук для экспериментов и выполнения представленного кода.
План блока
| № | Дата | Тема |
|---|---|---|
| 1 | 21.04 | Вводная лекция. Основы языка R и базовые типы. |
| 2 | 24.04/25.04 | Настройка RStudio/R. Продолжаем говорить о типах данных. Векторизация. |
| 3 | 28.04 | Теория вероятностей и статистика. |
| 4 | 1.05/2.05 | data.table vs tidyverse. Статистические критерии. |
| 5 | 5.05 | A/B-тестирование с примерчиком. "Философия" ggplot2, почему он крут и небольшая практика. |
| 6 | 8.05/9.05 | Продолжение ggplot2. Разведывательный анализ данных. RMarkdown. |
| 7 | 12.05 | Корреляционный, регрессионный и дисперсионный анализ. API, примеры и пример полноценного дашборда. |
| 8 | 15.05/16.05 | Практика лекционного материала, создание дашборда. |
Оценивание в блоке
Оценка по курсу состоит из нескольких частей:
- Тест на лекции (на 10 минут, 10 баллов)
- 2 домашки (20 баллов, срок выполнения каждой в районе 2х недель) + 1 балл по личным ощущениям проверяющего
- 4 лекции, 4 семинара (по 1 баллу за активность)
Итого: максимум 50 баллов + 10 доп баллов
Финальный проект
- Скоро