Участник:Igorschukin

Материал из Public ATP Wiki
Перейти к: навигация, поиск

Превью

На данном курсе мы с Вами обсудим язык R и его применение в задачах статистического анализа данных. Кроме того, посмотрим, какие средства этого языка помогают красиво демонстрировать извлеченную информацию.

Объявление

Перед первой лекцией стоит попробовать установить R/RStudio самостоятельно ЗАРАНЕЕ. Это делается нативно

на [[Windows][1]]: найдите большую кнопку Download R (номер версии) for Windows. на [Mac[2]]: если маку меньше, чем 5 лет, то смело ставьте *.pkg файл с последней версией. Если старше, то поищите на той же странице версию для вашей системы. на [Linux[3]]: также можно добавить зеркало и установить из командной строки: sudo apt-get install r-cran-base

Не факт, что на первой лекции на помощь с установкой будет время (на первом семинаре будет), но, если все сделать аккуратно и заранее, то чаще всего всё легко устанавливается:) На лекции будет полезно брать с собой ноутбук для экспериментов и выполнения представленного кода.


План курса

Дата Тема
1 21.04 Вводная лекция. Основы языка R и базовые типы.
2 24.04/25.04 Настройка RStudio/R. Продолжаем говорить о типах данных. Векторизация.
3 28.04 Теория вероятностей и статистика.
4 1.05/2.05 data.table vs tidyverse. Статистические критерии.
5 5.05 A/B-тестирование с примерчиком. "Философия" ggplot2, почему он крут и небольшая практика.
6 8.05/9.05 Продолжение ggplot2. Разведывательный анализ данных. RMarkdown.
7 12.05 Корреляционный, регрессионный и дисперсионный анализ. API, примеры и пример полноценного дашборда.
8 15.05/16.05 Практика лекционного материала, создание дашборда.

Оценивание

Оценка по курсу состоит из нескольких частей:

  1. Тест на лекции (на 10 минут, 10 баллов)
  2. 2 домашки (20 баллов, срок выполнения каждой в районе 2х недель) + 1 балл по личным ощущениям проверяющего
  3. 4 лекции, 4 семинара (по 1 баллу за активность)

Итого: максимум 50 баллов + 10 доп баллов