Чему вы научитесь:

Изучите классические и современные алгоритмы машинного обучения
Повторите или освоите математические подходы, необходимые для анализа данных

О курсе:

После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.

Важно! Курс находится в процессе наполнения.

Программа курса:

О курсе
Инструменты
Kaggle

Знакомство с машинным обучением

Введение
Основные понятия машинного обучения
Типы задач в машинном обучении
Схема проекта по машинному обучению
Оценка обобщающей способности модели
Домашнее задание
Разведочный анализ данных

Линейные модели регрессии

Основы линейной регрессии
Регуляризация
Практические особенности линейной регрессии
Feature engineering
Метрики качества регрессии
Домашнее задание

Линейные модели классификации — 1

Переход от регрессии к классификации
Задача оценивания вероятностей, логистическая регрессия
Базовые метрики классификации
Домашнее задание

Линейные модели классификации — 2

Метод опорных векторов
Ядровой метод опорных векторов
Продвинутые (интегральные) метрики классификации
Домашнее задание

Многоклассовая классификация

Многоклассовая и multilabel-классификация
Метод ближайших соседей
Быстрый поиск соседей
Калибровка вероятностей

Решающие деревья и их композиции

Решающее дерево
Тонкости решающих деревьев
Разложение ошибки на смещение и разброс
Бэггинг. Случайный лес
Бустинг. Градиентный бустинг над решающими деревьями
Современные имплементации градиентного бустинга

Обработка признаков и работа с выбросами

Работа с пропущенными значениями
Поиск аномалий
Кодирование категориальных признаков

Снижение размерности данных

Методы отбора признаков
Метод главных компонент
Сингулярное разложение
Линейный дискриминантный анализ
Методы визуализации данных

Кластеризация данных

K-means
Иерархическая кластеризация
DBSCAN, HDBSCAN
Метрики качества кластеризации
Графовая кластеризация

Интерпретируемость ML-моделей

SHAP
LIME

Рекомендательные системы и ранжирование

Коллаборативная фильтрация
Матричные разложения
Факторизационные машины
ML-подход
Метрики качества ранжирования и рекомендаций
Ранжирование

AutoML

Автоматический подбор гиперпараметров: Optuna
Фреймворк для AutoML – H2O
Обзор других фреймворков (TPOT, auto-sklearn, MLBox)

Прогнозирование временных рядов

Особенности работы с временными рядами
Статистические методы прогноза временных рядов
Адаптивные модели
Прогнозирование временных рядов с помощью ML
Библиотеки для анализа временных рядов: prophet

[Stepik] Практический Machine Learning [Елена Кантонистова]