PDA-200. Методы машинного обучения в прогнозировании данных
Длительность дисциплины: 32 ак.ч.
Аннотация
Целью курса является формирование теоретических знаний и умений применения методов машинного обучения, а также приобретение практических навыков реализации проектов построения прогнозных моделей на языке Python для широкого круга специалистов, работающих с данными.
Знания и умения, полученные в результате изучения
В результате обучение на курсе слушатели будут
Знать:
• Методы первичного анализа данных;
• Методы проверки статистических гипотез;
• Методы масштабирования, отбора, понижения размерности признаков;
• Линейные модели для классификации;
• Нелинейные модели для классификации;
• Линейные модели для регрессии;
• Нелинейные модели для регрессии;
• Ансамблевые методы и методы настройки параметров.
Уметь:
• Использовать указанные методы анализа и обработки данных;
• Строить модели машинного обучения.
Иметь навыки:
• Построения модели машинного обучения для классификации;
• Построения модели машинного обучения для регрессии.
Содержание дисциплины
Тема 1. Введение в анализ и прогнозирование данных
Первичный анализ данных с использованием описательных статистик и визуализации
Проверка статистических гипотез
Масштабирование, отбор, понижение размерности признаков
Оценка точности моделей
Практические занятия
Первичный анализ данных.
Проверка различных статистических гипотез.
Масштабирование, отбор и понижение размерности признаков.
Оценка точности построенных моделей.
Тема 2. Линейные модели для классификации
Логистическая регрессия
Линейный метод опорных векторов
Дискриминантный анализ
Практические занятия
Построение линейных модели для классификации.
Тема 3. Нелинейные модели для классификации
Метод ближайших соседей
Наивный байесовский классификатор
Деревья решений для классификации
Нейронные сети
Практические занятия
Построение нелинейных моделей для классификации.
Тема 4. Линейные модели для регрессии
Парная регрессия
Множественная регрессия
Полиномиальная регрессия
Регрессия с фиктивными переменными
Гребневая регрессия
Лассо регрессия
Эластичная сеть
Пуассоновская регрессия
Практические занятия
Построение линейной модели для регрессии.
Тема 5. Нелинейные модели для регрессии
Метод ближайших соседей
Деревья решений для регрессии
Байесовская регрессия
Ядерный метод опорных векторов
Нейронные сети
Практические занятия
Построение нелинейные модели для регрессии
Тема 6. Ансамбли и настройка параметров
Проект построения модели машинного обучения для классификации
Проект построения модели машинного обучения для регрессии
Практические занятия
Gостроение ансамблевых моделей, настройка параметров лучшего алгоритма.
Тема 7. Аттестация