+7 (812) 703-02-02 info@hse.spbstu.ru Max Rutube

DEV-PDA200. Конструирование признаков и оптимизация моделей машинного обучения

Длительность дисциплины: 32 ак.ч.


Аннотация

Курс обучает созданию информативных признаков, применению методов уменьшения размерности (PCA, t-SNE, UMAP) и оценке их значимости. Слушатели освоят автоматизированный подбор гиперпараметров (GridSearch, RandomSearch) и продвинутые методы оптимизации (Bayesian Optimization, Optuna). Практические занятия включают анализ датасетов, исследование методов снижения размерности и подбора гиперпараметров. В результате обучающиеся смогут адаптировать методы машинного обучения под бизнес-задачи и обосновывать выбор параметров моделей. Итоговая аттестация проводится в форме пет-проекта.


Знания и умения, полученные в результате изучения

В результате освоения программы обучающийся должен уметь:

  • Создавать новые информативные признаки на основе предметной области
  • Применять методы уменьшения размерности (PCA, t-SNE, UMAP)
  • Оценивать значимость признаков с помощью статистических методов
  • Проводить автоматизированный подбор гиперпараметров (GridSearch, RandomSearch)
  • Применять продвинутые методы оптимизации (Bayesian Optimization, Optuna)

В результате освоения программы обучающийся приобретет следующие компетенции:

  • Умение разрабатывать и реализовывать методы конструирования новых информативных признаков
  • Навыки применения современных методов уменьшения размерности данных
  • Способность оценивать информативность признаков и их влияние на качество модели

В результате освоения программы обучающийся приобретет практический опыт:

  • Способность адаптировать методы машинного обучения под конкретные бизнес-задачи.
  • Умение обосновывать выбор параметров моделей.
и.

Содержание дисциплины

Тема 1. Методы трансформации признакового пространства

Метод главных компонент

Случайные проекции

Manifold learning 

Практические занятия

Исследование влияние различных методов снижения размерности на признаковое пространство

 

Тема 2. Методы уменьшения признакового пространства

Дисперсионный анализ

Корреляционный анализ

Отбор признаков

SHAP - Анализ

Практические занятия    

Факторный, дисперсионный, корреляционный анализ датасета про утомляемость студентов

 

Тема 3. Подбор гиперпараметров моделей машинного обучения

Случайный поиск

Поиск по сетке

Байесовская оптимизация

Практические занятия    

Исследование различных техник подбора гиперпараметров

 

Тема 4. Аттестация

Предоставить пет-проджект