Курс охватывает ключевые темы машинного обучения: линейную, полиномиальную и логистическую регрессии, градиентный спуск, методы регуляризации. Рассматриваются алгоритмы классификации, включая наивный Байес, деревья решений, SVM и ансамбли моделей. Изучаются нейронные сети: сверточные, рекуррентные и трансформеры, а также методы кластеризации. Практические занятия включают работу с реальными датасетами, например, предсказание цен на недвижимость, классификацию изображений и анализ временных рядов. Завершается курс пет-проектом для закрепления навыков.
Знания и умения, полученные в результате изучения
В результате освоения программы обучающийся должен уметь:
- Выбирать и настраивать модели (линейная/логистическая регрессия, SVM, k-NN, деревья решений).
- Работать с ансамблевыми методами (Random Forest, Gradient Boosting, XGBoost/CatBoost).
- Оценивать качество моделей с помощью метрик (accuracy, precision-recall, ROC-AUC, MSE).
- Строить и обучать модели на базе CNN (для обработки изображений), RNN/LSTM (для временных рядов и текста), трансформеров.
- Использовать предобученные модели (BERT, GPT, ResNet) и адаптировать их под свои задачи.
- Применять методы регуляризации и оптимизации (Dropout, BatchNorm, Adam).
В результате освоения программы обучающийся приобретет следующие знания:
- Фундаментальных концепций машинного обучения: обучение с учителем и без, ансамбли методов, нейросетевые архитектуры.
- Математических основ ML: линейная алгебра, теория вероятностей, методы оптимизации (градиентный спуск, backpropagation).
- Принципов работы и областей применения современных моделей.
- Выбирать оптимальные алгоритмы под задачу и интерпретировать их результаты.
В результате освоения программы обучающийся приобретет практический опыт:
- Навык реализации, обучения и валидации моделей (scikit-learn, TensorFlow/PyTorch).
- Способность выбирать оптимальные алгоритмы под задачу и интерпретировать их результаты.
Тема 1. Линейная регрессия
Практические занятия
Разбор датасета про московскую недвижимость.
Создание класса линейной регрессии.
Тема 2. Градиентный спуск, метрики для задач регрессии
Практические занятия
Исследование различных методов градиентного спуска
Тема 3. Полиномиальная регрессия, переобучение/недообучения моделей, L1 и L2 регрессии
Практические занятия
Исследование различных методов градиентного спуска
Тема 4. Логистическая регрессия, метрики для задач классификации, экспоненциальное семейство распределений, обобщенная линейная модель
Практические занятия
Выяснение является ли банковская банкнота подделкой
Тема 5. Теорема Байеса, наивный байесовский классификатор
Практические занятия
Классификация цветка Ириса
Тема 6. Дерево решений, машина опорных векторов
Практические занятия
Определение класса дохода клиента банка
Тема 7. Ансамбли (войтинг, бекинг, бустинг, стейкинг)
Практические занятия
Предсказание того, что студент продолжит обучение в ВУЗе
Тема 8. Сверточные нейронные сети
Практические занятия
Распознавание рукописных цифр
Тема 9. Рекуррентные нейронные сети
Практические занятия
Предсказание электропотребление домохозяйства
Тема 10. Трансформеры
Практические занятия
Построение собственной RAG системы
Тема 11. Методы кластеризации
Практические занятия
Кластеризация клиентов торговой сети
Тема 12. Аттестация
Предоставить пет-проджект