Уровень сложности:
Длительность курса: 32 ак.ч.
График обучения: 32 ак. часов, 8 занятий по 4 ак. часа
Аннотация
Курс обучает созданию информативных признаков, применению методов уменьшения размерности (PCA, t-SNE, UMAP) и оценке их значимости. Слушатели освоят автоматизированный подбор гиперпараметров (GridSearch, RandomSearch) и продвинутые методы оптимизации (Bayesian Optimization, Optuna). Практические занятия включают анализ датасетов, исследование методов снижения размерности и подбора гиперпараметров. В результате обучающиеся смогут адаптировать методы машинного обучения под бизнес-задачи и обосновывать выбор параметров моделей. Итоговая аттестация проводится в форме пет-проекта.
Знания и умения, полученные в результате обучения
В результате освоения программы обучающийся должен уметь:
- Создавать новые информативные признаки на основе предметной области
- Применять методы уменьшения размерности (PCA, t-SNE, UMAP)
- Оценивать значимость признаков с помощью статистических методов
- Проводить автоматизированный подбор гиперпараметров (GridSearch, RandomSearch)
- Применять продвинутые методы оптимизации (Bayesian Optimization, Optuna)
В результате освоения программы обучающийся приобретет следующие компетенции:
- Умение разрабатывать и реализовывать методы конструирования новых информативных признаков
- Навыки применения современных методов уменьшения размерности данных
- Способность оценивать информативность признаков и их влияние на качество модели
В результате освоения программы обучающийся приобретет практический опыт:
- Способность адаптировать методы машинного обучения под конкретные бизнес-задачи.
- Умение обосновывать выбор параметров моделей.
и.
Курсы, в освоении которых помогут приобретенные знания
Курсы связанных направлений
Программы профессиональной переподготовки
| Даты занятий | Расписание занятий |
|
01.10.2025 - 07.07.2026 19:00 - 21:20
Занятия в этой группе уже начались!
Группа: ПП.Анализ данных на языке Python [осень 2025-1]
|
|
|
01.10.2025 - 08.07.2026 19:00 - 21:20 онлайн
Занятия в этой группе уже начались!
Группа: ПП.Анализ данных на языке Python [осень 2025-9]
|
|
23 900 ₽
Расчёт стоимости с учётом возможных скидок
23 900 ₽
Скидки предоставляются в зависимости от количества слушателей, суммы договора и других условий, оговариваемых с Заказчиком.
Расчёт стоимости с учётом возможных скидок представлен как справочная информация.
Фактический размер скидки может несколько отличаться из-за округления значения суммы.
Внимательно ознакомьтесь с условиями действующих
акций и скидок...
Для успешного прохождения курса желательны:
-
Базовые знания Python и библиотек для анализа данных (Pandas, NumPy, Scikit-learn);
-
Понимание основ машинного обучения (линейные модели, метрики качества);
-
Опыт работы с Jupyter Notebook;
-
Начальные навыки визуализации данных (Matplotlib/Seaborn).
Курс подойдёт аналитикам, дата-сайентистам и разработчикам, которые хотят углубиться в feature engineering и оптимизацию моделей.
Курсы, обеспечивающие достаточный начальный уровень знаний
Тема 1. Методы трансформации признакового пространства
Метод главных компонент
Случайные проекции
Manifold learning
Практические занятия
Исследование влияние различных методов снижения размерности на признаковое пространство
Тема 2. Методы уменьшения признакового пространства
Дисперсионный анализ
Корреляционный анализ
Отбор признаков
SHAP - Анализ
Практические занятия
Факторный, дисперсионный, корреляционный анализ датасета про утомляемость студентов
Тема 3. Подбор гиперпараметров моделей машинного обучения
Случайный поиск
Поиск по сетке
Байесовская оптимизация
Практические занятия
Исследование различных техник подбора гиперпараметров
Тема 4. Аттестация
Предоставить пет-проджект