Уровень сложности:
Длительность курса: 64 ак.ч.
График обучения: 64 ак. часов, 16 занятий по 4 ак. часа
Программа состоит из 2 отдельных курсов-модулей.
Аннотация
Данная программа представляет собой углубленный курс по машинному обучению и анализу данных, который начинается с фундаментального изучения библиотек NumPy, Pandas и основ визуализации. Слушатели осваивают ключевые этапы предобработки данных, включая работу с выбросами, кодирование переменных и проверку статистических гипотез. Далее программа погружает в основы линейной и логистической регрессии, градиентный спуск и методы регуляризации для борьбы с переобучением. Особое внимание уделяется изучению разнообразных алгоритмов — от наивного байесовского классификатора и деревьев решений до ансамблевых методов и нейронных сетей, включая сверточные, рекуррентные и трансформеры. Каждая тема подкреплена практическими занятиями на реальных датасетах, таких как «Титаник», продажи автомобилей или распознавание рукописных цифр. Завершается программа созданием итогового проекта, позволяющего применить все полученные навыки для решения комплексной задачи машинного обучения.
Курсы, в освоении которых помогут приобретенные знания
Курсы связанных направлений
Сегодня занятий по этому курсу нет.
-
Уверенное знание Python: Понимание основных структур данных (списки, словари), умение работать с функциями, циклами и условными конструкциями. Опыт работы с базовыми библиотеками, такими как NumPy и Pandas, будет значительным преимуществом.
-
Базовое понимание математики: Знание основ линейной алгебры (векторы, матрицы), математического анализа (производные, градиенты) и теории вероятностей и статистики (среднее, дисперсия, распределения) необходимо для освоения алгоритмов машинного обучения.
-
Знакомство с основами SQL: Умение писать простые запросы для выборки и фильтрации данных, так как это ключевой навык для работы с источниками информации.
-
Технические характеристики: Наличие компьютера с достаточной производительностью для установки и работы со средой разработки (например, Jupyter Notebook), необходимыми библиотеками и обработки datasets.
Курсы, обеспечивающие достаточный начальный уровень знаний
Программа состоит из отдельных курсов-модулей
Выберите ссылку для того, чтобы посмотреть программу отдельного модуля.
-
DEV-PDA110. Инструменты анализа данных
Программа обучает основам работы с NumPy и Pandas, включая обработку векторов, матриц и табличных данных, а также визуализацию с помощью Matplotlib и Seaborn. Участники изучат методы описательной статистики, обработку разных типов данных и проверку гипотез на реальных датасетах, таких как "Титаник" и данные о продажах. Курс завершается пет-проектом, где полученные навыки применяются для анализа и презентации результатов.
-
DEV-PDA120. Методы машинного обучения
Курс охватывает ключевые методы машинного обучения: линейные модели, градиентный спуск, деревья решений, SVM, ансамбли и нейронные сети. Рассматриваются задачи регрессии, классификации, кластеризации и deep learning на практических кейсах. Итогом обучения является реализация пет-проекта для закрепления навыков