Анализ данных на Python (Традиционный)
Об этом курсе
Цель курса освоить новые темы анализа данных, такие как обучение без учителя, временные ряды, работа с естественным языком и продвинутыми фреймворками машинного обучения.
Курс идет в треке "Data Scientist".
В курсе вы рассмотрите математические аспекты алгоритмов, применяемых в Data Science. Поймете, как устроены алгоритмы на уровне математики. Изучите продвинутые архитектуры сверточных нейронных сетей, обработку естественного языка.
План курса:
Методы обучения без учителя: кластеризация. Какие методы кластеризации существуют, для чего их применяют и какие метрики качества моделей кластеризации бывают.
Методы обучения без учителя: понижение размерности. Методы понижения размерности, их применение и отличия
Современные фреймворки бустинга: xgboost, lightgbm, catboost. Установка, использование, преимущества и недостатки.
Временные ряды на основе классических методов и регрессионный подход. Что такое временной ряд, составляющие части временного ряда. Статистические методы прогнозирвания, применение методов машинного обучения для прогнозирования временного ряда
Временные ряды. SARIMAX, FaceBook Prophet. Применение специализированных инструментов для анализа и прогнозирования временного ряда.
Работа с текстом. Препроцессинг. Задачи обработки естественного языка. Создание словарей. Токенизация.
Работа с текстом. Статистические и тематические векторные модели. Преобразование текста в вектора. Особенности, преимущества и недостатки разных векторных моделей
Работа с текстом. Нейросетевые векторные модели. Передовые векторные модели, их обучение и применение.
Образовательный результат: навыки работы написания алгоритмов и нейронных сетей по обработке естественного языка и работа с фреймворками машинного обучения.
Add new comment