Machine learning - машинное обучение для аналитиков данных. Почему это важно именно сейчас?
Machine learning - машинное обучение. Почему мы запустили новый курс для аналитиков
Предлагаем вашему вниманию новый курс по машинному обучению (Machine learning) на русском языке для аналитиков данных.
Чем полезно машинное обучение (Machine Learning или ML)? Применение технологий искусственного интеллекта позволяет автоматизировать ряд рутинных операций. Модели машинного обучения умеют прогнозировать или распознавать образы точнее и быстрее, чем это сделал бы даже самый подготовленный человек. Уже сейчас функции машинного обучения используют не только поисковики, но и офлайн-бизнес: ритейл, мобильные операторы, банки, производственные компании и т.п.
Области машинного обучения охватывают значимый подраздел Data Science – науки о данных. Внутри Data Science много направлений, часть из которых призвана собирать данные и находить новые источники информации. А основные инструменты машинного обучения позволяют новую информацию использовать для практических целей. Одной из таких целей является аналитика.
Специалисты по Data Science, а особенно владеющие основами машинного обучения с помощью Python, традиционно востребованы на рынке труда.
Наши специалисты накопили большую экспертизу в сфере применения технологий искусственного интеллекта, поэтому мы решили открыть постоянно действующий курс по машинному обучению для аналитиков данных. В течение трех дней слушатели курса ознакомятся с 12 лекциями о машинном обучения и применении технологий искусственного интеллекта от наших ведущих преподавателей.
Прослушав курс, вы сможете:
- стать специалистом в области машинного интеллекта (Machine learning)
-
получить компетенции по использованию современных методов и инструментов работы с данными (Data Scientist)
-
получить навыки программирования на Python
-
получить представление о возможностях технологий искусственного интеллекта, машинного обучения и их применения для решения практических задач.
Программа курса:
Лекция 1. Что такое большие данные и аналитика данных, машинное обучение и глубокое обучение, возможности и потенциальные области применения таких подходов. Введение в теорию вероятности и статистику.
Практический семинар 1. Применение теории вероятности и статистики на практике
Лекция 2. Введение в программирование на Python. Использование библиотек numpy, pandas, matplotlib. Фильтрация данных, группировка, расчет статистик, визуализация. Очистка данных, замещение пустых значений.
Практический семинар 2. Практика программирования на Python на примере базового набора данных.
Лекция 3. Пространство признаков. Извлечение и трансформация признаков для задач регрессии и классификации. Текстовые признаки. Методы понижения размерности.
Практический семинар 3. Применение различных подходов к выделению признаков и визуализация с использованием PCA и t-SNE.
Лекция 4. Решение задачи классификации на примере дерева решений. Как строится такое дерево, его основные параметры, ограничения. Использование для решения задачи регрессии. Метрические методы классификации. Метод K-ближайших соседей.
Практический семинар 4. Построение дерева решений на чистом Python и использование готового решения из библиотеки scikit-learn.
Лекция 5. .Ансамбли моделей, бэггинг и случайный лес. Extra trees.
Практический семинар 5. Создание ансамбля алгоритмов на Python и с использованием scikit-learn. Применение случайного леса на практике.
Лекция 6. Логистическая регрессия. Преимущества и недостатки. Регуляризация. Линейная, гребневая регрессия и lasso.
Практический семинар 6. Использование логистической и линейной регрессии на примере базового набора данных.
Лекция 7. Метрики качества в задачах классификации, регрессии. Кросс валидация.
Практический семинар 7. Детальный разбор построения ROC кривой, вычисление ошибок моделей ML в различных примерах, сравнение со случайным предсказанием. Настройка кросс-валидации.
Лекция 8. Методы обучения без учителя. Кластеризация. K-Means, C-means, DBSCAN, иерархическая кластеризация. Метрики качества в задачах кластеризации.
Практический семинар 8. Применение изученных методов на практике.
Лекция 9. Прогнозирование временных рядов. Экспоненциальное сглаживание, SARIMA, FB Prophet. Кросс валидация во временных рядах. Признаки для прогнозирования временных рядов
Практический семинар 9. Применение изученных методов на практике.
Лекция 10. Градиентный бустинг. Основные реализации: XGBoost, LightGBM и CatBoost. Mean-target encoding. Ограничения.
Практический семинар 10. Применение градиентного бустинга на практике для решения типовой задачи.
Лекция 11. Краткое введение в глубокое обучение. Многослойный перцептрон. Функции активации.
Практический семинар 11. Применение изученных методов на практике.
Лекция 12. Рекомендательные системы. Коллаборативная фильтрация и content-based методы. Метрики качества в задачах ранжирования.
Практический семинар 12. Применение изученных методов на практике.
Курс «Machine learning – Машинное обучение для аналитиков данных» представляет собой сбалансированный набор теоретических знаний и практики. Выпускники курса знают не только основы машинного обучения, но и владеют инструментами machine learning. Курс позволяет погрузиться в науку о данных и машинное обучение, повысить компетенции и собственную стоимость на рынке труда, а также обеспечить свою востребованность в будущем.
Фотографии с курса:
Статьи:
Machine learning. Почему так много хайпа?