
Цель курса: предоставить слушателям знания и навыки, необходимые для выбора технологии хранения, обработки и анализа данных. В курсе разбирается широкий список современных технологий , представленных разными вендорами. Приводятся практические примеры использования некоторых из них.
Аудитория: для специалистов по обработке и анализу данных, архитекторов, администраторов баз данных, желающих расширить свои знания и технические навыки по выбору и использованию современных технологий хранения, обработки и анализа данных
Необходимая подготовка:
- Базовое представление о системах управления базами данных;
- Понимание протоколов передачи данных, используемых в локальных сетях и сети Интернет;
- Определять роль аналитика и инженера данных в организации;
- Понимать принципы работы баз данных и использования языка запросов SQL;
- Понимать основы бизнес-аналитики: визуализация данных, информационные панели и отчетность;
- Использовать технологии интеграции данных и создавать потоки данных (data piplelines);
- Автоматизировать рутинные операции при помощи оркестровки скриптов и задач;
- Понимать принципы работы Apache Spark;
- Создавать решения для Big Data с использованием Hadoop и Spark;
- Понимать принципы организации Data Lake;
- Решать задачи по стримингу данных;
- Понимать принципы решения задач машинного обучения с точки зрения инженера данных;
- Понимать лучшие практики инженера данных;
- Понимать принципы организации Data Vault.