Дата курса
13.08.2024 - 14.08.202412.11.2024 - 13.11.2024
Это 2-дневный курс для аналитиков и профильных специалистов, которые планируют научиться использовать ADB для задач обмена и анализа данных. Он даёт необходимые знания для эффективной и безопасной эксплуатации ADB в продуктовых средах, развёртывания схем и таблиц, написания процедур, оптимизации запросов, интеграции с другими системами. Освоение каждой практической темы подкрепляется лабораторной работой.
Курс актуален для аналитиков, Data Science специалистов, которые планируют научиться использовать ADB для задач обмена и анализа данных. Для получения практических навыков необходимы:
-
базовые знания по работе с командной строкой Linux;
-
понимание основ работы реляционных баз данных;
-
базовые знания T-SQL (опыт написания запросов из нескольких таблиц).
Слушатели курса, подтвердившие знания на экзамене, получают именной сертификат с указанием изученного продукта, а также статус сертифицированного специалиста ADCS DB: Analyst.
Содержание курса "Arenadata DB для аналитиков":
ДЕНЬ 1:
-
Архитектура ADB. Реализация MPP в ADB, структура, отличия от иных СУБД
-
Лабораторная: подключение к СУБД и получение информации о кластере из системной таблицы
-
Таблицы в ADB. Виды и применимость, особенности, хранение, сжатие, распределение данных
-
Лабораторная: создание таблиц и изменение их для оптимизации запроса
-
Партиционированные таблицы: создание, изменение, особенности использования
-
Лабораторная: создание партиционированной таблицы с разнотипными партициями
-
Оптимизация запросов: планы запросов и что из них можно извлечь, оптимизаторы и разница между ними. Статистика
-
Лабораторная: оптимизация запроса к двум таблицам и восстановление запроса по имеющемуся плану
ДЕНЬ 2:
-
Внешние таблицы. Виды и применение. Нюансы работы с внешними таблицами, использующими PXF
-
Лабораторная: создание внешних таблиц для чтения в один и несколько потоков, создание внешней таблицы для записи (все с PXF)
-
Транзакции. Уровни изоляции. Механизм MVCC. Блокировки.
-
Лабораторная: параллельное выполнение транзакций с просмотром версионирования строк и блокировкой
-
Пользовательские функции. Особенности работы в MPP-архитектуре. Доступные языки.
-
Лабораторная: выполнение функции на мастере и на сегментах, выполнение функции в контейнере
-
Обсуждение результатов, вопросы