Дата курса
18.03.2024 - 22.03.2024
22.04.2024 - 26.04.2024
03.06.2024 - 07.06.2024
22.07.2024 - 26.07.2024
19.08.2024 - 23.08.2024
23.09.2024 - 27.09.2024
21.10.2024 - 25.10.2024
25.11.2024 - 29.11.2024
16.12.2024 - 20.12.2024
Тренинг предназначен для разработчиков, кто хочет научиться использовать ADB или в чьих задачах стоит миграция БД на ADB. Курс дает необходимые знания о развертывании схем и таблиц, написании процедур, постройке витрин, дает знания о загрузке, обработке и выгрузке данных, настройках безопасности.
Программа
Введение в ADB:
- Базовые сведения об ADB и Greenplum. Архитектура MPP и её реализация в ADB.
- Отличия ADB от ADQM (Clickhouse) и ADH (Hadoop).
- Окружение. ADCM, мониторинг.
- Базовые схемы и объекты. Структура БД. Шаблоны.
Пользователи и группы:
- Ролевая модель. Пользователи и группы. Организация иерархии. Предоставление и отзыв полномочий. Доступ к СУБД.
- Распределение ресурсов. Ресурсные группы. Расширение Diskquota.
Хранение данных:
- Виды таблиц. Семейства Heap и Append-Optimized. Форматы хранения данных. Сжатие данных. Базовые сведения о распределении данных. Материализованные представления. Тейблспейсы.
- Партиционированные таблицы. Отличие от обычных таблиц. Манипуляции с партициями. Варианты использования.
Типы данных:
- Типы данных. Рекомендации по выбору. Сопоставление с типами Oracle.
- Типы JSON и JSONB. Индексы. Операторы.
- Тип XML. Функции.
Получение данных:
- Внешние таблицы. Устройство, назначение и типы. Протоколы.
- Загрузка и выгрузка данных при помощи GPFDIST и GPLOAD.
- Использование PXF для доступа к внешним системам. Доступ к данным на кластере Hadoop. Работа с JDBC.
Функции:
- Пользовательские функции. Классы функций. Место выполнения функции.
- Языки. PL/SQL. PL/python. C-функции. PLContainer.
- Пользовательские агрегатные функции.
- Оконные функции.
- Расширения MadLib и PostGIS.
Оптимальное выполнение запросов:
- Схема выполнения запроса в ADB. Оптимизаторы.
- Планы запросов. Получение плана. Разбор структуры плана и показателей. Операции.
- Распределение данных. Выбор политики распределения. Правильный ключ распределения. Нюансы записи и чтения данных для таблиц с разным типом распределения.
- Статистика. Сбор статистики. Проблемы, возникающие из-за неверной статистики. Автоматизация анализа объектов в ADB.
- Особенности оптимизаторов. Разница в работе с партиционированными таблицами. Подзапросы. CTE.
- Индексы. Виды индексов. Применимость в ADB.
- Транзакции. Уровни изоляции. Обеспечение изоляции при помощи механизма MVCC. Очистка объектов от неактуальных версий данных. Автоматизация очистки в ADB.
- Блокировки. Уровни блокировки для разных операций. Ручная блокировка объекта. Детектор взаимных блокировок для Heap-таблиц.
Организация хранилища:
- Подход к модели данных.
- Подходы ETL и ELT.
- Загрузка и обновление данных в справочниках разных типов.
Итоговое тестирование.