Курсы BI


Arenadata DB для разработчиков


arena.png
Дата курса
05.02.2024 - 09.02.2024
18.03.2024 - 22.03.2024
22.04.2024 - 26.04.2024
03.06.2024 - 07.06.2024
22.07.2024 - 26.07.2024
19.08.2024 - 23.08.2024
23.09.2024 - 27.09.2024
21.10.2024 - 25.10.2024
25.11.2024 - 29.11.2024
16.12.2024 - 20.12.2024

Тренинг предназначен для разработчиков, кто хочет научиться использовать ADB или в чьих задачах стоит миграция БД на ADB. Курс дает необходимые знания о развертывании схем и таблиц, написании процедур, постройке витрин, дает знания о загрузке, обработке и выгрузке данных, настройках безопасности.

Программа

Введение в ADB:
  • Базовые сведения об ADB и Greenplum. Архитектура MPP и её реализация в ADB.
  • Отличия ADB от ADQM (Clickhouse) и ADH (Hadoop).
  • Окружение. ADCM, мониторинг.
  • Базовые схемы и объекты. Структура БД. Шаблоны.
Пользователи и группы:
  • Ролевая модель. Пользователи и группы. Организация иерархии. Предоставление и отзыв полномочий. Доступ к СУБД.
  • Распределение ресурсов. Ресурсные группы. Расширение Diskquota.
Хранение данных:
  • Виды таблиц. Семейства Heap и Append-Optimized. Форматы хранения данных. Сжатие данных. Базовые сведения о распределении данных. Материализованные представления. Тейблспейсы.
  • Партиционированные таблицы. Отличие от обычных таблиц. Манипуляции с партициями. Варианты использования.
Типы данных:
  • Типы данных. Рекомендации по выбору. Сопоставление с типами Oracle.
  • Типы JSON и JSONB. Индексы. Операторы.
  • Тип XML. Функции.
Получение данных:
  • Внешние таблицы. Устройство, назначение и типы. Протоколы.
  • Загрузка и выгрузка данных при помощи GPFDIST и GPLOAD.
  • Использование PXF для доступа к внешним системам. Доступ к данным на кластере Hadoop. Работа с JDBC.
Функции:
  • Пользовательские функции. Классы функций. Место выполнения функции.
  • Языки. PL/SQL. PL/python. C-функции. PLContainer.
  • Пользовательские агрегатные функции.
  • Оконные функции.
  • Расширения MadLib и PostGIS.
Оптимальное выполнение запросов:
  • Схема выполнения запроса в ADB. Оптимизаторы.
  • Планы запросов. Получение плана. Разбор структуры плана и показателей. Операции.
  • Распределение данных. Выбор политики распределения. Правильный ключ распределения. Нюансы записи и чтения данных для таблиц с разным типом распределения.
  • Статистика. Сбор статистики. Проблемы, возникающие из-за неверной статистики. Автоматизация анализа объектов в ADB.
  • Особенности оптимизаторов. Разница в работе с партиционированными таблицами. Подзапросы. CTE.
  • Индексы. Виды индексов. Применимость в ADB.
  • Транзакции. Уровни изоляции. Обеспечение изоляции при помощи механизма MVCC. Очистка объектов от неактуальных версий данных. Автоматизация очистки в ADB.
  • Блокировки. Уровни блокировки для разных операций. Ручная блокировка объекта. Детектор взаимных блокировок для Heap-таблиц.
Организация хранилища:
  • Подход к модели данных.
  • Подходы ETL и ELT.
  • Загрузка и обновление данных в справочниках разных типов.
Итоговое тестирование.





« Предыдущий курс     Следующий курс»

Возврат к списку


Подпишитесь на новости