

«Эксплуатация Arenadata DB» поможет вам изучить особенности работы с распределённой СУБД Arenadata DB (ADB), основанной на MPP-системе с открытым исходным кодом Greenplum.
Курс «Эксплуатация Arenadata DB» актуален для системных администраторов, архитекторов и разработчиков, чья цель — полноценно изучить установку, конфигурирование, обслуживание и управление кластером ADB. Для получения практических навыков:
- Обязателен опыт работы с SQL;
- Желательно иметь опыт работы в Unix и с текстовым редактором vi.
Содержание курса "Эксплуатация Arenadata DB":
ДЕНЬ 1:
-
Обзор архитектуры ADB. Концепция MPP и её имплементация в ADB. Терминология и архитектура СУБД. Интерконнект. Выполнение запросов. Отказоустойчивость
-
Окружение СУБД. Основные директории СУБД. Логи. Конфигурационные файлы. Файлы данных БД. Переменные окружения. Процессы СУБД
-
Управление БД. Запуск, остановка, проверка статуса СУБД. Лабораторная работа
-
Подключение к БД. Реквизиты. Доступы. psql. Лабораторная работа
-
GUC. GUC Управление параметрами СУБД. Лабораторная работа
-
Устройство БД. Шаблоны БД. Логическая схема данных. Обзор дефолтных схем. Основные объекты для работы с БД. Лабораторная работа
-
Отказоустойчивость. Принципы безотказного функционирования БД. Спилл-файлы. Восстановление сегмента. Восстановление мастера. Лабораторная работа
-
Создание таблицы в БД. Основные правила создания таблиц. Типы данных. Распределение таблицы. Skew. Констрейнты. Тип хранения данных. Компрессия
ДЕНЬ 2:
-
Выполнение запросов. Получение плана. Оптимизаторы. Статистика выполнения. Разбор плана запроса. Redistribute и Broadcast. Поиск узких мест. Лабораторная работа
-
Партиционирование таблицы. Создание партиционированных таблиц. Ключ партиционирования. Разные типы хранения. Файлспейсы и тейблспейсы. Мульти-партиционирование. Удаление. Разбиение. Обмен партиций. Внешние таблицы. Загрузка в партиционированные таблицы. Лабораторная работа
-
Индексы. Применимость индексов. Типы. Best practices. Управление индексами. Основные параметры управления индексами в запросе. Лабораторная работа
-
MVCC. Цели. Реализация. Bloat. VACUUM. VACUUM FULL. Пример. Регламенты. Лабораторная работа
-
Транзакции. Обзор. Уровни изоляции. CAP-теорема. Лабораторная работа
-
Статистика. Цели. Сбор статистики. Лабораторная работа
-
COPY. Синтаксис. Пример. Лабораторная работа
-
Ресурсные группы. Обзор. Ограничиваемые ресурсы. Сценарии использования. GUCs. Лабораторная работа.
ДЕНЬ 3:
-
Внешние таблицы. Обычные внешние таблицы. Web-внешние таблицы.
-
GPFDIST. Сценарии. Сервер gpfdist. Создание внешних таблиц. Опции LOCATION. Достижение лучшей производительности. Параметры GUC. Примеры. Лабораторная работа
-
GPLOAD. Использование утилиты. Лабораторная работа
-
PXF. Архитектура. Директории сервиса. Конфигурационные файлы. Логи. Управление сервисом. HDFS. HBASE. Hive. JDBC. Pushdown. Batching. Pooling. User impersonation. Лабораторная работа
-
UDF. Цели. PL/SQL. PL/python. C-функции. PLContainer. Волатильность функций. Доверенность функций. Лабораторная работа
-
Apache Madlib. Цели. PL/SQL. PL/python. C-функции. PLContainer. Волатильность функций. Доверенность функций. Лабораторная работа
-
PostGIS. Обзор расширения. Пример использования.
ДЕНЬ 4:
-
Пользователи и группы. Роль и пользователь, группы. Доступы. Создание пользователей, управление. Интеграция с LDAP. Лабораторная работа
-
Бекапы. Принципы бекапов. gp_dump/gp_restore. gpbackup/gprestore. Директории и файлы. Сжатие бекапов. Перенос бекапов между разными кластерами. Внешние таблицы. Лабораторная работа
-
Мониторинг. Архитектура. Diamond. Carbon. Graphite. Grafana. Директории. Собираемые метрики. Best practices по анализу данных мониторинга. Алерты. Лабораторная работа
-
Gpperfmon. Архитектура. Каталог. Полезные таблицы. Лабораторная работа
-
Консоль администратора (Zeppelin). Архитектура. Директории. Конфигурационные файлы. Управление. Обзор ноутбуков. Подсчёт skew на основе ФС. Лабораторная работа
-
Обновление СУБД. Процесс минорного обновления СУБД. Лабораторная работа
- Обзор утилит, входящих в поставку СУБД.