Получаемые знания и навыки:
Слушатели:
- Изучат архитектуру и принципы работы СУБД Greenplum.
- На практике развернут кластер Greenplum.
- Изучат принципы хранения данных в Greenplum.
- Научатся загружать данные в Greenplum.
- Узнают как выполняются запросы в Greenplum.
- Изучат запросы структурированных и полуструктурированных данных, а также полнотекстовый поиск.
- Познакомятся с аналитическими возможностями Greenplum.
- Узнают об устройстве и применении Greenplum PXF.
- Получат знания о настройке производительности.
- Научатся выполнять мониторинг Greenplum.
- Узнают об аспектах безопасности Greenplum.
Целевая аудитория:
Администраторы и пользователи Greenplum.
Предварительные требования к слушателям:
Знание SQL, опыт работы с любой реляционной СУБД, представление о NoSQL, минимальное знакомство с ОС Linux, а также о работе сетей TCP/IP.
Модуль 1. Введение. Знакомство с GreenPlum
Раздел 1. Что такое DWH:
- Что такое DWH;
- Что такое Data Lake
- Отличие DWH от Data Lake;
- Архитектура Data Lake;
- GreenPlum
Раздел 2. Знакомство с GreenPlum:
- Особенности GreenPlum;
- Дистрибьюция данных в GreenPlum;
- Column-хранение сжатием данных;
- Примеры реализации GreenPlum в DWH и Data Lake
Практика 1. Подготовка к установке GreenPlum: Настройка ОС для установки GreenPlum.
Практика 2. Установка/настройка GreenPlum.
Раздел 3. Работа с каталогом данных GreenPlum:
- Системный каталог;
- Системный каталог в psql;
- Таблицы кластера GreenPlum;
- Представления кластера GreenPlum.
Практика 3. Работа с каталогом данных GreenPlum.
Раздел 4. Конфигурирование GreenPlum:
- Утилиты управления кластером GreenPlum;
- Конфигурационные параметры в GreenPlum.
Практика 4. Конфигурирование GreenPlum.
Раздел 5. Настройка ресурсных групп в GreenPlum:
- Управление ресурсами СУБД;
- Управления памятью;
- Управления ЦПУ.
Практика 5. Управление ресурсными группами в GreenPlum.
Модуль 2. Особенности хранения данных в GreenPlum
Раздел 1. Хранение данных в GreenPlum:
- Шардирование;
- Физическая структура хранение данных;
- Особенности хранения heap таблиц;
- Особенности хранения column таблиц.
Практика 6. Создание таблиц: Особенности хранения heap таблиц. Особенности хранения column таблиц.
Практика 7. Сравнение степени сжатия column таблиц.
Раздел 2. Запросы:
- Оптимизатор Postgres;
- Оптимизатор GPORCA;
Практика 8. Оптимизация запросов: использование разных планировщиков запросов.
Раздел 3. Планы запросов:
- Планирование запросов;
- Реальный план запроса;
Практика 9. План запроса.
Раздел 4. Индексы:
- Правила использования индекса;
- Типы индексов;
Практика 10. Работа с индексами
Модуль 3. Администрирование GreenPlum
Раздел 1. Отказоустойчивость:
- Калькулятор расчетов кластера GreenPlum;
- Отказоустойчивость;
Практика 11. Настройка отказоустойчивости.
Практика 12. Возврат сегментов в работу.
Раздел 2. Импорт и экспорт данных:
- Импорт/экспорт данных;
- CREATE EXTERNAL TABLE;
- Gpfdist;
- PXF;
Практика 13. Настройка импорта/экспорта данных.
Раздел 3. Резервное копирование и восстановление:
- Проблемы восстановления и резервного копирования;
- gpbackup & gprestore;
- Альтернативные инструменты;
Практика 14. Резервное копирование и восстановление: gpbackup & gprestore.
Раздел 4. Мониторинг:
- Gpperfmon;
- Альтернативные инструменты;
Практика 15. Мониторинг: Gpperfmon.
Модуль 4. Настройка окружения GreenPlum
Раздел 1. Обзор расширения GreenPlum:
- Список расширений GreenPlum;
- Дополнительные расширения для GreenPlum;
Практика 16. Использования расширения GreenPlum.
Раздел 2. Обзор инструментов для работы с GreenPlum
- Выдача доступов;
- Резервное копирование с помощью wal-g;
Практика 17. Резервное копирование с помощью wal-g
Итоговая работа. Сертификация