Курсы BI


Основы базы данных Greenplum


Получаемые знания и навыки:

Слушатели:

  • Изучат архитектуру и принципы работы СУБД Greenplum.
  • На практике развернут кластер Greenplum.
  • Изучат принципы хранения данных в Greenplum.
  • Научатся загружать данные в Greenplum.
  • Узнают как выполняются запросы в Greenplum.
  • Изучат запросы структурированных и полуструктурированных данных, а также полнотекстовый поиск.
  • Познакомятся с аналитическими возможностями Greenplum.
  • Узнают об устройстве и применении Greenplum PXF.
  • Получат знания о настройке производительности.
  • Научатся выполнять мониторинг Greenplum.
  • Узнают об аспектах безопасности Greenplum.

 

Целевая аудитория:

Администраторы и пользователи Greenplum.

 

Предварительные требования к слушателям:

Знание SQL, опыт работы с любой реляционной СУБД, представление о NoSQL, минимальное знакомство с ОС Linux, а также о работе сетей TCP/IP.

 

Модуль 1. Введение. Знакомство с GreenPlum

Раздел 1. Что такое DWH:
  1. Что такое DWH;
  2. Что такое Data Lake
  3. Отличие DWH от Data Lake;
  4. Архитектура Data Lake;
  5. GreenPlum
Раздел 2. Знакомство с GreenPlum:
  1. Особенности GreenPlum;
  2. Дистрибьюция данных в GreenPlum;
  3. Column-хранение сжатием данных;
  4. Примеры реализации GreenPlum в DWH и Data Lake

Практика 1. Подготовка к установке GreenPlum: Настройка ОС для установки GreenPlum.

Практика 2. Установка/настройка GreenPlum.

Раздел 3. Работа с каталогом данных GreenPlum:
  1. Системный каталог;
  2. Системный каталог в psql;
  3. Таблицы кластера GreenPlum;
  4. Представления кластера GreenPlum.

Практика 3. Работа с каталогом данных GreenPlum.

Раздел 4. Конфигурирование GreenPlum:
  1. Утилиты управления кластером GreenPlum;
  2. Конфигурационные параметры в GreenPlum.

Практика 4. Конфигурирование GreenPlum.

Раздел 5. Настройка ресурсных групп в GreenPlum:
  1. Управление ресурсами СУБД;
  2. Управления памятью;
  3. Управления ЦПУ.

Практика 5. Управление ресурсными группами в GreenPlum.

Модуль 2. Особенности хранения данных в GreenPlum

Раздел 1. Хранение данных в GreenPlum:
  1. Шардирование;
  2. Физическая структура хранение данных;
  3. Особенности хранения heap таблиц;
  4. Особенности хранения column таблиц.

Практика 6. Создание таблиц: Особенности хранения heap таблиц. Особенности хранения column таблиц.

Практика 7. Сравнение степени сжатия column таблиц.

Раздел 2. Запросы:
  1. Оптимизатор Postgres;
  2. Оптимизатор GPORCA;

Практика 8. Оптимизация запросов: использование разных планировщиков запросов.

Раздел 3. Планы запросов:
  1. Планирование запросов;
  2. Реальный план запроса;

Практика 9. План запроса.

Раздел 4. Индексы:
  1. Правила использования индекса;
  2. Типы индексов;

Практика 10. Работа с индексами

Модуль 3. Администрирование GreenPlum

Раздел 1. Отказоустойчивость:
  1. Калькулятор расчетов кластера GreenPlum;
  2. Отказоустойчивость;

Практика 11. Настройка отказоустойчивости.

Практика 12. Возврат сегментов в работу.

Раздел 2. Импорт и экспорт данных:
  1. Импорт/экспорт данных;
  2. CREATE EXTERNAL TABLE;
  3. Gpfdist;
  4. PXF;

Практика 13. Настройка импорта/экспорта данных.

Раздел 3. Резервное копирование и восстановление:
  1. Проблемы восстановления и резервного копирования;
  2. gpbackup & gprestore;
  3. Альтернативные инструменты;

Практика 14. Резервное копирование и восстановление: gpbackup & gprestore.

Раздел 4. Мониторинг:
  1. Gpperfmon;
  2. Альтернативные инструменты;

Практика 15. Мониторинг: Gpperfmon.

Модуль 4. Настройка окружения GreenPlum

Раздел 1. Обзор расширения GreenPlum:
  1. Список расширений GreenPlum;
  2. Дополнительные расширения для GreenPlum;

Практика 16. Использования расширения GreenPlum.

Раздел 2. Обзор инструментов для работы с GreenPlum
  1. Выдача доступов;
  2. Резервное копирование с помощью wal-g;

Практика 17. Резервное копирование с помощью wal-g

 

Итоговая работа. Сертификация

 





« Предыдущий курс     Следующий курс»

Возврат к списку


Подпишитесь на новости