
Учебный курс предназначен для практического ознакомления с возможностями, архитектурой и администрированием массивно-параллельной распределенной СУБД Greenplum.
Получаемые знания и навыки
Слушатели:
- Изучат архитектуру и принципы работы СУБД Greenplum.
- На практике развернут кластер Greenplum.
- Изучат принципы хранения данных в Greenplum.
- Научатся загружать данные в Greenplum.
- Узнают как выполняются запросы в Greenplum.
- Изучат запросы структурированных и полуструктурированных данных, а также полнотекстовый поиск.
- Познакомятся с аналитическими возможностями Greenplum.
- Узнают об устройстве и применении Greenplum PXF.
- Получат знания о настройке производительности.
- Научатся выполнять мониторинг Greenplum.
- Узнают об аспектах безопасности Greenplum.
Целевая аудитория:
Администраторы и пользователи Greenplum.
Предварительные требования к слушателям:
Знание SQL, опыт работы с любой реляционной СУБД, представление о NoSQL, минимальное знакомство с ОС Linux, а также о работе сетей TCP/IP.
Программа курса.
1 Знакомство с базой данных Greenplum.
1.1 Ограничения реляционных СУБД.
1.2 Альтернативы реляционным СУБД.
1.3 Массивно-параллельная обработка.
1.4 Архитектура Greenplum.
2 Развертывание Greenplum.
2.1 Требования к платформе.
2.2 Оценка потребной емкости.
2.3 Варианты установки.
2.4 Настройка системы для установки Greenplum.
2.5 Создание областей хранения.
2.6 Установка Greenplum.
2.7 Проверка системы gpcheckperf.
2.8 Инициализация Greenplum.
2.9 Установка дополнительных модулей.
2.10 Настройка временной зоны и локали.
2.11 Настройка iptables.
2.12 Установка утилит управления.
2.13 Переменные окружения.
3 Хранение данных в Greenplum.
3.1 Определение объектов базы данных.
3.2 Распределение данных.
3.3 Полиморфное хранилище.
3.4 Партиционирование данных.
3.5 Колоночное хранилище.
3.6 Сжатие.
3.7 Таблицы, оптимизированные для добавления данных.
3.8 Внешние таблицы.
3.9 Индексирование.
4 Загрузка данных в Greenplum.
4.1 Команда INSERT.
4.2 Команда COPY.
4.3 Утилита gpfdist.
4.4 Утилита gpload.
5 Запросы в Greenplum.
5.1 Обработка запросов в Greenplum.
5.2 Оптимизатор GPORCA.
5.3 PostgreSQL запросы.
5.4 Common Table Expressions.
5.5 Функции и операторы.
5.6 Работа с JSON.
5.7 Работа с XML.
5.8 Полнотекстовый поиск.
5.9 Использование Greenplum MapReduce.
5.10 Производительность запросов.
5.11 Обслуживание spill файлов.
5.12 Профилирование.
5.13 Расширения для языков программирования.
6 Аналитика в Greenplum.
6.1 Возможности MADLib.
6.2 Интерфейс R.
6.3 Анализ текстовых данных.
6.4 Архитектура Solr/GPText.
6.5 Интеграция с Apache Kafka.
7 Инфраструктура Platform Extension Framework.
7.1 Коннекторы PXF.
7.2 Архитектура PXF.
7.3 Внешние таблицы в PXF.
7.4 Доступ к Apache Hadoop.
8 Мониторинг и обслуживание Greenplum.
8.1 Использование Greenplum Command Center.
8.2 Инструменты Resource Queues.
8.3 Менеджер нагрузки Greenplum Workload Manager.
8.4 Утилиты менеджмента Greenplum.
9 Настройка производительности.
9.1 Определение производительности базы данных.
9.2 Стандартные причины проблемы с производительностью.
9.3 Использование оперативной памяти.
9.4 Выявление узких мест.
10 Безопасность.
10.1 Основы безопасности Greenplum.
10.2 Сетевые порты.
10.3 Аутентификация клиентов.
10.4 Настройка авторизации.
10.5 Аудит.
10.6 Шифрование данных и сетевых соединений.