Общая информация
Релиз CedrusData 422-1 вышел 25 августа 2023 года и основан на Trino 422.
Скачайте архив по ссылке и распакуйте с помощью команд:
https://downloads.cedrusdata.ru/releases/cedrus-422-1.tar.gz
tar -xf cedrus-422-1.tar.gz
cedrus-422-1/bin/launcher run
Запуск в Docker-контейнере:
docker run -d --rm --name cedrus-server -p 8080:8080 \
cr.yandex/crpjtvqf29mpabhmrf1s/cedrus:422-1
Ключевые изменения
Ускорение запросов к partitioned таблицам Iceberg
Документация: https://docs.cedrusdata.ru/latest/connector/iceberg.html#iceberg-partitioned-execution
Мы добавили в Iceberg коннектор возможность предоставлять оптимизатору информацию о партиционировании таблиц. Это позволяет оптимизатору реже использовать операторы `Exchange` при работе с партиционированными таблицами. Например, следующий запрос в CedrusData может быть выполнен без `Exchange`, если ключ партиционирования таблицы совпадает с ключем группировки:
SELECT a, SUM(b)
FROM t
GROUP BY a

Рис 1 — Сравнение планов CedrusData и Trino при работе с partitioned таблицей Iceberg
Локальный дисковый кэш данных для Iceberg
Документация: https://docs.cedrusdata.ru/latest/connector/iceberg.html#iceberg-data-cache
В версии 417-1 мы добавили локальный дисковый кеш для Hive коннектора. В версии 422-1 вы можете использовать данный кэш и в Iceberg коннекторе. Для этого необходимо указать в конфигурации коннектора путь к директории, в которой будут сохранены закешированные данные.

Рис 2 — Локальный дисковый кэш Iceberg
Получение групп пользователей из LDAP
Документация: https://docs.cedrusdata.ru/latest/security/group-ldap.html
Trino имеет встроенную возможность аутентификации пользователей на основе LDAP. В данном релизе мы добавили возможность использования LDAP для получения списка групп пользователя. Группы могут быть использованы для более удобного управления правами доступа.

Рис 3 — Получение групп пользователей из LDAP
Дальнейшие планы
Наша команда сосредоточена на финализации важного изменения ядра Trino, которое позволит переиспользовать результаты выполнения повторяющихся подзапросов. Кроме того, мы добавляем в коннектор Greenplum возможность чтения данных таблиц напрямую с сегментов, минуя координатор. Мы так же завершаем интеграцию CedrusData с Apache Ranger. Наконец, мы начали работу над новым UI, который даст возможность пользователям запускать SQL запросы к CedrusData, а администраторам удобно управлять кластером.
Свяжитесь с нами, что бы узнать больше о CedrusData и Trino.
