Технология

Платформа CedrusData основана на распределенном SQL-движке Trino. Функционал платформы позволяет создавать вычислительные кластера для высокопроизводительной обработки больших объемов данных без создания дополнительных копий и необходимости реорганизации существующей инфраструктуры.

Разделение compute и storage

Эластичное масштабирование

Кластера CedrusData выполняют SQL запросы, но не хранят данные. Это позволяет быстро масштабировать вычислительные ресурсы и гибко распределять их между потребителями в облаке или on-premise.

Доступ к данным без копирования

CedrusData не требует создания дополнительных копий данных и новых ETL/ELT процессов. Вы можете создавать столько вычислительных кластеров, сколько необходимо вашей организации.

Разделение compute и storage
Интеграция

Интеграция

Источники данных

CedrusData предоставляет нативную интеграцию с data lake стеком (Orc/Parquet/Avro, HDFS/S3, Hive/Iceberg), реляционными СУБД и нереляционным источникам. Работайте со всеми данными организации через единый SQL-интерфейс без необходимости существенной переработки текущей инфраструктуры.

Business Intelligence

CedrusData совместим со всеми популярными BI-продуктами, включая Apache Superset, Tableau, PowerBI и QlikView.

Производительность

Параллелизм

CedrusData реализует MPP (massive parallel processing) архитектуру, которая эффективно утилизирует все ресурсы CPU вашего вычислительного кластера.

Pushdown

Коннекторы CedrusData позволяют выборочно переносить часть вычислений в источники, минимизируя перемещение данных.

Производительность
Открытые стандарты

Открытые стандарты

Современный стек

CedrusData работает с данными, хранящимися в открытых файловых форматах Orc, Parquet и Avro под управлением Hive Metastore или Iceberg. Это позволяет вам использовать самые современные open-source инструменты для решения смежных аналитических задач (ETL/ELT, batch processing, stream processing) и минимизировать риски vendor lock-in.

Дешевое хранилище

Уменьшайте расходы на аналитическую платформу за счет переноса данных в дешевые файловые хранилища под управлением HDFS или S3.