Платформа CedrusData основана на распределенном SQL-движке Trino. Функционал платформы позволяет создавать вычислительные кластера для высокопроизводительной обработки больших объемов данных без создания дополнительных копий и необходимости реорганизации существующей инфраструктуры.
Кластера CedrusData выполняют SQL запросы, но не хранят данные. Это позволяет быстро масштабировать вычислительные ресурсы и гибко распределять их между потребителями в облаке или on-premise.
CedrusData не требует создания дополнительных копий данных и новых ETL/ELT процессов. Вы можете создавать столько вычислительных кластеров, сколько необходимо вашей организации.
CedrusData предоставляет нативную интеграцию с data lake стеком (Orc/Parquet/Avro, HDFS/S3, Hive/Iceberg), реляционными СУБД и нереляционным источникам. Работайте со всеми данными организации через единый SQL-интерфейс без необходимости существенной переработки текущей инфраструктуры.
CedrusData совместим со всеми популярными BI-продуктами, включая Apache Superset, Tableau, PowerBI и QlikView.
CedrusData реализует MPP (massive parallel processing) архитектуру, которая эффективно утилизирует все ресурсы CPU вашего вычислительного кластера.
Коннекторы CedrusData позволяют выборочно переносить часть вычислений в источники, минимизируя перемещение данных.
CedrusData работает с данными, хранящимися в открытых файловых форматах Orc, Parquet и Avro под управлением Hive Metastore или Iceberg. Это позволяет вам использовать самые современные open-source инструменты для решения смежных аналитических задач (ETL/ELT, batch processing, stream processing) и минимизировать риски vendor lock-in.
Уменьшайте расходы на аналитическую платформу за счет переноса данных в дешевые файловые хранилища под управлением HDFS или S3.