CedrusData

Выбрасываем Java и кратно ускоряем Spark/Trino… Или пока нет? | Запись выступления

Velox — высокопроизводительная C++ библиотека для ускорения Presto, Spark и аналитических СУБД. Обсуждаем ее архитектуру, преимущества и готовность к использованию.

java-presto
 

Спикер:

Павел Солодовников, Старший инженер-программист, CedrusData

Посмотреть в Youtube

Приглашаем выступить с докладом о том, как Trino и Iceberg применяются в российских компаниях. Если хотите поделиться своим кейсом или опытом — заполните форму докладчика. 

C++ библиотека Velox, имеет большой потенциал для ускорения Presto и Spark, а также других аналитических систем обработки данных и СУБД. Рассмотрим основные и наиболее зрелые на текущий момент интеграции этой библиотеки с существующими популярными OLAP-/ML-системами.

В первой части доклада погрузились в историю концепции Deconstructed Database (модульные, pluggable компоненты СУБД) и поговорили о месте Velox в ней.

Во второй части обсудили Native Execution в целом, преимуществах нативного исполнения и чем полезна (или жизненно необходима) векторизация вычислений, особенно для аналитических нагрузок.

Далее обсудили те проблемы, с которыми столкнулась компания Meta* в оптимизации своей инфраструктуры, и решение, которое было принято для улучшения ситуации, а именно: написание C++ библиотеки Velox для ускорения разнообразных workload внутри компании.

В заключительной части обсудим интеграции Velox с Presto, Spark и PyTorch, их зрелость и применимость в текущих реалиях, а также взглянем на бенчмарки от создателей этих продуктов.

Будет полезно разработчикам СУБД, разработчикам движков исполнения запросов, дата-инженерам.

* Деятельность компании Meta запрещена на территории РФ.

Прокрутить вверх