Спикер:
Павел Солодовников, Старший инженер-программист, CedrusData
Приглашаем выступить с докладом о том, как Trino и Iceberg применяются в российских компаниях. Если хотите поделиться своим кейсом или опытом — заполните форму докладчика.
C++ библиотека Velox, имеет большой потенциал для ускорения Presto и Spark, а также других аналитических систем обработки данных и СУБД. Рассмотрим основные и наиболее зрелые на текущий момент интеграции этой библиотеки с существующими популярными OLAP-/ML-системами.
В первой части доклада погрузились в историю концепции Deconstructed Database (модульные, pluggable компоненты СУБД) и поговорили о месте Velox в ней.
Во второй части обсудили Native Execution в целом, преимуществах нативного исполнения и чем полезна (или жизненно необходима) векторизация вычислений, особенно для аналитических нагрузок.
Далее обсудили те проблемы, с которыми столкнулась компания Meta* в оптимизации своей инфраструктуры, и решение, которое было принято для улучшения ситуации, а именно: написание C++ библиотеки Velox для ускорения разнообразных workload внутри компании.
В заключительной части обсудим интеграции Velox с Presto, Spark и PyTorch, их зрелость и применимость в текущих реалиях, а также взглянем на бенчмарки от создателей этих продуктов.
Будет полезно разработчикам СУБД, разработчикам движков исполнения запросов, дата-инженерам.
* Деятельность компании Meta запрещена на территории РФ.
