Актуальные проблемы реализации data-стратегии в российских компаниях | Запись выступления

В докладе рассмотрены сложности, с которыми сталкиваются российские компании при попытке масштабирования процессов принятия решений на основе данных: дефицит зрелой инфраструктуры, нерациональное использование внутренних ресурсов, и противоречивый информационный фон, создаваемый многочисленными новыми продуктами

Спикер:

Владимир Озеров

Генеральный директор CedrusData

С развитием ИИ у многих команд возникает самонадеянное желание забрать разработку всех продуктов себе, особенно в условиях сокращения бюджетов и недоверия к вендорам. Однако здесь важно разделять слои: прикладной уровень действительно можно быстро сделать самому (появляются даже кейсы, когда сотрудники за неделю создают то, что казалось невозможным). А вот инфраструктурный уровень (базы данных, движки, системы хранения) — это уникальный опыт инженеров, который невозможно «перенести» или быстро воспроизвести. Поэтому попытки тянуть на себя поддержку сложной инфраструктуры должны быть очень выверенными, и зачастую проще (и экономически эффективнее) работать с вендорами.

Для работы ИИ критически важна инфраструктура хранения, особенно для неструктурированных данных (договоры, аудио, видео), которые раньше были «мертвым грузом», а теперь стали ценным активом. Де-факто стандартом для этого является S3-совместимое хранилище. Но в российских реалиях выбор ограничен: Open-source решения либо не заточены под обычные файлы (Hadoop), либо слишком сложны в поддержке (Ceph требует целую команду), а популярный Minio ушёл. В итоге добиться даже минимальной рабочей инфраструктуры для ИИ в России оказалось сложной задачей.

Прокрутить вверх