20 июня в рамках совместной сессии «Ведомостей» и Билайн бизнес под названием «Open source — новая нефть или русская рулетка?» выступил генеральный директор Билайна Сергей Анохин. Вместе с лидерами российской бизнес-аудитории и IT-отрасли он вёл дискуссию о стратегиях развития ИИ в России: стоит ли компаниям строить собственные крупные языковые модели или эффективнее использовать open‑source решения в связке с облачными технологиями.
Мероприятие прошло в павильоне «Территория инноваций» конгрессно-выставочного центра «Экспофорум» на ПМЭФ в Санкт-Петербурге.
О стратегии по ИИ
Я думаю, сегодня не найдётся ни одной компании, у которой не было бы стратегии в области LCI. Поэтому — да, такая стратегия у нас точно есть.
Когда мы начинали, перед нами стоял выбор: строить собственную большую языковую модель или пойти другим путём — использовать компактные open-source модели, которые можно дообучить под конкретные прикладные задачи. Мы выбрали второй подход. Он даёт больше гибкости и скорости: можно быстро взять готовую модель, адаптировать под нужный контекст и сразу запускать в работу.
Если проводить аналогии, то первая, наверное, из «Формулы-1» — когда ты на пит-стопе за 3–4 секунды меняешь колёса и мчишь дальше. Именно так мы воспринимаем работу с моделями: они обновляются так часто, что делать ставку на одну большую и создавать под неё отдельную инфраструктуру слишком тяжеловесно. Это путь не для всех.
Мы же делаем ставку на небольшие, маневренные команды и лёгкие модели, которые можно быстро менять и подстраивать под задачу. Такой подход, по нашему опыту, даёт лучший результат. Вся архитектура наших процессов сейчас выстроена под такую динамику — с возможностью ежедневно обновлять и заменять модели в проде.
Об open source
Мне кажется, у нас одновременно и сильная культура open source, и в то же время свои системные проблемы. Вспомните, что произошло в 2022 году, когда начался резкий курс на импортозамещение. Рынок у нас относительно небольшой, команд немного, но при этом каждая уважающая себя компания рванула делать свой технологический стек, своё комьюнити и начинать контрибьютить.
В итоге мы получили много похожих, но недоделанных систем. И сейчас встаёт по-настоящему важный и болезненный вопрос: пришло время собираться. Да, это сложный процесс — придётся признать, что какие-то решения не взлетели, и, образно говоря, «отстрелить» их.
Но если мы сможем сконсолидировать усилия — объединить комьюнити и ресурсы разработчиков — то пусть решений будет меньше, но они станут сильнее, качественнее и принесут больше пользы. Надо пройти через этот болевой порог — иначе будем и дальше плодить фрагментацию вместо технологической зрелости.
О безопасности данных
Если говорить предметно, через призму данных и тех вопросов, которые поднимались, сегодня на рынке уже более полутора тысяч open source моделей, и их число растёт с каждым днём. И, конечно, не пользоваться этим — просто грех.
Мы видим, что главными драйверами применения таких решений становятся малые и средние компании. У них зачастую нет больших бюджетов, поэтому они берут то, что доступно, адаптируют под свои задачи и создают сервисы. И, кстати, часто именно такие компании двигаются быстрее, смелее, где-то даже «наглее» — у них нет внутренних барьеров в виде сложной стратегии, политики, или «корпоративной гордости». Они просто берут готовое, делают продукт — и, надо сказать, делают его эффективно. Мы сами нередко смотрим на такие кейсы, сотрудничаем, перенимаем опыт.
Что касается безопасности и работы с данными — все технические вопросы давно решены. Open source код можно проверить, протестировать, выявить уязвимости. Бывали случаи, когда в системах находили закладки, влияющие и на производительность, и на переговоры, но всё это было вовремя выявлено и устранено.
Сейчас существуют надёжные облачные среды, в которые можно погружать модели, работая в своём закрытом периметре: загружать туда контекст, клиентские данные, всё это защищено и используется безопасно.
Технически сегодня доступно всё:
- можно арендовать вычислительные мощности (GPU как сервис);
- использовать инференс;
- развернуть готовую модель в облаке;
- или подключиться к готовым решениям.
Мы понимаем, что зрелость компаний разная — поэтому и предлагаем разные уровни доступа, чтобы снизить барьер входа и помочь быстрее начать использовать ИИ-технологии на практике.