Разработчики ИИ все чаще используют Open Source в программном обеспечении


Фото: ИЗВЕСТИЯ/Дмитрий Коротаев

Open Source и ИИ меняют правила игры: сколько можно сэкономить на разработке нейросетей

Open Source, то есть применение открытых моделей, все больше помогает ускорить внедрение, обучение и усовершенствование нейросетей. Эксперты отрасли считают, что активное распространение таких решений может начаться уже в 2025 году. Искусственный интеллект (ИИ) выступает одним из ключевых драйверов роста данного рынка. Благодаря развитию Open Source даже небольшие компании и организации с ограниченными IT-бюджетами получают доступ к современным технологиям и могут повысить свою эффективность, отмечают специалисты.

Зачем Open Source нужен разработчикам ИИ

Участники рынка отмечают, что применение открытых ИИ-решений в бизнесе разного масштаба постоянно расширяется. На данный момент это полноценный инструмент как для опытных специалистов в области ИИ, так и для тех, кто только начинает внедрять инновации в свои бизнес-процессы. Open Source позволяет заметно сократить затраты на разработку, например, за счет дообучения уже готовой модели под индивидуальные требования.

Кроме того, Open Source обладает другими явными преимуществами: вокруг таких решений создаются активные сообщества, повышается безопасность технологий и развивается весь технологический рынок.

Open Source поддерживается не только международными технологическими гигантами, такими как Google, Microsoft и IBM, но и российскими компаниями, вносящими свой вклад в развитие ИИ во всем мире. По информации исследовательского центра «Сильный ИИ в промышленности» (ИТМО), в 2024 году в топ-10 российских фирм, создающих собственные Open Source проекты или участвующих в них, входят «Яндекс», Сбер, Т-Банк, Postgres Pro, VK, Avito, Evrone, МТС, Selectel и «Академия».

— Большая часть активности в российском Open Source связана с созданием систем ИИ и языковых моделей. Основные контрибьютеры — «Яндекс» и Т-Банк. К примеру, Т-Банк недавно опубликовал в свободном доступе большую языковую модель с 32 млрд параметров и обновил еще одну на 7 млрд. «Яндекс» же открыл алгоритмы для ускорения обучения и сжатия языковых моделей, а также разработал платформу для создания нейросетевых решений, — рассказывает директор по продукту корпоративного мессенджера Compass Евгений Перов. — Важным событием стал выход VK на крупный Open Source. Компания намерена открывать исходный код своих продуктов, IT-систем и библиотек для разработчиков. Это положительно скажется на сообществе, позволив рынку использовать лучшие практики и повысить качество IT-продуктов — как открытых, так и проприетарных.

По мнению Дмитрия Овчинникова, руководителя лаборатории стратегического развития продуктов «Газинформсервиса», открытое ПО можно использовать как инструмент для тестирования проникновения в информационные системы, улучшения удобства администрирования безопасности или решения узкоспециализированных задач. Также ИИ-инструменты помогают автоматизировать работу службы поддержки и повышать производительность сотрудников, например, создавая ассистентов для разработчиков, помогающих при написании кода, — говорит он.

— Во всем мире открытый код способствует появлению инноваций и эффективных решений. Прогресс российской IT-отрасли обусловлен налаженными процессами, в том числе связанными с Open Source, а также возможностью оставаться интегрированными в международный контекст, — подчеркивает генеральный директор Team Force Руслан Гайнанов.

Open Source смещается в ИИ

Одним из ключевых драйверов развития Open Source сегодня является рынок искусственного интеллекта. Этому способствуют проекты вроде Hugging Face, PyTorch и TensorFlow, которые позволяют компаниям быстрее внедрять ИИ без необходимости начинать разработку с нуля. Появление открытых моделей — таких как Llama 2 от Meta*, Qwen от Alibaba, Gemma от Google, YandexGPT 5 Lite и Ernie от Baidu — усиливает тенденцию к доступности ИИ.

Это позволяет стартапам и некоммерческим организациям с ограниченным бюджетом применять современные технологии в своих областях. Open Source также помогает крупным игрокам, не специализирующимся на ИИ, быстрее интегрировать искусственный интеллект в свои продукты и бизнес-процессы.

— Как исследователя в области ИИ и поклонника Open Source, меня интересует развитие ИИ-инструментов для создания открытых проектов. В ИТМО мы запустили разработку открытого инструмента OSA (Open Source Advisor), который помогает научным командам превращать результаты исследований в переиспользуемые репозитории, — отмечает руководитель фронтирной лаборатории ИТМО Николай Никитин.

— Мы наблюдаем рост количества стартапов и расширение доступа к современным технологиям в нишах, которые ранее не могли инвестировать в ИИ или были ограничены в финансировании — например, социальные проекты, отдельные индустрии и малые компании, — комментирует Николай Никитин. Также он указывает на компании без опыта работы с ИИ, но заинтересованные в улучшении службы поддержки и повышении эффективности сотрудников через новые технологии.

— Open Source становится важным способом преодолеть барьеры в развитии ИИ, значительно экономя ресурсы, ускоряя вывод продуктов и делая внедрение ИИ более предсказуемым. Сообщество Open Source позволяет быстрее проверять идеи, делиться улучшениями и преодолевать технологическое отставание благодаря коллективному дообучению и повторному использованию разработок, — считает директор по работе с разработчиками «Яндекса» Сергей Бережной. — Open Source — это культура сотрудничества, скорости и эффективности, которая помогает сделать ИИ доступной технологией в реальной экономике.

Как Open Source влияет на стоимость разработки

Дообучение моделей помогает адаптировать выбранную модель под конкретные задачи, повышая ее точность в определенной сфере. Несмотря на то, что базовые LLM уже подготовлены на больших объемах данных и демонстрируют хорошие результаты, они не всегда идеально подходят для узкоспециализированных задач, например, в медицине или финансах, — отмечают представители отрасли. При дообучении модель получает новые знания на специально подобранных данных, что улучшает ее соответствие требованиям компании.

К примеру, «Авито» обучил нейросеть Mistral 7B русскому языку, адаптировав модель для работы с объявлениями. В 2024 году Т-Банк опубликовал сразу две LLM-модели — T-Pro и T-Lite, обе дообучены и адаптированы под русский язык. По данным банка, дообучение модели Qwen-2.5 от Alibaba Group (на базе которой созданы модели Т-Банка. — «Известия») позволило сократить затраты на разработку на 80–90 % по сравнению с созданием с нуля. В 2025 году была представлена открытая модель T-Pro 2.0 с гибридным режимом рассуждений. Общие расходы на разработку, включая вычислительные мощности, дообучение и зарплаты, не превысили 120 млн рублей, — сообщают представители Т-Банка.

— Нам нужно было найти оптимальный баланс между созданием LLM-моделей с нуля и использованием последних Open Source моделей. Обучение с нуля дает полный контроль над кастомизацией, но это сложно, дорого и избыточно. Открытые модели не всегда удовлетворяют нужным спецификациям, однако постоянно совершенствуются и сокращают разрыв с проприетарными аналогами, — объясняет руководитель разработки фундаментальных моделей Т-Банка Анатолий Потапов.

Для качественного дообучения применяются данные компании — это могут быть базы знаний, внутренние регламенты, приказы, должностные инструкции, договоры и технические задания.

Как сэкономить при помощи Open Source решений

Дообучение Open Source моделей выгодно не только компаниям, но и государствам. Развивающиеся страны получают возможность создавать собственные продукты на базе ИИ и извлекать из этого экономическую пользу, подобно такими технологическим лидерам, как США и Китай. Например, китайская нейросеть DeepSeek R1, выпущенная в начале 2025 года, является полностью открытой для коммерческого и исследовательского использования.

По словам Яна Лекуна, ведущего специалиста по искусственному интеллекту в Meta*, DeepSeek воспользовалась открытыми исследованиями и Open Source (например, PyTorch и Llama от Meta). Они разработали новые идеи на базе чужой работы. Поскольку их исследование опубликовано и доступно, всякий может извлечь из него пользу. Именно в этом сила открытых исследований и открытого кода.

При выпуске более 100 новых открытых ИИ-моделей Alibaba Cloud технический директор компании Джинжень Чжоу заявил, что «эта инициатива направлена на то, чтобы дать возможность разработчикам и корпорациям всех размеров эффективнее применять технологии ИИ и способствовать дальнейшему росту Open Source сообщества».

Сергей Пономаренко, директор по LLM-продуктам MTS MWS, подчеркнул, что развитие открытых LLM-моделей в России позволит как начинающим, так и опытным разработчикам и исследователям создавать нейросетевые решения, не вкладывая значительные средства в разработку и оборудование.

В конце 2023 года MTS MWS анонсировала выпуск LLM-B2B модели Cotype Nano с возможностью донастройки под конкретные задачи. Эта модель основана на Qwen 2.5 Alibaba Cloud и дообучена на разнообразных наборах данных, включая синтетические, имитирующие реальные сценарии.

Как лицензировать Open Source

Дальнейшее распространение и применение Open Source сильно зависит от развития системы лицензирования. Появились лицензии, защищающие авторов от неправомерного использования их труда. Например, при коммерческом применении открытого кода крупной компанией лицензия может требовать публикации улучшений в открытом доступе. Это позволяет сохранить принцип «открытости» проекта.

— Предпочтение выбирают Open Source из-за отсутствия лицензионных отчислений, что снижает общий IT-бюджет за счет постепенной замены менее критичных сервисов компании. Такие решения не требуют перестраивания бизнес-процессов, а наоборот, позволяют дорабатывать софт под уже действующие, — считает технический директор IT-кластера МТС Банка Сергей Харитонов.

Тем не менее бывают исключения: видя интерес сообщества, компании упрощают условия лицензирования, расширяя возможности для исследований и экспериментов. Например, в начале года «Яндекс» выпустил pretrain-версию YandexGPT 5 Lite с ограничениями на коммерческое применение. Несмотря на более 15 тыс. скачиваний менее чем за месяц и создание свыше десяти квантованных моделей, сообщество выразило недовольство ограничениями. Позднее компания выпустила instruct-версию и обновила лицензию. Теперь модель разрешено использовать для любых целей, включая коммерческие, при условии, что объем выходных токенов не превышает 10 млн в месяц. Этого достаточно для поддержки чат-ботов на небольших и средних сайтах, автоматизации описания товаров в интернет-магазинах с ограниченным ассортиментом, помощи клиентам в сервисных центрах и анализа отзывов на площадках с умеренным трафиком — уточняют в компании.

ИИ Open Source продолжают активно применять как малый бизнес, так и крупные компании. В сочетании с ростом числа участников сообщества и развитием лицензий это создает благоприятную среду для инноваций и ускорения технологического прогресса. Открытые технологии все чаще интегрируются в гибридные решения, где базовая технология бесплатна и доступна всем, а платными являются дополнительные услуги — интеграции, поддержка или кастомизация. Такой подход способствует не только формированию репутации технологического лидера и развитию отрасли, но и приносит прямую выгоду бизнесу.

*Компания Meta признана экстремистской организацией в РФ