Один из крупнейших российских онлайн-сервисов решил поделиться своими технологиями. Теперь любой бизнес может использовать ИИ-модели, которые «Авито» создавала для собственных нужд.

Две модели — текстовая A-Vibe и мультимодальная A-Vision — теперь доступны на платформе Hugging Face. По сути, это аналог GitHub для разработчиков ИИ. Модели построены на базе китайских технологий Alibaba, но дообучены на российских данных.
Что это значит для бизнеса? Магазины могут автоматически создавать описания товаров, анализировать таблицы, извлекать данные из карточек. Модели понимают до 32 000 токенов — примерно 100 страниц текста.
Станислав Колесниченко из Sk Capital называет это важным шагом. До сих пор у российского рынка не было открытых моделей, обученных именно на русском языке с учетом местной специфики.
Инвестиции в ₽500 млн. включали затраты на инфраструктуру, команду и эксперименты. По международным меркам — скромная сумма. Например, западные компании тратят на аналогичные проекты миллиарды долларов.
Есть и ограничения. Для работы с моделями нужны специалисты по машинному обучению — их на рынке немного. Также бизнесу потребуется собственная система модерации ответов.
Алексей Хахунов из Dbrain обращает внимание на другой аспект. Модели можно разворачивать на собственных серверах — это важно для банков и медицинских организаций, которые не могут передавать данные в облака.
Пока модели лучше всего справляются с прикладными задачами: проверка тональности ответов операторов, суммаризация писем, транскрибация. Сложные аналитические задачи им пока не по зубам.
«Авито» вряд ли сможет напрямую заработать на этом проекте. Скорее, это инвестиция в развитие рынка и укрепление бренда. Компания создала стандарт, который теперь будут использовать другие.

