Разработчики, стартапы, бизнес и исследователи смогут получить готовые инструменты для анализа документов, автоматизации контента и создания ИИ-ассистентов, сокращая затраты на запуск и работу моделей до 50% в сравнении с другими опенсорс-нейросетями. Модели оснащены собственным токенизатором и поддерживают возможность вызова внешних инструментов (function calling) для создания автономных систем и агентов. В разработку компания проинвестировала около полумиллиарда рублей, включая затраты на оборудование, команду и эксперименты. A-Vibe заняла первое место в классе легких нейросетей в популярных открытых тестах на понимание русского языка, работы с кодом и решение сложных задач. Модели доступны под открытой лицензией Apache 2.0 для любого использования.
«Открытие наших генеративных ИИ-моделей – это инвестиция в будущее российской технологической экосистемы. Благодаря таким инициативам ИИ становится доступным не только корпорациям, но и студентам, стартапам, исследователям и небольшим командам. Чем больше разработчиков вовлечено в создание ИИ-решений, тем быстрее развивается вся отрасль. Мы хотим внести свой вклад в этот процесс», – Андрей Рыбинцев, управляющий директор по искусственному интеллекту «Авито».
Текстовая A-Vibe и мультимодальная A-Vision созданы Авито Тех, дочерней технологической компанией Авито, на базе открытых моделей Qwen3 и Qwen2.5-VL с 8 млрд параметров, и глубоко адаптированы под российский рынок. Команда Авито разработала собственный токенизатор для русского текста – это ускоряет генерацию текста почти вдвое и делает результаты точнее, чем у зарубежных аналогов.
Модели обучались на реальных данных в том числе из электронной коммерции. Поэтому они понимают контекст онлайн-торговли и эффективно работают с товарными описаниями, каталогами, запросами покупателей – без долгой адаптации под конкретный бизнес.
Нейросети работают с большими объемами текста – до 100 страниц за раз (32 тысячи токенов). Они готовы к использованию без сложной настройки: понимают простые команды, например: «сделай резюме документа» или «проанализируй таблицу» без дополнительных инструкций. Поддержка вызова внешних инструментов (function calling) позволяет создавать ИИ-агентов, которые не только отвечают на вопросы, но и сами выполняют действия за пользователя: ищут информацию в базах данных, делают расчеты, обращаются к другим сервисам по API.
Модели уже внедрены во многие сервисы Авито и теперь становятся доступными для образования, науки и бизнеса. Они подойдут как небольшим командам и стартапам, так и крупным компаниям или исследовательским центрам.
«Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании тратят месяцы на адаптацию зарубежных решений под российские реалии. Мы даем готовые инструменты, которые экономят миллионы рублей на разработке. Наши модели компактны и оптимизированы для эффективного использования ресурсов, что особенно важно для стартапов и образовательных инициатив», – Анастасия Рысьмятова, руководитель разработки больших языковых моделей «Авито».
Большинство международных тестов для оценки языковых моделей созданы для английского языка и не подходят для объективной оценки качества работы на русском. Команда Авито перевела на русский четыре ведущих международных бенчмарка и выложила их в открытый доступ для всех разработчиков русскоязычных моделей:
На популярных российских бенчмарках MERA и RU Arena Hard модель A-Vibe заняла первое место в классе лёгких нейросетей и опередила многие более крупные модели. Она показала сильные результаты в работе с кодом и отраслевых задачах. A-Vision эффективно справляется с анализом сложных документов, графиков, изображений с текстом и научных схем.
Модели доступны на платформе Hugging Face с подробной документацией и примерами использования. Команда также опубликовала техническую статью с разбором обучения и тестирования.