Авито открывает собственные нейромодели для сообщества разработчиков

Технологическая платформа «Авито» выпустила в открытый доступ обновлённые версии своих ИИ-моделей: A-Vibe (текстовая) и A-Vision (мультимодальная, 8 млрд параметров). Это первые полностью русскоязычные нейросети, обученные и адаптированные под реалии российского рынка.

Модели распространяются под лицензией Apache 2.0, что позволяет использовать их без ограничений.

Ключевые особенности

  • A-Vibe и A-Vision основаны на доработанных архитектурах Qwen 3 и Qwen 2.5-VL и обучены на корпоративных и публичных датасетах, включая данные реальной электронной торговли.
  • В модели интегрирован собственный токенизатор для русского языка. Он обеспечивает прирост скорости генерации до 2 раз и более точное выделение морфем и контекстов.
  • Поддержка function calling позволяет использовать внешние инструменты и API. Модели могут не только отвечать на запросы, но и анализировать таблицы, обращаться к базам данных и проводить вычисления.
  • Контекстное окно до 32 000 токенов (≈ 100 страниц текста) обеспечивает обработку объёмных документов и аналитических запросов.
  • Модели не требуют длительной донастройки. Команды вроде «сделай резюме документа» или «проанализируй таблицу» работают «из коробки».

Области применения

  • Бизнес — автоматизация документооборота, генерация описаний и контента, внедрение чат-ботов и ассистентов.
  • Разработчики — возможность дообучения и локального развёртывания без крупных затрат на инфраструктуру.
  • Образование — использование промышленных ИИ-моделей в учебных курсах и исследовательских проектах.
  • Наука — эксперименты с мультимодальными архитектурами и развитие отечественной ИИ-экосистемы.

Сравнение и тесты

Команда Avito Tech перевела на русский язык четыре международных бенчмарка для объективной оценки качества моделей:

  • MATH-500 — сложные задачи по математике школьного и вузовского уровня;
  • GPQA Diamond — научные вопросы уровня аспирантуры по естественным дисциплинам;
  • DROP_RU — проверка способности к рассуждениям и численным выводам;
  • BFCL V3 — тестирование взаимодействия с внешними инструментами (агентные сценарии).

На российских тестах MERA и RU Arena Hard модель A-Vibe заняла 1-е место среди лёгких моделей. A-Vision показала высокие результаты при анализе графиков, документов и изображений с текстом.

Модели A-Vibe и A-Vision уже размещены на Hugging Face вместе с подробной технической документацией, примерами интеграции и исследовательской статьёй, описывающей процесс обучения и тестирования.

Понравилась статья? Поделиться с друзьями:
Добавить комментарий