Технологическая платформа «Авито» выпустила в открытый доступ обновлённые версии своих ИИ-моделей: A-Vibe (текстовая) и A-Vision (мультимодальная, 8 млрд параметров). Это первые полностью русскоязычные нейросети, обученные и адаптированные под реалии российского рынка.
Модели распространяются под лицензией Apache 2.0, что позволяет использовать их без ограничений.
Ключевые особенности
- A-Vibe и A-Vision основаны на доработанных архитектурах Qwen 3 и Qwen 2.5-VL и обучены на корпоративных и публичных датасетах, включая данные реальной электронной торговли.
- В модели интегрирован собственный токенизатор для русского языка. Он обеспечивает прирост скорости генерации до 2 раз и более точное выделение морфем и контекстов.
- Поддержка function calling позволяет использовать внешние инструменты и API. Модели могут не только отвечать на запросы, но и анализировать таблицы, обращаться к базам данных и проводить вычисления.
- Контекстное окно до 32 000 токенов (≈ 100 страниц текста) обеспечивает обработку объёмных документов и аналитических запросов.
- Модели не требуют длительной донастройки. Команды вроде «сделай резюме документа» или «проанализируй таблицу» работают «из коробки».
Области применения
- Бизнес — автоматизация документооборота, генерация описаний и контента, внедрение чат-ботов и ассистентов.
- Разработчики — возможность дообучения и локального развёртывания без крупных затрат на инфраструктуру.
- Образование — использование промышленных ИИ-моделей в учебных курсах и исследовательских проектах.
- Наука — эксперименты с мультимодальными архитектурами и развитие отечественной ИИ-экосистемы.
Сравнение и тесты
Команда Avito Tech перевела на русский язык четыре международных бенчмарка для объективной оценки качества моделей:
- MATH-500 — сложные задачи по математике школьного и вузовского уровня;
- GPQA Diamond — научные вопросы уровня аспирантуры по естественным дисциплинам;
- DROP_RU — проверка способности к рассуждениям и численным выводам;
- BFCL V3 — тестирование взаимодействия с внешними инструментами (агентные сценарии).
На российских тестах MERA и RU Arena Hard модель A-Vibe заняла 1-е место среди лёгких моделей. A-Vision показала высокие результаты при анализе графиков, документов и изображений с текстом.
Модели A-Vibe и A-Vision уже размещены на Hugging Face вместе с подробной технической документацией, примерами интеграции и исследовательской статьёй, описывающей процесс обучения и тестирования.