В ходе независимого тестирования на ведущих платформах оценки производительности, включая MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard, Qwen2.5-Max продемонстрировала выдающиеся результаты. Особенно примечательно, что модель превзошла показатели DeepSeek V3 в нескольких ключевых тестах и успешно конкурирует с признанными лидерами отрасли – GPT-4o и Claude-3.5-Sonnet.
Обновленная версия отличается существенным улучшением скоростных показателей и точности выполнения задач. Модель особенно эффективна в обработке текстов, переводе и генерации контента, демонстрируя заметный прогресс в работе со сложными запросами.
Alibaba Cloud планирует интегрировать Qwen2.5-Max в свою экосистему облачных сервисов. Это позволит клиентам компании использовать передовые возможности искусственного интеллекта для оптимизации бизнес-процессов, улучшения качества обслуживания клиентов и автоматизации обработки данных.
Доступ к новой модели уже открыт через платформу Qwen Chat, где пользователи могут протестировать её возможности. Для разработчиков предусмотрен доступ через API после прохождения регистрации в Alibaba Cloud и получения необходимых ключей доступа в сервисе Model Studio.
Этот релиз происходит на фоне недавнего запуска китайской нейросети DeepSeek, которая привлекла внимание мирового технологического сообщества своей эффективностью при сравнительно небольших затратах на разработку. Появление DeepSeek вызвало значительные колебания на фондовом рынке, приведя к снижению капитализации компаний индекса Nasdaq 100 на триллион долларов. Однако вскоре после публичного запуска регистрация новых пользователей была приостановлена из-за множественных попыток кибератак на систему.