Научные волонтёры протестировали Qwen2.5-Max: новую большую модель ИИ из Китая

Alibaba Cloud представила новую огромную ИИ-модель Qwen2.5-Max, которая произвела настоящую революцию в области искусственного интеллекта.

Ключевые особенности модели:

Модель основана на архитектуре Mixture-of-Experts (MoE, при ответе активируется только часть токенов, экономя вычислительные ресурсы) и обучена на более чем 20 триллионах токенов
Отличается улучшенной производительностью и точностью, способна лучше справляться с задачами, требующими глубокого понимания контекста, включая анализ текста, перевод и генерацию контента

Доступность и использование

Модель уже доступна через:

Бесплатно в сервисе Qwen Chat.
API для разработчиков. Для получения доступа необходимо получить стартовый «грант» в Alibaba Cloud (к сожалению, пока активировать не удалось).

P.S. в рамках чистых цен она дороже чем даже gpt4o в 3 раза за миллион токенов.

В отличие от других моделей в семействе Qwen2.5, версия Max будет доступна только через API и не будет выпущена с открытым исходным кодом.

Дополнительные возможности

Модель предлагает впечатляющий функционал:

Отличное понимание русского языка
Генерация изображений и видео (пока только обещают) в сразу в чате (как Dall-e3 в chatgpt)
Продвинутый ИИ-поиск
Работает бесплатно

Тесты

Тестировали модель только в веб-чате, так как по API доступ получить не удалось.

Генерация текста – адекватный, качественный ответ на запрос, но модели семейства Qwen2.5 и ранее славились неплохим русским языком, модель базируется на обновленных в январе 2025 моделях семейства Qwen2.5-1M (с объемом удержания контекста до 1миллиона токенов, это означает, что модель способна работать с длинными текстами, сохраняя логическую связь между частями документа.).

Генерация картинок – возможность выбрать соотношение сторон 1:1, 4:3, 3:4, 16:9 и 9:16.

Судя по количеству пальцев, немного пластиковому скинтону и уклоном в реализм при базовых запросах — это генерируется на чем-то вроде SDXL-Turbo (картинка готова уже через пару секунд).

Распознавание изображений: получена ошибка «Model qwen-max-latest is not image capable.» очень жаль, но в веб-чате можно сменить модель на Qwen2.5-VL-72B, и получив резульат вернутся к чату с большой моделью.

Генерация видео пока кнопка не активна.

Генеративный поиск

Очень хорошо, не только быстро поискал релевантные ссылки, но и стройную идею описал. Выдача на уровне поиска GPT-4o, но им обоим далеко до Perplexity.

ВАЖНО: в отличии от других умеет забирать информацию из ВК.

Программирование – несколько скриптов с несложной логикой разработал без ошибок, что-то более сложное без API решили не пробовать. Qwen-coder и так считается одной из лучших открытых моделей, так что думаю этот функционал не должен был стать хуже.

Выводы:

Отличное обновление линейки моделей семейства Qwen! В веб-чате и бесплатная версия.

По этому рекламному графику, от производителей модели, видно, что в синтетических тестах-бенчмарках она превосходит другие модели в этих самих тестах. Попробуйте сами, подойдет ли она для ваших задач. Большинство вопросов от большой языковой модели она решает и на данный момент бесплатна. (Не забывайте, что используя веб-чаты в сервисах вы оставляете свой контент для улучшения нейросетей у них).

Это не прорыв, просто логичное улучшение предыдущих моделей, модель Qwen2.5-Plus тоже была очень хороша, но при прямом сравнение прямо в сервисе Qwen Chat (кнопочка Add Model сверху чата) – Max генерирует ответ быстрее и более развернуто, что говорит в плюс его MoE архитектуре. Опять же, попробуйте сами, хороший веб-чат, доступный каждому. Непонятно только почему они не подключили Qwen2.5-VL, так же вышедший ранее, видимо, как и генерация видео (а это будет интересно!) добавят после недель Китайского нового года.

Qwen прочитал эту статью о себе, и я конечно же добавлю скриншот ? А вот кому подойдет эта модель решайте сами, она очень хорошая.