Alibaba Cloud представила новую огромную ИИ-модель Qwen2.5-Max, которая произвела настоящую революцию в области искусственного интеллекта.
Ключевые особенности модели:
- Модель основана на архитектуре Mixture-of-Experts (MoE, при ответе активируется только часть токенов, экономя вычислительные ресурсы) и обучена на более чем 20 триллионах токенов
- Отличается улучшенной производительностью и точностью, способна лучше справляться с задачами, требующими глубокого понимания контекста, включая анализ текста, перевод и генерацию контента
Доступность и использование
Модель уже доступна через:
- Бесплатно в сервисе Qwen Chat.
- API для разработчиков. Для получения доступа необходимо получить стартовый «грант» в Alibaba Cloud (к сожалению, пока активировать не удалось).
P.S. в рамках чистых цен она дороже чем даже gpt4o в 3 раза за миллион токенов.
- В отличие от других моделей в семействе Qwen2.5, версия Max будет доступна только через API и не будет выпущена с открытым исходным кодом.
Дополнительные возможности
Модель предлагает впечатляющий функционал:
- Отличное понимание русского языка
- Генерация изображений и видео (пока только обещают) в сразу в чате (как Dall-e3 в chatgpt)
- Продвинутый ИИ-поиск
- Работает бесплатно
Тесты
Тестировали модель только в веб-чате, так как по API доступ получить не удалось.
Генерация текста – адекватный, качественный ответ на запрос, но модели семейства Qwen2.5 и ранее славились неплохим русским языком, модель базируется на обновленных в январе 2025 моделях семейства Qwen2.5-1M (с объемом удержания контекста до 1миллиона токенов, это означает, что модель способна работать с длинными текстами, сохраняя логическую связь между частями документа.).
Генерация картинок – возможность выбрать соотношение сторон 1:1, 4:3, 3:4, 16:9 и 9:16.
Судя по количеству пальцев, немного пластиковому скинтону и уклоном в реализм при базовых запросах — это генерируется на чем-то вроде SDXL-Turbo (картинка готова уже через пару секунд).
Распознавание изображений: получена ошибка «Model qwen-max-latest is not image capable.» очень жаль, но в веб-чате можно сменить модель на Qwen2.5-VL-72B, и получив резульат вернутся к чату с большой моделью.
Генерация видео пока кнопка не активна.
Генеративный поиск
Очень хорошо, не только быстро поискал релевантные ссылки, но и стройную идею описал. Выдача на уровне поиска GPT-4o, но им обоим далеко до Perplexity.
ВАЖНО: в отличии от других умеет забирать информацию из ВК.
Программирование – несколько скриптов с несложной логикой разработал без ошибок, что-то более сложное без API решили не пробовать. Qwen-coder и так считается одной из лучших открытых моделей, так что думаю этот функционал не должен был стать хуже.
Выводы:
Отличное обновление линейки моделей семейства Qwen! В веб-чате и бесплатная версия.
По этому рекламному графику, от производителей модели, видно, что в синтетических тестах-бенчмарках она превосходит другие модели в этих самих тестах. Попробуйте сами, подойдет ли она для ваших задач. Большинство вопросов от большой языковой модели она решает и на данный момент бесплатна. (Не забывайте, что используя веб-чаты в сервисах вы оставляете свой контент для улучшения нейросетей у них).
Это не прорыв, просто логичное улучшение предыдущих моделей, модель Qwen2.5-Plus тоже была очень хороша, но при прямом сравнение прямо в сервисе Qwen Chat (кнопочка Add Model сверху чата) – Max генерирует ответ быстрее и более развернуто, что говорит в плюс его MoE архитектуре. Опять же, попробуйте сами, хороший веб-чат, доступный каждому. Непонятно только почему они не подключили Qwen2.5-VL, так же вышедший ранее, видимо, как и генерация видео (а это будет интересно!) добавят после недель Китайского нового года.
Qwen прочитал эту статью о себе, и я конечно же добавлю скриншот ? А вот кому подойдет эта модель решайте сами, она очень хорошая.
