
Photo by John Schnobrich on Unsplash
Alibaba представляет новую модель AI Qwen и утверждает, что она превосходит DeepSeek-V3
Китайский гигант Alibaba выпустил новейшую версию своей флагманской AI модели, Qwen, в эту среду. Компания утверждает, что она может работать лучше, чем популярная DeepSeek-V3.
Спешите? Вот краткие факты!
- В эту среду Alibaba представила свою последнюю модель рассуждений Qwen 2.5-Max.
- Китайский гигант утверждает, что она превосходит популярные модели, такие как DeepSeek-V3, GPT-4o и Llama-3.1-405B.
- Компания также запустила Qwen2.5-VL на этой неделе, модель AI, способную обрабатывать изображения и выполнять роль AI-агента, используя компьютеры и мобильные устройства для выполнения задач.
Как сообщает Reuters, Alibaba запустила новую модель рассуждений Qwen 2.5-Max, как она назвала новую модель, прямо во время праздников Лунного Нового года в Китае, чтобы присоединиться к массовым разработкам ИИ последних дней и добавить внутреннюю конкуренцию.
В понедельник DeepSeek занял первое место в App Store Apple в Соединенных Штатах, обогнав ChatGPT, что вызвало опасения у других компаний в индустрии ИИ и насторожило инвесторов—акции Nvidia упали на 17% всего за один день.
Теперь Alibaba объявила о последних версиях своей модели Qwen — она выпустила 100 открытых моделей ИИ для набора Qwen в сентябре прошлого года, обещая лучшие результаты, чем популярные передовые модели.
«Qwen 2.5-Max обгоняет (…) практически во всех отношениях GPT-4o, DeepSeek-V3 и Llama-3.1-405B,» — написала компания в своем официальном WeChat аккаунте.
Новая модель рассуждения Qwen 2.5-Max доступна через облачный сервис Alibaba, а пользователи также могут протестировать модель на его странице для чата.
«Мы разрабатываем Qwen2.5-Max, крупномасштабную модель MoE, которая была предварительно обучена на более чем 20 триллионах токенов и дополнительно обучена с использованием тщательно отобранных методов Supervised Fine-Tuning (SFT) и Reinforcement Learning from Human Feedback (RLHF)», — написала команда Qwen на Github.
Китайский гигант также выпустил Qwen2.5-VL в понедельник, серию мультимодальных AI-моделей, которые также могут обрабатывать изображения и получать доступ к мобильным устройствам и компьютерам для выполнения задач. OpenAI объявила о похожей функции, Operator, позволяющей ChatGPT выполнять задачи автономно, захватывая управление компьютером пользователя.
Согласно команде Alibaba, все модели Qwen превосходят аналогичные версии от OpenAI, Microsoft, Google, Meta и DeepSeek.
Оставьте комментарий
Отменить