DeepSeek представляет 3V модель, самый мощный открытый исходный код AI на сегодняшний день
Китайская компания в области ИИ DeepSeek выпустила свою последнюю открытую модель, DeepSeek-V3, на этой неделе. Стартап утверждает, что его новая большая модель включает в себя 671B параметров и может работать лучше, чем передовые модели, такие как GPT-4o от OpenAI и Claude-Sonnet-3.5 от Anthropic.
Спешите? Вот краткие факты!
- DeepSeek выпустила свою последнюю модель AI DeepSeek-V3, утверждая, что она работает лучше, чем GPT 4o и Claude-Sonnet-3.5.
- Китайская AI компания объяснила, что новая модель включает в себя 671B параметров и работает в три раза быстрее предыдущей модели.
- DeepSeek-V3 теперь является самой мощной открытой AI моделью на рынке
Пользователи могут взаимодействовать с моделью через официальный сайт, прочитать статью компании и получить доступ к модели через Hugging Face. DeekSeek заявила, что эта новая модель в три раза быстрее предыдущей версии, выпущенной в ноябре, и имеет расширенные возможности и совместимость с API.
🚀 Представляем DeepSeek-V3!
Самый значительный прорыв до сих пор:
⚡ 60 токенов/секунду (в 3 раза быстрее, чем V2!)
💪 Расширенные возможности
🛠 Совместимость API остается неизменной
🌍 Полностью открытые модели и публикации🐋 1/n pic.twitter.com/p1dV9gJ2Sd
— DeepSeek (@deepseek_ai) 26 декабря 2024
«Мы представляем DeepSeek-V3, мощную модель языка Mixture-of-Experts (MoE) с общим количеством параметров 671B, из которых 37B активированы для каждого токена,» — написала компания на GitHub. «Тщательные оценки показывают, что DeepSeek-V3 превосходит другие открытые модели и достигает производительности, сравнимой с ведущими закрытыми моделями.»
Многие пользователи, организации и компании поздравили DeepSeek с его успехом. «Поздравляем с блестящим релизом!» — написал Hugging Face на X, «Контрольные точки модели и подробный отчет — по-настоящему Рождество здесь!»
Андрей Карпати—бывший исследователь в OpenAI и руководитель AI в Tesla—также поделился несколькими мыслями. «DeepSeek (китайская AI компания) сегодня делает все выглядеть легким с открытым релизом весов пограничного LLM, обученного на смешном бюджете (2048 GPU на 2 месяца, $6M).»
DeepSeek-V3 теперь является одной из самых мощных открытых AI-моделей на рынке, а ее платный API по-прежнему остается одним из самых доступных на рынке.
Оставьте комментарий
Отменить