DeepSeek представляет 3V модель, самый мощный открытый исходный код AI на сегодняшний день

Photo by Mimi Thian on Unsplash

DeepSeek представляет 3V модель, самый мощный открытый исходный код AI на сегодняшний день

Время для прочтения: 2 мин.

Китайская компания в области ИИ DeepSeek выпустила свою последнюю открытую модель, DeepSeek-V3, на этой неделе. Стартап утверждает, что его новая большая модель включает в себя 671B параметров и может работать лучше, чем передовые модели, такие как GPT-4o от OpenAI и Claude-Sonnet-3.5 от Anthropic.

Спешите? Вот краткие факты!

  • DeepSeek выпустила свою последнюю модель AI DeepSeek-V3, утверждая, что она работает лучше, чем GPT 4o и Claude-Sonnet-3.5.
  • Китайская AI компания объяснила, что новая модель включает в себя 671B параметров и работает в три раза быстрее предыдущей модели.
  • DeepSeek-V3 теперь является самой мощной открытой AI моделью на рынке

Пользователи могут взаимодействовать с моделью через официальный сайт, прочитать статью компании и получить доступ к модели через Hugging Face. DeekSeek заявила, что эта новая модель в три раза быстрее предыдущей версии, выпущенной в ноябре, и имеет расширенные возможности и совместимость с API.

«Мы представляем DeepSeek-V3, мощную модель языка Mixture-of-Experts (MoE) с общим количеством параметров 671B, из которых 37B активированы для каждого токена,» — написала компания на GitHub. «Тщательные оценки показывают, что DeepSeek-V3 превосходит другие открытые модели и достигает производительности, сравнимой с ведущими закрытыми моделями.»

Многие пользователи, организации и компании поздравили DeepSeek с его успехом. «Поздравляем с блестящим релизом!» — написал Hugging Face на X, «Контрольные точки модели и подробный отчет — по-настоящему Рождество здесь!»

Андрей Карпати—бывший исследователь в OpenAI и руководитель AI в Tesla—также поделился несколькими мыслями. «DeepSeek (китайская AI компания) сегодня делает все выглядеть легким с открытым релизом весов пограничного LLM, обученного на смешном бюджете (2048 GPU на 2 месяца, $6M).»

DeepSeek-V3 теперь является одной из самых мощных открытых AI-моделей на рынке, а ее платный API по-прежнему остается одним из самых доступных на рынке.

Понравилась статья? Поставьте оценку!
Ужасно Удовлетворительно Хорошо Очень хорошо! Превосходно!

Мы рады, что вам понравилась наша статья!

Дорогой читатель, не могли бы вы оставить отзыв о нас на сайте Trustpilot? Это не займет у вас много времени, но очень важно для нас. Спасибо, наш замечательный читатель!

Оценить нас на Trustpilot
0 Проголосовало 0 пользователей
Заголовок
Комментарий
Спасибо за ваш отзыв
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Оставьте комментарий

Loader
Loader Показать больше...