Photo by Mimi Thian on Unsplash

DeepSeek представляет 3V модель, самый мощный открытый исходный код AI на сегодняшний день

Время для прочтения: 2 мин.

Последние обновления: Apr 3, 2025

Автор Andrea Miliani Эксперт по новостям технологий
Перевод выполнен Команда локализации и перевода Услуги локализации и перевода

Китайская компания в области ИИ DeepSeek выпустила свою последнюю открытую модель, DeepSeek-V3, на этой неделе. Стартап утверждает, что его новая большая модель включает в себя 671B параметров и может работать лучше, чем передовые модели, такие как GPT-4o от OpenAI и Claude-Sonnet-3.5 от Anthropic.

Спешите? Вот краткие факты!

DeepSeek выпустила свою последнюю модель AI DeepSeek-V3, утверждая, что она работает лучше, чем GPT 4o и Claude-Sonnet-3.5.
Китайская AI компания объяснила, что новая модель включает в себя 671B параметров и работает в три раза быстрее предыдущей модели.
DeepSeek-V3 теперь является самой мощной открытой AI моделью на рынке

Пользователи могут взаимодействовать с моделью через официальный сайт, прочитать статью компании и получить доступ к модели через Hugging Face. DeekSeek заявила, что эта новая модель в три раза быстрее предыдущей версии, выпущенной в ноябре, и имеет расширенные возможности и совместимость с API.

🚀 Представляем DeepSeek-V3!

Самый значительный прорыв до сих пор:
⚡ 60 токенов/секунду (в 3 раза быстрее, чем V2!)
💪 Расширенные возможности
🛠 Совместимость API остается неизменной
🌍 Полностью открытые модели и публикации

🐋 1/n pic.twitter.com/p1dV9gJ2Sd

— DeepSeek (@deepseek_ai) 26 декабря 2024

«Мы представляем DeepSeek-V3, мощную модель языка Mixture-of-Experts (MoE) с общим количеством параметров 671B, из которых 37B активированы для каждого токена,» — написала компания на GitHub. «Тщательные оценки показывают, что DeepSeek-V3 превосходит другие открытые модели и достигает производительности, сравнимой с ведущими закрытыми моделями.»

Многие пользователи, организации и компании поздравили DeepSeek с его успехом. «Поздравляем с блестящим релизом!» — написал Hugging Face на X, «Контрольные точки модели и подробный отчет — по-настоящему Рождество здесь!»

Андрей Карпати—бывший исследователь в OpenAI и руководитель AI в Tesla—также поделился несколькими мыслями. «DeepSeek (китайская AI компания) сегодня делает все выглядеть легким с открытым релизом весов пограничного LLM, обученного на смешном бюджете (2048 GPU на 2 месяца, $6M).»

DeepSeek-V3 теперь является одной из самых мощных открытых AI-моделей на рынке, а ее платный API по-прежнему остается одним из самых доступных на рынке.

DeepSeek представляет 3V модель, самый мощный открытый исходный код AI на сегодняшний день

Мы рады, что вам понравилась наша статья!

Оставьте комментарий