Image by Matheus Bertelli, from Pexels

Искусственный интеллект DeepSeek научился думать самостоятельно

Время для прочтения: 2 мин.

Дата первой публикации: Apr 8, 2025

Обновлено 2 раз с момента публикации

Автор Киара Фаббри Бывший автор новостных статей в области технологий
Перевод выполнен Команда локализации и перевода Услуги локализации и перевода

Китайский стартап DeepSeek, совместно с Университетом Цинхуа, заявляет, что ему удалось разработать умный способ помочь моделям искусственного интеллекта мыслить лучше и быстрее, без необходимости использования огромных компьютеров или дорогостоящих ресурсов.

В спешке? Вот краткие факты:

DeepSeek создала самосовершенствующийся ИИ с использованием метода настройки критики по собственным принципам (Self-Principled Critique Tuning — SPCT).
SPCT обучает ИИ оценивать свою работу с помощью самостоятельно созданных правил.
Данный метод повышает эффективность без необходимости огромной вычислительной мощности.

Прорыв связан с новой методикой, называемой Self-Principled Critique Tuning (SPCT). SPCT отличается от простого увеличения размеров моделей ИИ для улучшения производительности — SPCT не требует большого количества энергии и вычислительной мощности для обучения ИИ оценивать свою работу по набору самостоятельно созданных правил.

Так работает встроенный «судья», который проверяет, соответствует ли ответ AI внутренним правилам рассуждения и подходит ли он для выдачи человеку. Когда AI дает убедительный ответ, он получает положительную обратную связь, что помогает ему улучшить свою способность отвечать на подобные вопросы в будущих случаях.

DeepSeek реализует этот метод как часть своей системы DeepSeek-GRM, что означает Generative Reward Modeling. GRM работает иначе, чем традиционные методы, потому что он выполняет параллельные проверки для улучшения точности и последовательности.

«Мы предлагаем метод Самостоятельного Критического Настройки (Self-Principled Critique Tuning, SPCT) для стимулирования поведения, способствующего генерации масштабируемых вознаграждений,» — написали исследователи в своем докладе. «SPCT позволяет [модели] адаптивно формировать принципы и критику на основе входного запроса и ответов, что приводит к получению более качественных вознаграждений.»

С помощью этой системы, DeepSeek утверждает, что теперь его AI может превосходить конкурентов, таких как Gemini от Google, Llama от Meta и GPT-4o от OpenAI, особенно когда речь идет о сложных задачах, таких как рассуждение или принятие решений, как отмечено в Euronews.

Важно отметить, что DeepSeek заявляет о своем намерении выпустить эти новые инструменты в виде открытого исходного кода программного обеспечения, хотя дата релиза пока не была объявлена.

Искусственный интеллект DeepSeek научился думать самостоятельно

Мы рады, что вам понравилась наша статья!

Оставьте комментарий