Искусственный интеллект DeepSeek научился думать самостоятельно

Image by Matheus Bertelli, from Pexels

Искусственный интеллект DeepSeek научился думать самостоятельно

Время для прочтения: 2 мин.

Китайский стартап DeepSeek, совместно с Университетом Цинхуа, заявляет, что ему удалось разработать умный способ помочь моделям искусственного интеллекта мыслить лучше и быстрее, без необходимости использования огромных компьютеров или дорогостоящих ресурсов.

В спешке? Вот краткие факты:

  • DeepSeek создала самосовершенствующийся ИИ с использованием метода настройки критики по собственным принципам (Self-Principled Critique Tuning — SPCT).
  • SPCT обучает ИИ оценивать свою работу с помощью самостоятельно созданных правил.
  • Данный метод повышает эффективность без необходимости огромной вычислительной мощности.

Прорыв связан с новой методикой, называемой Self-Principled Critique Tuning (SPCT). SPCT отличается от простого увеличения размеров моделей ИИ для улучшения производительности — SPCT не требует большого количества энергии и вычислительной мощности для обучения ИИ оценивать свою работу по набору самостоятельно созданных правил.

Так работает встроенный «судья», который проверяет, соответствует ли ответ AI внутренним правилам рассуждения и подходит ли он для выдачи человеку. Когда AI дает убедительный ответ, он получает положительную обратную связь, что помогает ему улучшить свою способность отвечать на подобные вопросы в будущих случаях.

DeepSeek реализует этот метод как часть своей системы DeepSeek-GRM, что означает Generative Reward Modeling. GRM работает иначе, чем традиционные методы, потому что он выполняет параллельные проверки для улучшения точности и последовательности.

«Мы предлагаем метод Самостоятельного Критического Настройки (Self-Principled Critique Tuning, SPCT) для стимулирования поведения, способствующего генерации масштабируемых вознаграждений,» — написали исследователи в своем докладе. «SPCT позволяет [модели] адаптивно формировать принципы и критику на основе входного запроса и ответов, что приводит к получению более качественных вознаграждений.»

С помощью этой системы, DeepSeek утверждает, что теперь его AI может превосходить конкурентов, таких как Gemini от Google, Llama от Meta и GPT-4o от OpenAI, особенно когда речь идет о сложных задачах, таких как рассуждение или принятие решений, как отмечено в Euronews.

Важно отметить, что DeepSeek заявляет о своем намерении выпустить эти новые инструменты в виде открытого исходного кода программного обеспечения, хотя дата релиза пока не была объявлена.

Понравилась статья? Поставьте оценку!
Ужасно Удовлетворительно Хорошо Очень хорошо! Превосходно!

Мы рады, что вам понравилась наша статья!

Дорогой читатель, не могли бы вы оставить отзыв о нас на сайте Trustpilot? Это не займет у вас много времени, но очень важно для нас. Спасибо, наш замечательный читатель!

Оценить нас на Trustpilot
0 Проголосовало 0 пользователей
Заголовок
Комментарий
Спасибо за ваш отзыв
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Оставьте комментарий

Loader
Loader Показать больше...