
Image by Matheus Bertelli, from Pexels
Искусственный интеллект DeepSeek научился думать самостоятельно
Китайский стартап DeepSeek, совместно с Университетом Цинхуа, заявляет, что ему удалось разработать умный способ помочь моделям искусственного интеллекта мыслить лучше и быстрее, без необходимости использования огромных компьютеров или дорогостоящих ресурсов.
В спешке? Вот краткие факты:
- DeepSeek создала самосовершенствующийся ИИ с использованием метода настройки критики по собственным принципам (Self-Principled Critique Tuning — SPCT).
- SPCT обучает ИИ оценивать свою работу с помощью самостоятельно созданных правил.
- Данный метод повышает эффективность без необходимости огромной вычислительной мощности.
Прорыв связан с новой методикой, называемой Self-Principled Critique Tuning (SPCT). SPCT отличается от простого увеличения размеров моделей ИИ для улучшения производительности — SPCT не требует большого количества энергии и вычислительной мощности для обучения ИИ оценивать свою работу по набору самостоятельно созданных правил.
Так работает встроенный «судья», который проверяет, соответствует ли ответ AI внутренним правилам рассуждения и подходит ли он для выдачи человеку. Когда AI дает убедительный ответ, он получает положительную обратную связь, что помогает ему улучшить свою способность отвечать на подобные вопросы в будущих случаях.
DeepSeek реализует этот метод как часть своей системы DeepSeek-GRM, что означает Generative Reward Modeling. GRM работает иначе, чем традиционные методы, потому что он выполняет параллельные проверки для улучшения точности и последовательности.
«Мы предлагаем метод Самостоятельного Критического Настройки (Self-Principled Critique Tuning, SPCT) для стимулирования поведения, способствующего генерации масштабируемых вознаграждений,» — написали исследователи в своем докладе. «SPCT позволяет [модели] адаптивно формировать принципы и критику на основе входного запроса и ответов, что приводит к получению более качественных вознаграждений.»
С помощью этой системы, DeepSeek утверждает, что теперь его AI может превосходить конкурентов, таких как Gemini от Google, Llama от Meta и GPT-4o от OpenAI, особенно когда речь идет о сложных задачах, таких как рассуждение или принятие решений, как отмечено в Euronews.
Важно отметить, что DeepSeek заявляет о своем намерении выпустить эти новые инструменты в виде открытого исходного кода программного обеспечения, хотя дата релиза пока не была объявлена.
Оставьте комментарий
Отменить