OpenAI выпускает новую модель ИИ «Reasoning», o1
OpenAI объявил сегодня о своей последней модели AI, o1, которая стала первой в новой семье «рассуждающих» моделей, разработанных для решения сложных задач быстрее и точнее, чем предыдущие модели.
Вместе с o1, компания также выпускает меньшую и более доступную версию под названием o1-mini. Этот релиз описывается как «предпросмотр», что указывает на то, что технология все еще находится на ранней стадии развития.
o1, ранее известная под кодовым названием «Strawberry», является первой в серии моделей «рассуждения», которые OpenAI планирует выпустить, как отметил TechCrunch.
Джерри Творек, руководитель исследовательского отдела OpenAI, сообщил The Verge, что подготовка к работе с o1 значительно отличается от предыдущих моделей, хотя компания не раскрывает подробностей.
В отличие от своих предшественников, которые были разработаны для имитации образцов из обучающих данных, o1 использует обучение с подкреплением, метод, который учит систему решать задачи через вознаграждения и штрафы.
Одной из наиболее заметных особенностей o1 является его способность решать задачи, требующие нескольких шагов, и писать код с более высокой степенью точности по сравнению с ранее созданными моделями.
Например, на квалификационном экзамене для Международной олимпиады по математике, o1 превзошел предыдущую модель OpenAI GPT-4o, решив 83% задач по сравнению с 13% у GPT-4o.
Такой скачок в производительности связан с новым процессом обучения o1, который включает то, что OpenAI называет механизмом «цепочки мыслей», позволяющим модели разбивать и решать задачи пошагово.
Творек отмечает, что, хотя модель уменьшила свою склонность к «галлюцинациям», то есть предоставлению неточной информации, проблема все еще не полностью решена, как сообщает The Verge.
Помимо своих математических способностей, o1 занял 89-е процентное место в конкурсах по программированию, демонстрируя свой потенциал как инструмент для разработчиков и исследователей.
Согласно The Verge, наиболее примечательным было то, как сознательно o1 старался имитировать человеческое мышление. Фразы вроде «Мне любопытно», «Я думаю» и «Дайте мне посмотреть» создавали иллюзию процесса мышления, хотя на самом деле модель не думает. Так почему же создавать видимость того, что она это делает?
The Verge сообщает, что Творек объясняет, что этот интерфейс создан для демонстрации того, как модель тратит больше времени на обработку и изучение проблем более глубоко.
Несмотря на эти прогрессивные шаги, OpenAI признает, что у o1 все еще есть ограничения. Хотя он превосходит в сложном решении проблем, он менее способен обрабатывать фактические знания о мире. Кроме того, ему не хватает некоторых функций, которые делают GPT-4o высокоадаптивным, таких как возможность просматривать веб или обрабатывать файлы и изображения.
Более того, новые возможности o1 требуют значительных затрат. Эта модель значительно дороже в использовании, чем GPT-4o. На API OpenAI, стоимость o1-preview составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов, что в три-четыре раза выше стоимости GPT-4o.
Несмотря на то, что технология все еще находится на ранних стадиях развития, выпуск o1 подчеркивает постоянное развитие возможностей искусственного интеллекта в решении сложных задач, предлагая потенциальные преимущества в различных областях, требующих продвинутых способностей к решению проблем.
Оставьте комментарий
Отменить