Новый алгоритм MIT увеличивает эффективность принятия решений искусственным интеллектом вплоть до 50 раз
Исследователи из MIT разработали эффективный алгоритм обучения искусственного интеллекта, который повышает производительность, выбирая наиболее подходящие задачи, улучшает принятие решений и снижает затраты на обучение.
Спешите? Вот краткий обзор!
- Метод обучения с переносом на основе модели (MBTL) повышает производительность, сокращая при этом потребность в данных и вычислительных ресурсах.
- MBTL оказался в пять до пятидесяти раз более эффективным, чем традиционные методы обучения с подкреплением.
- Ученые планируют развивать MBTL для решения более сложных проблем реального мира.
Исследователи из MIT представили новый алгоритм, разработанный для повышения эффективности моделей принятия решений в ИИ, особенно для сложных задач, таких как контроль трафика в городах.
Алгоритм усовершенствует традиционное обучение с подкреплением, которое часто сталкивается с трудностями при работе с различными задачами.
Пресс-релиз MIT объясняет, что, например, AI-модель, обученная для управления движением на одном перекрестке, может не справиться с другими перекрестками, где присутствуют различные схемы движения, количество полос или ограничения скорости.
Новый подход, известный как Model-Based Transfer Learning (MBTL), стратегически выбирает подмножество задач для обучения искусственного интеллекта, сосредоточиваясь на тех, которые дадут наибольшее улучшение производительности.
Сужая фокус обучения, этот метод сокращает необходимые данные и вычислительные ресурсы, увеличивая при этом эффективность процесса обучения, говорят в MIT.
Исследование команды, которое будет представлено на Конференции по нейронной обработке информационных систем, показало, что MBTL в пять до пятьдесят раз более эффективен, чем стандартные методы.
«Мы смогли наблюдать невероятное улучшение производительности, используя очень простой алгоритм, благодаря нестандартному мышлению,» — сказала Кэти Ву, старший автор и доцент Массачусетского технологического института.
«Алгоритм, который не очень сложен, имеет больше шансов на внедрение в сообществе, поскольку его проще реализовать и другим людям проще его понять.»
Обычно, AI модели для задач, таких как контроль трафика, обучаются одним из двух способов: либо используя данные от всех задач, либо обучая отдельные модели для каждой задачи.
MIT объясняет, что оба метода имеют свои недостатки — обучение отдельных моделей требует огромных объемов данных, в то время как обучение по всем задачам часто приводит к недостаточно высокой производительности.
Метод исследователей находит золотую середину, обучая алгоритм на меньшем подмножестве задач, которые стратегически выбираются для максимизации производительности по всем задачам.
MBTL использует обучение с переносом без дополнительной тренировки, концепцию, при которой модель, обученная на одной задаче, применяется к похожим задачам без дополнительного обучения.
MIT объясняет, что этот метод оценивает, насколько хорошо модель справится с задачами, для которых она не была непосредственно обучена, тем самым выбирая задачи, которые улучшат общую адаптивность.
«С увеличением эффективности в 50 раз, алгоритм MBTL может обучаться всего на двух задачах и достигать того же уровня производительности, что и стандартный метод, использующий данные из 100 задач,» — объяснила Ву.
Этот подход значительно уменьшает объем необходимых тренировочных данных, улучшая как скорость, так и экономичность разработки моделей ИИ для сложного принятия решений, согласно Массачусетскому технологическому институту.
Взглянув вперед, команда планирует усовершенствовать метод MBTL для более сложных систем и приложений в реальном мире, таких как системы мобильности нового поколения.
Оставьте комментарий
Отменить