Meta выпускает модель ИИ для усовершенствования поведения виртуальных агентов в Метавселенной
В четверг, Meta FAIR опубликовала несколько новых исследовательских инструментов и результатов, направленных на продвижение машинного обучения и искусственного интеллекта. Эти публикации фокусируются на таких областях, как разработка агентов, устойчивость, безопасность и архитектуры машинного обучения.
Спешите? Вот краткие факты!
- Meta FAIR представляет исследовательские артефакты для улучшения машинного интеллекта и развития ИИ.
- Инновации включают Meta Motivo для управления виртуальными агентами и Meta Video Seal для водяных знаков.
- Meta делает акцент на демократизации доступа к передовым технологиям для улучшения взаимодействия в реальном мире.
Среди ярких новинок — Meta Motivo, базовая модель для контроля виртуальных воплощенных агентов, и Meta Video Seal, модель водяных знаков для видео, разработанная для улучшения отслеживаемости контента.
Meta Video Seal основывается на предыдущих исследованиях в области аудио-водяных знаков и позволяет внедрять незаметные водяные знаки в видеоконтент. Система устойчива к обычным модификациям, таким как размытие, обрезка и сжатие, что предлагает практические применения для защиты цифровых медиа.
Вместе с этим представлен Omni Seal Bench, платформа для оценки систем водяных знаков в различных форматах. Эта платформа нацелена на содействие сотрудничеству внутри научного сообщества.
Meta Motivo представляет собой структуру для обучения с подкреплением без учителя. Она использует набор данных о движении для создания общего скрытого пространства для состояний, движений и вознаграждений.
Модель демонстрирует такие возможности, как отслеживание движения с нулевым уровнем знаний и достижение целей, сохраняя при этом устойчивость к изменениям в окружающей среде, таким как гравитация и ветер. Эти функции могут найти применение в виртуальных средах и анимации.
Flow Matching, еще один выпуск, предлагает альтернативу традиционным методам диффузии для генеративных моделей. Он поддерживает различные типы данных, включая изображения, видео и 3D-структуры, при этом улучшая вычислительную эффективность и производительность.
В области социального рассуждения, Meta Explore Theory-of-Mind представляет метод создания набора данных, направленного программой, для обучения AI-моделей рассуждению о верованиях и мыслях.
Первоначальные тесты указывают на улучшение работы моделей на установленных ориентирах, что может способствовать усилению рассуждения в больших языковых моделях.
Meta также представила Большие Модели Концепций (BMK), которые стремятся отделить задачи рассуждения от представления языка путем предсказания концептуальных идей, а не отдельных токенов.
По данным отчетов, такой подход улучшает выполнение задач, таких как суммирование и многоязычная обработка. Кроме того, Dynamic Byte Latent Transformer устраняет необходимость в токенизации, обеспечивая более эффективную обработку длинных последовательностей и редкого текста.
В числе других новинок — слои Meta Memory, которые помогают масштабировать включение фактического знания в модели, а также инструменты для оценки ответственного генерирования изображений.
Интеграция ИИ-агентов с телами, имитирующими физические, означает значительный сдвиг в метавселенной, обеспечивая более реалистичные взаимодействия и динамичные виртуальные переживания.
Однако, эти прогрессивные изменения могут размывать границы между виртуальным и реальным мирами, вызывая вопросы о приватности, ответственности и социальном воздействии все более правдоподобных виртуальных агентов.
Оставьте комментарий
Отменить