
Photo by Ben Collins on Unsplash
ByteDance представляет OmniHuman-1, один из самых реалистичных инструментов для создания DeepFake на рынке
Исследователи из ByteDance, родительской компании Tiktok, на этой неделе представили новый инструмент AI под названием OmniHuman для создания видео с людьми на основе изображений и других медиафайлов.
Спешите? Вот краткие факты!
- ByteDance представила свой последний AI инструмент, OmniHuman-1, который может создавать видео с реалистичным движением, стилем и поведением из одной фотографии.
- Научная группа поделилась статьей с более подробным описанием методологии и стратегий, применяемых для достижения реалистичности дипфейков.
- OmniHuman пока что не доступен для общественности.
Первая версия инструмента искусственного интеллекта, OmniHuman-1, способна генерировать видео, поддерживающие множество стилей изображений — от реалистичной фотографии до анимации и мультфильмов, а также предлагающие вариации аудио и музыки, различные соотношения сторон и реалистичные движущиеся изображения. На нескольких демонстрациях китайская компания продемонстрировала возможности этой модели AI.
«OmniHuman значительно превосходит существующие методы, генерируя чрезвычайно реалистичные видео с людьми на основе слабых сигналов, особенно аудио,» — говорится в статье, опубликованной в понедельник командой Bytedance. «Поддерживается ввод изображений любого соотношения сторон, будь то портреты, полутела или изображения всего тела, что обеспечивает более жизненные и высококачественные результаты в различных сценариях.»
Исследовательская команда пояснила, что они использовали «стратегию смешанного обучения с условием мультимодального движения» и предоставили несколько примеров возможностей инструмента, включая воссоздание урока с Альбертом Эйнштейном, симуляцию речей с использованием изображений с сайтов, предлагающих бесплатные фотографии, и генерацию музыкальных выступлений из аудио или видео материалов.
Исследовательская группа ByteDance предупредила о рисках мошенничества — они еще не выпустили инструмент AI для публики и не сообщили дату — и других этических проблемах. Компания заверила, что изображения и видео, использованные для демонстрации производительности модели, были взяты из открытых источников.
Согласно Forbes, китайская компания использовала 18 700 часов видеоданных людей для тренировки нового режима. Несколько экспертов уже поделились своим мнением о новом инструменте AI.
«Создание чего-то из одной лишь фотографии и придание ей видимости реального движения и разговора увлекательно с технологической точки зрения, но это может иметь и множество потенциально негативных последствий», — сказала Саманта Г. Вульф, преподаватель Нью-Йоркского университета в Школе культуры, образования и развития человека Steinhardt и основатель PitchFWD в интервью Forbes. «Фальшивые версии бизнес-лидеров или политических лидеров, говорящих что-то недостоверное, могут оказать огромное влияние на бизнес или страну».
Беспокойство Вульфа разделяют многие эксперты в этой области. Недавно эксперты по кибербезопасности предупредили о новой волне мошенничества с использованием сложных deepfake, созданных с помощью искусственного интеллекта.
Оставьте комментарий
Отменить