ByteDance представляет OmniHuman-1, один из самых реалистичных инструментов для создания DeepFake на рынке

Photo by Ben Collins on Unsplash

ByteDance представляет OmniHuman-1, один из самых реалистичных инструментов для создания DeepFake на рынке

Время для прочтения: 2 мин.

Исследователи из ByteDance, родительской компании Tiktok, на этой неделе представили новый инструмент AI под названием OmniHuman для создания видео с людьми на основе изображений и других медиафайлов.

Спешите? Вот краткие факты!

  • ByteDance представила свой последний AI инструмент, OmniHuman-1, который может создавать видео с реалистичным движением, стилем и поведением из одной фотографии.
  • Научная группа поделилась статьей с более подробным описанием методологии и стратегий, применяемых для достижения реалистичности дипфейков.
  • OmniHuman пока что не доступен для общественности.

Первая версия инструмента искусственного интеллекта, OmniHuman-1, способна генерировать видео, поддерживающие множество стилей изображений — от реалистичной фотографии до анимации и мультфильмов, а также предлагающие вариации аудио и музыки, различные соотношения сторон и реалистичные движущиеся изображения. На нескольких демонстрациях китайская компания продемонстрировала возможности этой модели AI.

«OmniHuman значительно превосходит существующие методы, генерируя чрезвычайно реалистичные видео с людьми на основе слабых сигналов, особенно аудио,» — говорится в статье, опубликованной в понедельник командой Bytedance. «Поддерживается ввод изображений любого соотношения сторон, будь то портреты, полутела или изображения всего тела, что обеспечивает более жизненные и высококачественные результаты в различных сценариях.»

Исследовательская команда пояснила, что они использовали «стратегию смешанного обучения с условием мультимодального движения» и предоставили несколько примеров возможностей инструмента, включая воссоздание урока с Альбертом Эйнштейном, симуляцию речей с использованием изображений с сайтов, предлагающих бесплатные фотографии, и генерацию музыкальных выступлений из аудио или видео материалов.

Исследовательская группа ByteDance предупредила о рисках мошенничества — они еще не выпустили инструмент AI для публики и не сообщили дату — и других этических проблемах. Компания заверила, что изображения и видео, использованные для демонстрации производительности модели, были взяты из открытых источников.

Согласно Forbes, китайская компания использовала 18 700 часов видеоданных людей для тренировки нового режима. Несколько экспертов уже поделились своим мнением о новом инструменте AI.

«Создание чего-то из одной лишь фотографии и придание ей видимости реального движения и разговора увлекательно с технологической точки зрения, но это может иметь и множество потенциально негативных последствий», — сказала Саманта Г. Вульф, преподаватель Нью-Йоркского университета в Школе культуры, образования и развития человека Steinhardt и основатель PitchFWD в интервью Forbes. «Фальшивые версии бизнес-лидеров или политических лидеров, говорящих что-то недостоверное, могут оказать огромное влияние на бизнес или страну».

Беспокойство Вульфа разделяют многие эксперты в этой области. Недавно эксперты по кибербезопасности предупредили о новой волне мошенничества с использованием сложных deepfake, созданных с помощью искусственного интеллекта.

Понравилась статья? Поставьте оценку!
Ужасно Удовлетворительно Хорошо Очень хорошо! Превосходно!

Мы рады, что вам понравилась наша статья!

Дорогой читатель, не могли бы вы оставить отзыв о нас на сайте Trustpilot? Это не займет у вас много времени, но очень важно для нас. Спасибо, наш замечательный читатель!

Оценить нас на Trustpilot
0 Проголосовало 0 пользователей
Заголовок
Комментарий
Спасибо за ваш отзыв
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Оставьте комментарий

Loader
Loader Показать больше...