Image by Marco Verch, from Ccnull

Лабиринт ИИ: новый инструмент Cloudflare обманывает искусственные интеллекты, создавая поддельные веб-страницы

Время для прочтения: 3 мин.

Последние обновления: Mar 25, 2025

Автор Киара Фаббри Мультимедийный журналист
Перевод выполнен Команда локализации и перевода Услуги локализации и перевода

Cloudflare объявила о запуске «AI Labyrinth», инструмента, предназначенного для борьбы с веб-скреперами, работающими на основе искусственного интеллекта, которые извлекают данные с сайтов без разрешения.

Спешите? Вот краткие факты:

Инструмент генерирует реалистичный, но бесполезный контент, созданный ИИ, чтобы тратить время скрейперов.
AI Labyrinth направлен на ботов, игнорирующих robots.txt, включая те, что от Anthropic и Perplexity AI.
Он функционирует как капкан нового поколения, обнаруживая и идентифицируя несанкционированные сканеры.

Вместо того чтобы прямо блокировать этих ботов, AI Labyrinth вводит их в заблуждение, направляя в бесконечный лабиринт страниц, созданных AI, тем самым тратя их время и вычислительные мощности.

«Когда мы обнаруживаем несанкционированный сканирование, вместо блокировки запроса, мы предоставляем ссылку на ряд страниц, созданных с помощью искусственного интеллекта, достаточно убедительных, чтобы заинтересовать сканер и заставить его их просматривать», — объяснила Cloudflare в своем блоге.

«Но, хоть и выглядит реалистично, этот контент не является фактическим содержимым сайта, которым мы защищаем, поэтому сканер тратит время и ресурсы впустую», — добавила Cloudflare.

ArsTechnica отмечает, что AI-скреперы представляют проблему, поскольку они собирают огромные объемы данных с веб-сайтов, часто без разрешения, для обучения AI-моделей. Это создает ряд проблем: это может нарушить права на интеллектуальную собственность, обходя контрольные меры, которые владельцы веб-сайтов используют для регулирования доступа.

Кроме того, скрепинг может привести к неправильному использованию конфиденциальных или собственных данных. Объем скрепинга значительно увеличился, с Cloudflare сообщив о более чем 50 миллиардах запросов от краулеров ежедневно.

Этот масштабный процесс извлечения данных исчерпывает ресурсы веб-сайтов, влияя на их производительность и приватность, в то же время усиливая растущие опасения о эксплуатации данных в разработке ИИ.

Владельцы веб-сайтов традиционно полагаются на файл robots.txt для того, чтобы сообщить ботам, что они могут и не могут просматривать. Однако многие компании, работающие с ИИ, включая такие крупные игроки как Anthropic и Perplexity AI, были обвинены в игнорировании этих указаний, как сообщает The Verge.

AI-лабиринт от Cloudflare предлагает более агрессивный подход к борьбе с этими нежелательными ботами. Этот инструмент работает как «медовый горшок нового поколения», привлекая ботов глубже в искусственную сеть контента, который выглядит реалистично, но в конечном итоге бесполезен для обучения AI.

В отличие от традиционных медовых горшков, которые боты научились определять, AI-лабиринт создает реалистично выглядещую, но несущественную информацию с помощью платформы Workers AI от Cloudflare.

«Настоящий человек никогда не зайдет на четыре уровня в лабиринт бессмыслицы, генерируемой искусственным интеллектом», — отметили в Cloudflare. «Любой посетитель, который это делает, скорее всего, является ботом, поэтому это дает нам совершенно новый инструмент для идентификации и отпечатков плохих ботов».

Содержание, созданное искусственным интеллектом, разработано так, чтобы быть научно достоверным, но не имеющим отношения к защищаемому веб-сайту.

Это гарантирует, что инструмент не способствует распространению ложной информации, в то же время сбивая с толку AI-скреперы. Вводящие в заблуждение страницы невидимы для посетителей-людей и не влияют на рейтинги поисковых систем.

AI Labyrinth доступен как бесплатная функция по выбору для всех пользователей Cloudflare. Администраторы сайтов могут активировать его через свою панель управления Cloudflare в настройках управления ботами.

Компания описывает это как только начало противодействия с помощью ИИ, планируя в будущем сделать фейковые страницы еще более обманчивыми.

Игра в кошки-мышки между веб-сайтами и сборщиками данных на основе ИИ продолжается, при этом Cloudflare применяет инновационный подход к защите онлайн-контента. Однако остаются вопросы о том, насколько быстро компании, работающие с ИИ, адаптируются к этим ловушкам, и может ли данная стратегия привести к эскалации борьбы за данные в Интернете.

Лабиринт ИИ: новый инструмент Cloudflare обманывает искусственные интеллекты, создавая поддельные веб-страницы

Мы рады, что вам понравилась наша статья!

Оставьте комментарий