
Image by Marco Verch, from Ccnull
Лабиринт ИИ: новый инструмент Cloudflare обманывает искусственные интеллекты, создавая поддельные веб-страницы
Cloudflare объявила о запуске «AI Labyrinth», инструмента, предназначенного для борьбы с веб-скреперами, работающими на основе искусственного интеллекта, которые извлекают данные с сайтов без разрешения.
Спешите? Вот краткие факты:
- Инструмент генерирует реалистичный, но бесполезный контент, созданный ИИ, чтобы тратить время скрейперов.
- AI Labyrinth направлен на ботов, игнорирующих robots.txt, включая те, что от Anthropic и Perplexity AI.
- Он функционирует как капкан нового поколения, обнаруживая и идентифицируя несанкционированные сканеры.
Вместо того чтобы прямо блокировать этих ботов, AI Labyrinth вводит их в заблуждение, направляя в бесконечный лабиринт страниц, созданных AI, тем самым тратя их время и вычислительные мощности.
«Когда мы обнаруживаем несанкционированный сканирование, вместо блокировки запроса, мы предоставляем ссылку на ряд страниц, созданных с помощью искусственного интеллекта, достаточно убедительных, чтобы заинтересовать сканер и заставить его их просматривать», — объяснила Cloudflare в своем блоге.
«Но, хоть и выглядит реалистично, этот контент не является фактическим содержимым сайта, которым мы защищаем, поэтому сканер тратит время и ресурсы впустую», — добавила Cloudflare.
ArsTechnica отмечает, что AI-скреперы представляют проблему, поскольку они собирают огромные объемы данных с веб-сайтов, часто без разрешения, для обучения AI-моделей. Это создает ряд проблем: это может нарушить права на интеллектуальную собственность, обходя контрольные меры, которые владельцы веб-сайтов используют для регулирования доступа.
Кроме того, скрепинг может привести к неправильному использованию конфиденциальных или собственных данных. Объем скрепинга значительно увеличился, с Cloudflare сообщив о более чем 50 миллиардах запросов от краулеров ежедневно.
Этот масштабный процесс извлечения данных исчерпывает ресурсы веб-сайтов, влияя на их производительность и приватность, в то же время усиливая растущие опасения о эксплуатации данных в разработке ИИ.
Владельцы веб-сайтов традиционно полагаются на файл robots.txt для того, чтобы сообщить ботам, что они могут и не могут просматривать. Однако многие компании, работающие с ИИ, включая такие крупные игроки как Anthropic и Perplexity AI, были обвинены в игнорировании этих указаний, как сообщает The Verge.
AI-лабиринт от Cloudflare предлагает более агрессивный подход к борьбе с этими нежелательными ботами. Этот инструмент работает как «медовый горшок нового поколения», привлекая ботов глубже в искусственную сеть контента, который выглядит реалистично, но в конечном итоге бесполезен для обучения AI.
В отличие от традиционных медовых горшков, которые боты научились определять, AI-лабиринт создает реалистично выглядещую, но несущественную информацию с помощью платформы Workers AI от Cloudflare.
«Настоящий человек никогда не зайдет на четыре уровня в лабиринт бессмыслицы, генерируемой искусственным интеллектом», — отметили в Cloudflare. «Любой посетитель, который это делает, скорее всего, является ботом, поэтому это дает нам совершенно новый инструмент для идентификации и отпечатков плохих ботов».
Содержание, созданное искусственным интеллектом, разработано так, чтобы быть научно достоверным, но не имеющим отношения к защищаемому веб-сайту.
Это гарантирует, что инструмент не способствует распространению ложной информации, в то же время сбивая с толку AI-скреперы. Вводящие в заблуждение страницы невидимы для посетителей-людей и не влияют на рейтинги поисковых систем.
AI Labyrinth доступен как бесплатная функция по выбору для всех пользователей Cloudflare. Администраторы сайтов могут активировать его через свою панель управления Cloudflare в настройках управления ботами.
Компания описывает это как только начало противодействия с помощью ИИ, планируя в будущем сделать фейковые страницы еще более обманчивыми.
Игра в кошки-мышки между веб-сайтами и сборщиками данных на основе ИИ продолжается, при этом Cloudflare применяет инновационный подход к защите онлайн-контента. Однако остаются вопросы о том, насколько быстро компании, работающие с ИИ, адаптируются к этим ловушкам, и может ли данная стратегия привести к эскалации борьбы за данные в Интернете.
Оставьте комментарий
Отменить