Image by Matt Wildbore, from Unsplash

Проекты с открытым исходным кодом сталкиваются с проблемами из-за перегрузки их систем ИИ-поиском

Время для прочтения: 3 мин.

Последние обновления: Mar 28, 2025

Автор Киара Фаббри Мультимедийный журналист
Перевод выполнен Команда локализации и перевода Услуги локализации и перевода

Веб-сканеры, работающие на основе искусственного интеллекта, стали серьезной угрозой для сообществ открытого программного обеспечения, вызвав массовые сбои в их инфраструктуре.

Спешите? Вот краткие факты:

Веб-сканеры, работающие на основе ИИ, наводняют сообщества открытого исходного кода, вызывая серьезные сбои.
Некоторые проекты с открытым исходным кодом сообщают, что до 97% трафика приходится на ботов, работающих на основе ИИ.
Проекты применяют блок-листы, специально разработанные для ИИ, но боты быстро адаптируются, продолжая вызывать сбои.

Популярные репозитории сталкиваются со стрессом ресурсов из-за этих ботов, которые были развернуты AI компаниями для сбора обучающих данных для языковых моделей, что замедляет развитие, как впервые сообщила ArsTechnica.

Дрю ДеВолт из SourceHut поделился своими наблюдениями о этих краулерах в блоге, где описал их разрушительное воздействие. Эти AI-боты обошли инструкции файла robots.txt, которые направляют краулеров обходить определенные страницы, и таким образом вызвали крупные сбои на платформе SourceHut.

Краулеры атаковали конкретные конечные точки, такие как логи git и коммиты, используя случайные IP-адреса, чтобы маскировать свою активность под обычный пользовательский трафик. Боты сделали эффективное блокирование невозможным своими методами, что привело к продолжительной задержке выполнения проектных задач и нарушениям обслуживания пользователей.

Инфраструктура GitLab в KDE временно вышла из строя из-за ботов, исходящих из диапазона IP-адресов Alibaba. Открытые проекты GNOME и другие столкнулись с идентичными атаками, поэтому они внедрили систему Anubis, которая требует от ботов решать вычислительные задачи перед предоставлением доступа к сайту, как сообщает The LibreNews.

Введение «ядерной опции» Anubis привело к увеличению времени ожидания для реальных пользователей, которые столкнулись с существенным ростом трафика в запросах на слияние GNOME, сообщает LibreNews.

Бен, работающий системным администратором KDE, заметил, что боты скрывали свою идентичность, используя пользовательские агенты Microsoft Edge, чтобы имитировать реальных пользователей и избежать обнаружения среди легитимного трафика. Команда Fedora отреагировала на это нарушение, прервав весь бразильский веб-трафик, чтобы предотвратить дальнейшие проблемы, сообщает LibreNews.

Отчет LibreNews показывает, что теперь многие проекты с открытым исходным кодом получают 97% своего веб-трафика от краулеров AI компаний. Проекты с открытым исходным кодом сталкиваются с увеличивающимися трудностями, поскольку расходы на пропускную способность продолжают расти, в то время как системные администраторы испытывают увеличивающееся давление по поддержанию бесперебойной работы.

Проекты с открытым исходным кодом в настоящее время используют черные списки и фильтрацию пользовательских агентов, специфических для AI, в качестве экстренных решений, однако адаптации ботов постоянно делают эти методы неэффективными.

Растущая проблема AI-сканеров показывает, как проекты с открытым исходным кодом становятся уязвимыми для угроз, поскольку они зависят от общедоступной инфраструктуры и поддержки волонтеров.

Открытые данные приносят пользу компаниям, работающим в области искусственного интеллекта, однако их чрезмерные практики по сбору данных в конечном итоге наносят ущерб системам, обеспечивающим доступность открытого интернета.

Проекты с открытым исходным кодом сталкиваются с проблемами из-за перегрузки их систем ИИ-поиском

Мы рады, что вам понравилась наша статья!

Оставьте комментарий