Uma onda de tráfego inexplicável de bots está varrendo a web
Muitas pessoas suspeitam que esses bots fazem parte do esforço de uma empresa de IA para coletar dados de treinamento de páginas da web. Em 2025, bots de IA foi responsável por uma parcela significativa do tráfego geral da webque rastreiam a Internet em busca de texto e outras informações para alimentar pessoas famintas por dados grandes modelos de linguagem.
Mas existem algumas diferenças importantes entre esses bots chineses e outros bots de IA. Primeiro, há simplesmente muito mais deles. King diz em seu site que o tráfego da China e de Cingapura representa 22% do tráfego total, enquanto todos os outros bots de IA representam menos de 10% combinados.
A maioria das empresas líderes de IA identifica claramente seus bots para os operadores de sites, o que também os torna mais fáceis de bloquear. Os laboratórios de IA de ponta “não estão tão interessados em fugir” das regras de bloqueio de bots, diz Brent Maynard, diretor sênior de tecnologia e estratégia de segurança da empresa de infraestrutura de Internet Akamai. Ele diz que as empresas de IA geralmente só começam a tentar disfarçar seus bots depois que um site fecha a porta. Essa onda de bots chineses, no entanto, se disfarçou desde o início como usuários humanos normais e até contornou as regras comuns de bloqueio de bots, disseram vários proprietários de sites à WIRED.
Além das empresas de IA, existem outras empresas incentivadas a explorar a Internet, incluindo rastreadores de pesquisa e empresas de coleta de informações.
Custos crescentes e dados distorcidos
A boa notícia, pelo menos por enquanto, é que os bots não parecem ter um propósito explicitamente malicioso. Eles não foram publicamente conectados a nenhum ataque cibernético e não parecem estar procurando vulnerabilidades. Mas a falta de um motivo claro também aumenta a confusão.
Alguns proprietários de sites estão preocupados com o fato de os bots estarem escaneando materiais protegidos por direitos autorais sem permissão. Outros dizem que o aumento os forçou a pagar mais pela largura de banda, à medida que o tráfego de bots exclui os usuários humanos, ou a investir em ferramentas de prevenção mais sofisticadas. As visitas também distorcem a análise de tráfego, distorcendo os relatórios sobre quem está realmente visitando seus sites.
Mas os maiores impactos são sentidos pelas pessoas que obtêm receitas atraindo cliques em anúncios nos seus websites. “Isso está destruindo minhas estratégias do AdSense”, diz Quintero, dono do blog paranormal, “porque eles estão dizendo que (seu site é) visitado apenas por bots, então seu conteúdo não é algo valioso para o visualizador”. Como resultado, sites como o dele podem ser vistos como menos desejáveis pelos anunciantes e penalizados pelo Google.
Soluções improvisadas
Muitas pessoas reclamaram do problema do bot de IA da China em canais de suporte online nos últimos meses ou enviaram mensagens sobre isso diretamente para seus provedores de hospedagem na web. Mas até agora, ainda existem poucas respostas concretas.
Contatado pela WIRED, o WordPress reconheceu que tem visto relatos nos últimos meses de que alguns de seus sites estão enfrentando aumento de tráfego de suspeitos de bots ou scrapers de IA. “Os sites WordPress sempre tiveram uma ótima estrutura que os torna fáceis de serem encontrados e indexados pelos mecanismos de busca. Esses mesmos recursos também os tornam facilmente rastreáveis (pela) IA”, disse a empresa em um e-mail não assinado. Google, Cloudflare e Squarespace não responderam aos pedidos de comentários.



Publicar comentário