Compartilhe

Os motores generativos estão quebrando a análise da web e machucando seu futuro

A pesquisa está passando dos mecanismos de pesquisa tradicionais para os motores generativos, mas o tráfego de muitos desses sites não está sendo rastreado corretamente em análises. É culpa deles, não sua.

Eu estava olhando para o filtro LLM na Ahrefs Web Analytics e notei alguns motores generativos comuns ausentes na lista. Eles estão em nossos filtros, mas não estamos vendo nenhum dado deles para sites.

Esse problema de tráfego invisível vem desses sistemas que removem o valor de referência. Notei pela primeira vez esse problema com o modo AI no Google, mas é um problema comum para os motores generativos.

Provavelmente, esse é um erro da parte deles, mas em alguns casos pode ser intencional. Algumas dessas ferramentas provavelmente querem mais participação de mercado e apenas cometeram um erro, enquanto outras podem não querer que você possa medir o tráfego dos sistemas. O Google disse que os cliques da pesquisa de IA são de maior qualidade, mas não temos como verificar isso.

Se você possui um site que envia tráfego para outros sites, deseja que ele seja rastreado corretamente. No caso de mecanismos generativos, avisei que esses bots de IA precisam enviar essas informações para cumprir seu contrato social, onde fornecem tráfego para sites, e os sites permitem que esses bots rastejam e seus dados sejam usados.

Há um custo para os rastrear seus sites e há um contrato social entre os mecanismos de pesquisa e os proprietários do site, onde os mecanismos de pesquisa agregam valor enviando tráfego de referência a sites. É isso que impede a maioria dos sites de bloquear mecanismos de pesquisa como o Google, mesmo quando o Google parece ter a intenção de levar mais desse tráfego para si. Esse contrato social se estende a motores generativos.

Acho que muitos proprietários de sites querem deixar esses bots aprender sobre sua marca, seus negócios e seus produtos e ofertas. Mas enquanto muitas pessoas estão apostando que esses sistemas são o futuro, atualmente correm o risco de não agregar valor suficiente para os proprietários de sites.

O primeiro LLM a agregar mais valor aos usuários, mostrando impressões e cliques aos proprietários do site, provavelmente terá uma grande vantagem. As empresas relatarão as métricas desse LLM, o que provavelmente aumentará a adoção e impedirá que mais sites bloqueem seu bot.

O mesmo sentimento é verdadeiro para atribuição. Se esses mecanismos generativos quiserem ganhar participação de mercado, eles precisam estar presentes nos relatórios para as empresas. Até agora, muitos não estão fazendo um ótimo trabalho.

Eu estava verificando o valor do referenciador digitando “Document.Referrer” no console do Chrome Dev Ferramentas para verificar se o referenciador foi aprovado. Se for, gera um valor dizendo de onde veio e, se não, está em branco.

Alguns dos motores generativos enviam as referências, outros não os enviam, e outros os enviam para certas coisas e não outras. Marquei aqueles com um aviso para indicar resultados parciais.

word image 188190 2word image 188190 2

Um link no conteúdo na minha conta paga do ChatGPT possui um atributo Noreferrer no link. Isso impediria que o valor de referência fosse enviado.

O ChatGPT não está passando o referenciador nos links no conteúdoO ChatGPT não está passando o referenciador nos links no conteúdo

Como esperado, não há referenciador mostrado no console do Chrome Dev Ferramentas. Ele volta vazio.

document.referrer
''

No Ahrefs Web Analytics, isso é registrado como desconhecido, mas no Google Analytics seria classificado como direto. O Google agrupa o tráfego de fontes desconhecidas e o tráfego interno do site como direto, enquanto os separamos em desconhecidos e internos.
O tráfego é tratado como desconhecidoO tráfego é tratado como desconhecido

O interessante é que, quando olhei para o mesmo tipo de link em uma conta gratuita, ele não tinha o atributo Noreferrer. É rastreado corretamente.

A conta gratuita enviou o referenciadorA conta gratuita enviou o referenciador

Para listas de links, eles também foram rastreados corretamente. Listas de links foram rastreadas corretamenteListas de links foram rastreadas corretamente

Os links para fontes no conteúdo e na parte inferior da resposta também são rastreados corretamente e adicionam um parâmetro de URL “? Utm_source = chatgpt.com” aos URLs também. Fontes no final são rastreadas corretamente e adicione um parâmetroFontes no final são rastreadas corretamente e adicione um parâmetro

Pesquisa na web

A maioria dos links no modo de pesquisa na web tinha o referenciador. Eu encontrei um exemplo interessante quando há várias referências. O topo tinha um referenciador, os outros 2 não.

Referentes mistos no modo de pesquisa na webReferentes mistos no modo de pesquisa na web

DeePresearch

Para o modo DeePresearch, os links no conteúdo foram atribuídos corretamente, mas as fontes no final foram marcadas com Noreferrer.

Cabeçalhos HTTP

Se você olhar para os cabeçalhos HTTP, às vezes encontrará um Cabeçalho de política de referência Para especificar o que e a quantidade de informações passadas no referenciador. Você pode usar a barra de ferramentas do AHREFS SEO para visualizar essas informações indo para a guia Cabeçalhos HTTP.

A política do referenciador pode ser verificada nos cabeçalhos HTTP com a barra de ferramentas AHREFS SEOA política do referenciador pode ser verificada nos cabeçalhos HTTP com a barra de ferramentas AHREFS SEO
Para o ChatGPT, eles estabeleceram um valor de política de referência de “Strict-Origin-When-Cross-Origin”. Nesse caso, o rebaixamento de HTTPS para HTTP descartaria o referenciador. Quaisquer links para páginas usando HTTP não seriam atribuídos corretamente.

A maioria dos links contextuais e citados em Gemini tinha o referenciador.

O único caso que não foi a seção “Sites pesquisadores” no modo de pesquisa profundo. Estes são marcados como Noreferrer.

Pesquisando sites em Gemini Deep Research Não passa pelo referenciadorPesquisando sites em Gemini Deep Research Não passa pelo referenciador

Modo AI

O novo modo AI na pesquisa do Google também é alimentado por Gemini. Você pode ter visto meu artigo recente mostrando que O modo AI é marcado com Noreferrer.

O modo Ai do Google não passa o referenciadorO modo Ai do Google não passa o referenciador

John Mueller, do Google, confirmou que é um bug e que eles provavelmente o corrigirão.

John Mueller diz que o modo AI não passar o referenciador é um bugJohn Mueller diz que o modo AI não passar o referenciador é um bug

Em um artigo anterior, Louise Linehan mencionou que podemos estar subestimando o tráfego de IA. Ela mencionou especificamente como o copiloto desapareceu do nosso sistema de rastreamento de análise. Desde então, o tráfego retornou.

As referências de copiloto desapareceram por alguns mesesAs referências de copiloto desapareceram por alguns meses

O que eu suspeito é que esses links foram marcados como Noreferrer durante esse período. Isso mostra como as mudanças de código podem afetar seu rastreamento global.

Tudo aqui parecia ser rastreado corretamente agora.

Esse não é o caso do Copilot no Windows. Não encontrei casos em que o referenciador foi aprovado.

O site deles parecia enviar encaminhadores para tudo.

O aplicativo de desktop não parece enviar encaminhadores para qualquer coisa. Eu não tentei o aplicativo móvel.

Claude parece ter o referenciador para todos os links em todas as áreas que testei.

Grok parece não passar o referenciador. Eu tentei o Grok independente e a versão em x.

A pesquisa profunda e profunda normal não passou pelo referenciador.

Para pesquisa na web, as citações individuais passaram o referenciador, mas os links no final não.

A Meta AI passou o referenciador para a versão da Web. Não testei isso em nenhuma das plataformas de mídia social.

Mistral passou pelo referenciador em todos os casos que verifiquei.

Pensamentos finais

Os problemas de atribuição não são exclusivos dos motores generativos. Muito tráfego é atribuído a desconhecido ou direto em suas análises. Esse tráfego veio de algum lugar.

Há uma boa parte do tráfego de sites que nunca é registrado em análises por causa de pessoas que bloqueiam análises ou JavaScript, alguns sites aguardam a aceitação de biscoitos antes de disparar, ou as pessoas deixam uma página antes que sua tag de análise seja acionada.

A atribuição está ficando mais difícil a cada ano. Se você é um mecanismo generativo e deseja garantir que as pessoas saibam que estão obtendo tráfego seu, teste todos os seus links para garantir que os dados estejam sendo enviados. Sua própria sobrevivência pode depender de sua reputação na comunidade de marketing e da visibilidade que você tem nos relatórios de marketing.

Se você tiver perguntas, pergunte -me em LinkedIn ou X.


Written by