A pesquisa está passando dos mecanismos de pesquisa tradicionais para os motores generativos, mas o tráfego de muitos desses sites não está sendo rastreado corretamente em análises. É culpa deles, não sua.
Eu estava olhando para o filtro LLM na Ahrefs Web Analytics e notei alguns motores generativos comuns ausentes na lista. Eles estão em nossos filtros, mas não estamos vendo nenhum dado deles para sites.
Esse problema de tráfego invisível vem desses sistemas que removem o valor de referência. Notei pela primeira vez esse problema com o modo AI no Google, mas é um problema comum para os motores generativos.
Provavelmente, esse é um erro da parte deles, mas em alguns casos pode ser intencional. Algumas dessas ferramentas provavelmente querem mais participação de mercado e apenas cometeram um erro, enquanto outras podem não querer que você possa medir o tráfego dos sistemas. O Google disse que os cliques da pesquisa de IA são de maior qualidade, mas não temos como verificar isso.
Se você possui um site que envia tráfego para outros sites, deseja que ele seja rastreado corretamente. No caso de mecanismos generativos, avisei que esses bots de IA precisam enviar essas informações para cumprir seu contrato social, onde fornecem tráfego para sites, e os sites permitem que esses bots rastejam e seus dados sejam usados.
Há um custo para os rastrear seus sites e há um contrato social entre os mecanismos de pesquisa e os proprietários do site, onde os mecanismos de pesquisa agregam valor enviando tráfego de referência a sites. É isso que impede a maioria dos sites de bloquear mecanismos de pesquisa como o Google, mesmo quando o Google parece ter a intenção de levar mais desse tráfego para si. Esse contrato social se estende a motores generativos.
Acho que muitos proprietários de sites querem deixar esses bots aprender sobre sua marca, seus negócios e seus produtos e ofertas. Mas enquanto muitas pessoas estão apostando que esses sistemas são o futuro, atualmente correm o risco de não agregar valor suficiente para os proprietários de sites.
O primeiro LLM a agregar mais valor aos usuários, mostrando impressões e cliques aos proprietários do site, provavelmente terá uma grande vantagem. As empresas relatarão as métricas desse LLM, o que provavelmente aumentará a adoção e impedirá que mais sites bloqueem seu bot.
O mesmo sentimento é verdadeiro para atribuição. Se esses mecanismos generativos quiserem ganhar participação de mercado, eles precisam estar presentes nos relatórios para as empresas. Até agora, muitos não estão fazendo um ótimo trabalho.
Eu estava verificando o valor do referenciador digitando “Document.Referrer” no console do Chrome Dev Ferramentas para verificar se o referenciador foi aprovado. Se for, gera um valor dizendo de onde veio e, se não, está em branco.
Alguns dos motores generativos enviam as referências, outros não os enviam, e outros os enviam para certas coisas e não outras. Marquei aqueles com um aviso para indicar resultados parciais.
Um link no conteúdo na minha conta paga do ChatGPT possui um atributo Noreferrer no link. Isso impediria que o valor de referência fosse enviado.
Como esperado, não há referenciador mostrado no console do Chrome Dev Ferramentas. Ele volta vazio.
document.referrer
''
No Ahrefs Web Analytics, isso é registrado como desconhecido, mas no Google Analytics seria classificado como direto. O Google agrupa o tráfego de fontes desconhecidas e o tráfego interno do site como direto, enquanto os separamos em desconhecidos e internos.
O interessante é que, quando olhei para o mesmo tipo de link em uma conta gratuita, ele não tinha o atributo Noreferrer. É rastreado corretamente.
Para listas de links, eles também foram rastreados corretamente.
Os links para fontes no conteúdo e na parte inferior da resposta também são rastreados corretamente e adicionam um parâmetro de URL “? Utm_source = chatgpt.com” aos URLs também.
Pesquisa na web
A maioria dos links no modo de pesquisa na web tinha o referenciador. Eu encontrei um exemplo interessante quando há várias referências. O topo tinha um referenciador, os outros 2 não.
DeePresearch
Para o modo DeePresearch, os links no conteúdo foram atribuídos corretamente, mas as fontes no final foram marcadas com Noreferrer.
Cabeçalhos HTTP
Se você olhar para os cabeçalhos HTTP, às vezes encontrará um Cabeçalho de política de referência Para especificar o que e a quantidade de informações passadas no referenciador. Você pode usar a barra de ferramentas do AHREFS SEO para visualizar essas informações indo para a guia Cabeçalhos HTTP.
Para o ChatGPT, eles estabeleceram um valor de política de referência de “Strict-Origin-When-Cross-Origin”. Nesse caso, o rebaixamento de HTTPS para HTTP descartaria o referenciador. Quaisquer links para páginas usando HTTP não seriam atribuídos corretamente.
A maioria dos links contextuais e citados em Gemini tinha o referenciador.
O único caso que não foi a seção “Sites pesquisadores” no modo de pesquisa profundo. Estes são marcados como Noreferrer.
Modo AI
O novo modo AI na pesquisa do Google também é alimentado por Gemini. Você pode ter visto meu artigo recente mostrando que O modo AI é marcado com Noreferrer.
John Mueller, do Google, confirmou que é um bug e que eles provavelmente o corrigirão.
O que eu suspeito é que esses links foram marcados como Noreferrer durante esse período. Isso mostra como as mudanças de código podem afetar seu rastreamento global.
Tudo aqui parecia ser rastreado corretamente agora.
Esse não é o caso do Copilot no Windows. Não encontrei casos em que o referenciador foi aprovado.
O site deles parecia enviar encaminhadores para tudo.
O aplicativo de desktop não parece enviar encaminhadores para qualquer coisa. Eu não tentei o aplicativo móvel.
Claude parece ter o referenciador para todos os links em todas as áreas que testei.
Grok parece não passar o referenciador. Eu tentei o Grok independente e a versão em x.
A pesquisa profunda e profunda normal não passou pelo referenciador.
Para pesquisa na web, as citações individuais passaram o referenciador, mas os links no final não.
A Meta AI passou o referenciador para a versão da Web. Não testei isso em nenhuma das plataformas de mídia social.
Mistral passou pelo referenciador em todos os casos que verifiquei.
Pensamentos finais
Os problemas de atribuição não são exclusivos dos motores generativos. Muito tráfego é atribuído a desconhecido ou direto em suas análises. Esse tráfego veio de algum lugar.
Há uma boa parte do tráfego de sites que nunca é registrado em análises por causa de pessoas que bloqueiam análises ou JavaScript, alguns sites aguardam a aceitação de biscoitos antes de disparar, ou as pessoas deixam uma página antes que sua tag de análise seja acionada.
A atribuição está ficando mais difícil a cada ano. Se você é um mecanismo generativo e deseja garantir que as pessoas saibam que estão obtendo tráfego seu, teste todos os seus links para garantir que os dados estejam sendo enviados. Sua própria sobrevivência pode depender de sua reputação na comunidade de marketing e da visibilidade que você tem nos relatórios de marketing.