Compartilhe

ChatGpt pode raspar o Google, mas os resultados não correspondem

Sabemos que assistentes de IA, como os índices de pesquisa de acesso ao ChatGPT, como Google e Bing, para recuperar URLs para sua resposta. Mas como exatamente?

Para descobrir, realizamos uma série de experimentos analisando o relacionamento entre os URLs citados pelos assistentes de IA e os resultados encontrados no Google ao pesquisar os mesmos tópicos.

Até agora, testamos instruções de cauda longa (consultas muito longas e muito específicas como as que você entraria no chatgpt); Consultas de fan-out (instruções de comprimento médio relacionadas ao prompt de cauda longa original); E hoje estamos testando palavras-chave de cauda curta-Ultra-Short e termos “cabeça” ultra-específicos.

As palavras-chave de cauda curta oferecem a ilustração mais clara de como a IA citações rastreia com os resultados do Google.

Com base em três estudos separados, nossa conclusão é que o ChatGPT (e os sistemas similares) não apenas levanta URLs diretamente do Google, Bing ou outros índices. Em vez disso, eles aplicam etapas adicionais de processamento antes de citar fontes.

Mesmo quando examinamos as consultas de fan-out-as solicitações de pesquisa reais que esses sistemas enviam aos mecanismos de pesquisa-a sobreposição entre a IA e as citações dos mecanismos de pesquisa foi surpreendentemente baixa.

Em outras palavras, embora o ChatGPT possa extrair do índice de pesquisa do Google, ele ainda parece aplicar sua própria camada de seleção que filtra e reorganiza que os links aparecem.

Portanto, não basta identificar consultas de fan-out e classificar bem para elas-há fatores adicionais que influenciam os URLs, que estão fora do controle de um editor.

Diferentes tipos de consulta nos dizem coisas diferentes sobre como os assistentes de IA lidam com informações.

Em nossa pesquisa anterior, o cientista de dados de Ahrefs Xibeijia Guan Analisou a sobreposição de citação entre a IA e os resultados da pesquisa para informativos longa cauda e Fan-out avisos, usando o radar da marca AHREFS.

Desta vez, ela levou uma amostra de 3.311 termos clássicos de cabeça no estilo SEO, cobrindo intenções informativas, comerciais, transacionais e de navegação.

Exemplo de consulta Informativo Comercial Transacional De navegação
1 Cincinnati Bearcats Basquete Melhores recompensas de cartão de crédito piscinas para venda ONEDRIVE FELIZAÇÃO
2 proteína em camarão barra de som para TV Vestido de garotas da loja Suporte ao cliente da Verizon
3 O que é segurança cibernética Em casa Sauna compre um domínio papel higiênico Costco

Cada palavra -chave foi executada através do ChatGPT, perplexidade e 100 principais SERPs do Google para analisar a sobreposição de citação entre a IA e a pesquisa.

Se alguma coisa se alinhava em estreita colaboração com os resultados do Google, você esperaria que fosse consultas de cauda curta-já que essa é a maneira clássica de pesquisar.

Mas esse não é exatamente o caso.

O estudo de Ahrefs de ~ 3K de consultas de cauda curta mostrando a sobreposição de cauda curta entre o ChatGPT e o Google para URLs e domínios. Sobreposição de URL 20,69% no SERPS Top 100 10,00% no Domínio Top 10 SERPS Sobreposição de 53,51% no Top 100 31,80% no SERPS no Top 10 SerpsO estudo de Ahrefs de ~ 3K de consultas de cauda curta mostrando a sobreposição de cauda curta entre o ChatGPT e o Google para URLs e domínios. Sobreposição de URL 20,69% no SERPS Top 100 10,00% no Domínio Top 10 SERPS Sobreposição de 53,51% no Top 100 31,80% no SERPS no Top 10 Serps

Enquanto a citação se sobrepõe para Consultas de cauda curta (10%) é um pouco mais forte do que para Consultas de fan-out (6,82%), ainda é muito mais fraco do que esperávamos se estivesse ecoando diretamente os SERPs.

Isso é ainda mais surpreendente, agora temos confirmação de que Openai e Perplexity estão raspando o Google Resultados por meio de um fornecedor de terceiros.

É possível que veríamos mais sobreposição se nosso estudo se concentras segundo Os tipos de chatgpt raspam o Google.

As citações perplexidades estão alinhadas de perto com os resultados de pesquisa do Google em consultas de cauda curta.

O estudo de Ahrefs de ~ 3K de consultas de cauda curta, mostrando sobreposição de consulta de cauda curta entre a perplexidade e o Google para URLs e domínios. Sobreposição de URL 72,85% no SERPS topO estudo de Ahrefs de ~ 3K de consultas de cauda curta, mostrando sobreposição de consulta de cauda curta entre a perplexidade e o Google para URLs e domínios. Sobreposição de URL 72,85% no SERPS top

Ao contrário do ChatGPT, a sobreposição não é apenas visível no nível do domínio – a maioria das páginas citadas da Perplexity também é a classificação exata dos URLs no top 10 do Google.

Isso reflete as descobertas em nosso Consulta de cauda longa Estudo, onde as respostas perplexidades se assemelhavam aos resultados do Google, reforçando seu design como um motor de “citação primeiro”.

A sobreposição de domínio é consistentemente maior que a sobreposição de URL, sugerindo que o ChatGPT e a perplexidade citam os mesmos sites que o Google – mas não exatamente as mesmas páginas.

O estudo de Ahrefs de ~ 3k consultas de cauda curta mostrando a consulta de cauda curta entre a perplexidade, o chatgpt e o Google para URLs e domínios no top 10. Chatgpt: URL Sobreposição - 10,00% na parte superior de serps 10 -65.0 Sobreposição - 31,80% em serpentes 10 top 10 de sobreposição: URL Sobreposição - 65.07557% em serps 10% de sobreposição: URL Sobreposição -65.0O estudo de Ahrefs de ~ 3k consultas de cauda curta mostrando a consulta de cauda curta entre a perplexidade, o chatgpt e o Google para URLs e domínios no top 10. Chatgpt: URL Sobreposição - 10,00% na parte superior de serps 10 -65.0 Sobreposição - 31,80% em serpentes 10 top 10 de sobreposição: URL Sobreposição - 65.07557% em serps 10% de sobreposição: URL Sobreposição -65.0

No ChatGPT, a diferença de domínio-URL é especialmente larga-31,8% vs. 10%.

Em outras palavras, o ChatGPT cita domínios de classificação ~ 3x a mais do que as páginas de classificação.

Por um lado, isso pode significar que o chatgpt seleciona diferente páginas do mesmo domínios como Google.

Por exemplo, o Google cita uma página de ahrefs.com/writing-tools/, enquanto o chatgpt encontra um “ajuste” melhor em Ahrefs.com/blog/ e cita outro.

Se verdadeiro, isso reforça o valor da criação de conteúdo de cluster – otimizando várias páginas para diferentes intenções de tópicos, ter a melhor chance de ser encontrado.

Outra possibilidade é que ambos se apoiam na mesma poça de autoritário domínios, mas discordam de páginas arbitrárias.

As consultas de cauda curta mostram alinhamento mais próximo do SERP-AI do que os avisos de linguagem natural-especialmente quando se trata de perplexidade.

Um gráfico de barras duplas mostrando o URL de bate-papo e perplexidade se sobrepõe às citações de SERP do Google, com base em consultas de cauda curta e consultas de cauda longa que consulta de cauda curta Chatgpt: 10% Perseguição de cauda curta.Um gráfico de barras duplas mostrando o URL de bate-papo e perplexidade se sobrepõe às citações de SERP do Google, com base em consultas de cauda curta e consultas de cauda longa que consulta de cauda curta Chatgpt: 10% Perseguição de cauda curta.

Mas as citações de chatgpt geradas por consultas de fan-out (primeiro estudados por sq e xibeijia) mostram a menos sobreposição. Eles correspondem apenas 6,82% dos 10 principais resultados do Google.

Um gráfico de barras mostrando três barras representando consultas de cauda curta (10%), cauda longa (7,05%) e fan-out (6,82%). O gráfico é intitulado: URL de chatgpt sobreposição com SERP nos tipos de consulta (estudo AHREFS de ~ 3k consultas) Um gráfico de barras mostrando três barras representando consultas de cauda curta (10%), cauda longa (7,05%) e fan-out (6,82%). O gráfico é intitulado: URL de chatgpt sobreposição com SERP nos tipos de consulta (estudo AHREFS de ~ 3k consultas)

Não estamos comparando maçãs com as apples aqui. Essas porcentagens representam estudos diferentes e conjuntos de dados de tamanhos diferentes.

Mas cada estudo produz resultados semelhantes: as páginas que o ChatGPT cita não se sobrepõem significativamente às páginas que o Google classifica. E é em grande parte o contrário da perplexidade.

Outra coisa que não mencionamos é a intenção. A maior sobreposição de citação que vemos nas consultas de cauda curta pode ser parcialmente explicada pela estabilidade relativa das consultas de navegação, comercial e transacional-que não avaliamos em nossos estudos anteriores.

Os termos da cabeça de navegação, comercial e transacional têm SERPs que não tendem a mudar com muita frequência, porque o conjunto de produtos, marcas ou destinos relevantes é finito.

Essa estabilidade significa que os assistentes de IA e o Google têm maior probabilidade de convergir para as mesmas fontes, o que significa que a sobreposição é maior do que para consultas informativas (onde o pool de possíveis páginas é muito maior e mais volátil).

Pensamentos finais

Nos três estudos, a história é consistente: o ChatGPT não segue as fontes do Google, a perplexidade faz.

O que é surpreendente é que o chatgpt difere tanto do Google, quando agora sabemos que o OpenAI faz raspe os resultados do Google.

Meu palpite é que o ChatGPT faz mais do que perplexidade para diferenciar seus resultados definidos do Google.

Essa teoria de Sq parece o mais provável para mim:

“O ChatGPT provavelmente usa uma abordagem híbrida, onde eles recuperam os resultados de pesquisa de várias fontes, por exemplo, Google Serps, Bing Serps, seu próprio índice e APIs de pesquisa de terceiros e, em seguida, combinam todos os URLs e apliquem seu próprio algoritmo de renomeação.

Seja qual for o caso, a pesquisa e a IA estão moldando a descoberta lado a lado, e a melhor estratégia é criar conteúdo que lhe dê a chance de aparecer nas duas superfícies.