Compartilhe

Como detectar conteúdo gerado pela IA

Em abril de 2025, analisamos 900.000 páginas da web recém-criadas e descobrimos que 74,2% continham conteúdo gerado pela IA.

Com o rápido crescimento de IA generativa, empresas, educadores e editores estão fazendo uma pergunta crítica: como podemos dizer o que é escrito por humanos e o que é produzido por máquinas?

A resposta: é possível, mas não à prova de falhas. Veja como abordar a detecção de IA de maneira eficaz, as limitações que você precisa entender e uma maneira melhor de obter resultados mais confiáveis.

Saiba mais sobre nosso estudo: 74% das novas páginas da Web incluem conteúdo de IA (estudo de 900 mil páginas)

Algumas pessoas são céticas de que a detecção de conteúdo de IA seja possível. É possível, mas com algumas advertências importantes.

O texto gerado pela IA tende a ter padrões estatísticos e estilísticos distintos. Esses padrões nem sempre são óbvios para os leitores humanos, mas geralmente podem ser detectados por modelos de detecção especialmente construídos.

Em termos simples, todos os detectores de IA funcionam comparando padrões em texto com grandes coleções de exemplos escritos por humanos e gerados pela IA.

Tradicionalmente, isso era feito com a detecção estatística: contando características como frequências de palavras e n-gramas, estruturas sintáticas comuns, escolhas estilísticas e até medidas estatísticas como perplexidade (previsibilidade da escolha de palavras) e burstiness (variação no comprimento da frase), depois sinalizando anomalias.

Tipo de recurso Explicação
Frequências de palavras Conte com que frequência palavras como “o” ou “gato” aparecem em uma amostra: o: 3, gato: 2
Frequências N-Gram Medir sequências como Bigrams: “O CAT” aparece duas vezes, “Cat Sat” aparece uma vez
Estruturas sintáticas Identifique padrões como estruturas de sujeito -verb – objeto (SVO), por exemplo, “The Cat Sat”, “The Cat bocejou”
Escolhas estilísticas Nota tom, perspectiva ou formalidade; por exemplo, tom neutro em terceira pessoa
Perplexidade Calcule a previsibilidade de cada palavra com base no contexto anterior-a melhor perplexidade geralmente significa texto mais previsível (e possivelmente gerado por máquina)
Burstiness Compare variação no comprimento da frase; O texto da IA pode mostrar comprimentos consistentes, enquanto o texto humano é mais variável

Uma terceira abordagem menos comum é a marca d’água-incorporando sinais ocultos no texto gerado pela IA no momento da criação.

Como as marcas UV na moeda, esses sinais podem ser verificados posteriormente para confirmar se o texto veio de um modelo específico, mas isso só funciona se o proprietário do modelo optar por implementá -lo.

A partir de agora, nenhum dos principais fornecedores de LLM como OpenAI, Antrópico ou Google confirmou que eles usam marcas de água em suas saídas de modelo voltado para o público. (E por que eles querem penalizar seus usuários?)

Saber mais: Como funcionam os detectores de conteúdo de IA? Respostas de um cientista de dados

Existem muitas ferramentas de detecção de IA disponíveis, desde damas baseados em navegador gratuitos a plataformas de nível corporativo com integrações de API.

Se você é um usuário do AHREFS, pode executar nosso detector de conteúdo de IA diretamente dentro Site Explorer‘s Página Inspecione recurso. Simplesmente aberto Site Explorer, Digite o URL que deseja verificar, navegue para o Página Inspecione Relatório e você pode clicar na guia do detector de IA para ver uma análise, ao lado de outras principais métricas de SEO:

word image 190577 2word image 190577 2

Bons detectores não apenas fornecem um único veredicto sim ou não: eles também dividem o texto e mostram a probabilidade de que diferentes passagens sejam geradas pela IA, forneçam uma pontuação geral no nível do artigo e, em alguns casos, tentam identificar quais modelos (como GPT-4O) provavelmente foram usados para criar o conteúdo.

word image 190577 3word image 190577 3

Realizamos um teste em pequena escala comparando vários dos detectores de IA mais populares para ver como eles se apresentam na prática. A tabela abaixo mostra nossos resultados:

word image 190577 4word image 190577 4

Com base nos meus testes, o detector de AI e os copyleaks da AHREFS foram os detectores de IA com melhor desempenho, com GPTZERO e originalidade. No outro extremo da escala, Grammarly e Writer tiveram o pior dos meus testes.

Detector de conteúdo de IA Pontuação
Ahrefs 13/18
Copyleaks 13/18
GptZero 12/18
Originalidade.ai 12/18
Scribbr 10/18
Zerogpt 9/18
Gramática 6/18
Escritor 4/18

Saiba mais no meu artigo completo: os 8 melhores detectores de IA, testados e comparados

Como os LLMs, os detectores de IA são probabilísticos – eles estimam a probabilidade, não a certeza. Eles podem ser altamente precisos, mas falsos positivos são inevitáveis. É por isso que você não deve basear as decisões em um único resultado. Execute várias verificações, procure padrões e combine descobertas com outras evidências.

Todos os detectores de IA compartilham as mesmas limitações fundamentais, independentemente da ferramenta ou tecnologia usada.

  • O texto de IA fortemente editado ou “humanizado” pode escapar da detecção. ““Pós-processamento ‘(coisas como reformular frases, trocar em sinônimos, reorganizar parágrafos ou executar o texto através de um verificador de gramática) podem atrapalhar os sinais estatísticos que os detectores procuram, reduzindo sua precisão.
  • Detectores básicos podem não ter precisão e recursos avançados. As ferramentas de detecção exigem atualizações frequentes para ficar à frente dos novos modelos de IA – a IA gerativa evolui rapidamente, e os detectores precisam de reciclagem regular para reconhecer os estilos de escrita mais recentes e as técnicas de evitação. Na AHREFS, nosso detector suporta vários modelos principais, incluindo modelos do OpenAI, Antrópico, Meta, Mixtral e Qwen, para que você possa verificar o conteúdo em uma gama mais ampla de fontes prováveis.
  • A eficácia varia de acordo com o idioma, o tipo de conteúdo e o modelo. Os detectores treinados principalmente na prosa inglesa podem ter dificuldades com a escrita técnica, poesia ou idiomas menos comuns.
  • Casos ambíguos (como o texto humano editado pela IA) podem desbotar os resultados. Esses fluxos de trabalho híbridos criam sinais mistos que podem confundir sistemas avançados.
  • Até as melhores ferramentas podem produzir falsos positivos ou negativos. A detecção estatística nunca é infalível, e classificações incorretas ocasionais são inevitáveis, porque os padrões em que os sistemas dependem podem se sobrepor entre a escrita humana e a IA, e edições sutis ou estilos de escrita atípica podem facilmente obscurecer as distinções.

Lembre -se: acusações falsas com base em resultados incorretos de detecção de IA podem prejudicar seriamente a reputação de indivíduos, empresas ou instituições acadêmicas.

Com essas limitações em mente, é uma boa idéia corroborar qualquer saída do detector com métodos adicionais antes de tirar conclusões.

O julgamento humano pode ser extremamente útil para adicionar contexto aos resultados dos detectores de IA. Examinando o contexto – como padrões em vários artigos, uma história de postagens nas mídias sociais ou nas circunstâncias circundantes da publicação – você pode avaliar melhor a probabilidade de a IA estar envolvida na redação.

Sinais a serem procurados:

  • Tom excessivamente consistente, sem peculiaridades sutis. A escrita humana é inerentemente um pouco confusa e imprevisível, com pequenas variações em estilo, ritmo e escolha de palavras que refletem personalidade e contexto. Às vezes, o texto gerado pela IA pode não ter essas imperfeições, produzindo um tom uniforme que parece um pouco polido ou mecânico.
  • Verbosidade. A IA é muito boa em estender idéias simples em explicações de longa duração.
  • Falta de novas informações. As saídas de IA geralmente são lidas como genéricas ou no nível da superfície (isso é particularmente óbvio no LinkedIn: muitos comentários gerados pela IA simplesmente reafirmam a idéia do autor original em novas palavras sem adicionar nenhuma perspectiva ou valor significativo).
  • Escolhas de palavras reveladoras. Ai tem uma preferência por idiomas ligeiramente “fora” como “Paisagem em constante evolução”ganchos de fórmula (“Isso não é x … é Y”), ou uso excessivo de traços e emojis.
  • Incentivos. Existe uma motivação clara para o autor usar o conteúdo da IA?
word image 190577 5word image 190577 5

Eu vejo você, chatgpt.

Nenhum desses sinais oferece evidências definitivas para o conteúdo da IA, mas eles podem adicionar contexto útil a outras formas de evidência.

Se você executar um detector de IA em apenas um artigo, um resultado não confiável pode ser problemático. Mas esse problema se torna menos importante quando você analisa os resultados em escala. A execução desse processo em muitas páginas oferece uma imagem muito mais clara de como a IA é usada como parte da estratégia de marketing mais ampla da empresa.

Com Ahrefs ‘ Páginas principais relatório em Site Explorer, Você pode ver uma coluna “AI no nível do conteúdo” para quase qualquer página do site. A partir daí, você pode até inspecionar qualquer URL individual e ter uma idéia dos modelos de IA que provavelmente foram usados na criação da página.

Aqui está um vídeo falando sobre este processo:

Para uma dica rápida: use este relatório para identificar o conteúdo de primeira linha e fortemente gerado pela IA e considere criar sua própria versão de IA. Se estiver no ranking, está atendendo à intenção de pesquisa – tornando -a uma oportunidade potencial para você e seu fluxo de trabalho de conteúdo de IA.