Compartilhe

avatar

Os agentes de IA estão navegando na web em nome dos usuários neste momento. A navegação automática do Chrome rola, clica e digita de forma autônoma para assinantes AI Pro e Ultra. O Atlas do ChatGPT navega e auxilia nas compras. O Cometa do Perplexity pesquisa em guias e preenche formulários.

Esses agentes não veem seu site da mesma forma que um ser humano. Eles não conseguem analisar seu layout CSS ou apreciar suas animações. Eles lêem a estrutura, e a estrutura da qual dependem é a mesma que torna os sites acessíveis aos humanos.

Se o seu site não estiver acessível, ele ficará cada vez mais invisível para os agentes que cuidam das transações dos seus clientes.

Como os agentes de IA realmente leem seu site

Diferentes agentes adotam abordagens diferentes e vale a pena entender a tendência em todo o setor.

Alguns são guiados pela visão. O Computer Use da Anthropic processa capturas de tela e conta pixels para posicionar o cursor em um botão ou em um campo de formulário. Essa abordagem é computacionalmente cara e frágil quando os layouts mudam.

Alguns lideram com a árvore de acessibilidade. O Playwright MCP da Microsoft, o servidor MCP oficial para automação de navegador, fornece instantâneos de acessibilidade em vez de capturas de tela, dando aos modelos de IA uma representação semântica estruturada da página. ChatGPT Atlas segue uma abordagem semelhante. As perguntas frequentes para editores e desenvolvedores da OpenAI afirmam que “ChatGPT Atlas usa tags ARIA, os mesmos rótulos e funções que suportam leitores de tela, para interpretar a estrutura da página e elementos interativos” e orienta explicitamente os editores a seguirem as práticas recomendadas WAI-ARIA.

A maioria dos agentes de produção fica em algum ponto intermediário, sobrepondo a análise de captura de tela com DOM e análise de árvore de acessibilidade. O Project Mariner do Google observa os elementos visuais e a estrutura subjacente da página antes de planejar ações. O Computer-Using Agent da OpenAI, que alimenta o Atlas, segue um padrão híbrido semelhante.

O padrão em toda a indústria é consistente. Mesmo as plataformas que começaram com visão estão incorporando dados de acessibilidade. Aqueles que otimizam confiabilidade e velocidade lideram a árvore de acessibilidade.

A árvore de acessibilidade do seu site não é mais um artefato de conformidade. Ele está se tornando a principal interface entre o seu site e os agentes que desejam utilizá-lo.

Por que a árvore de acessibilidade funciona tão bem para os agentes

O DOM da sua página pode conter milhares de nós. A árvore de acessibilidade reduz tudo ao que é realmente interativo: botões, links, campos de formulário, títulos e pontos de referência. Para modelos de IA que operam dentro de uma janela de contexto limitada, essa redução é importante. Em vez de processar o DOM completo, o agente obtém um mapa semântico limpo da página.

Pesquisadores da UC Berkeley e da Universidade de Michigan publicaram recentemente o conjunto de dados A11y-CUA na CHI 2026, a conferência líder sobre interação humano-computador. Eles testaram o Claude Sonnet 4.5 em 60 tarefas diárias de desktop e web sob três condições: acesso padrão, navegação somente com teclado (simulando fluxos de trabalho de leitores de tela) e uma janela de visualização ampliada em 150% (simulando ferramentas para visão subnormal). Eles também coletaram mais de 40 horas de dados de comparação de 16 usuários com visão, cegos e com baixa visão que completaram as mesmas tarefas.

Os resultados do agente foram nítidos:

Em condições padrão, o agente concluiu com êxito cerca de 78% das tarefas.

Com acesso apenas pelo teclado, o sucesso caiu para 42% e as tarefas demoraram quase o dobro.

Com uma janela de visualização ampliada, o sucesso caiu para 28% e as tarefas demoraram mais de três vezes mais.

Essas condições não são artificiais. Os agentes da árvore de acessibilidade identificam e atuam nos elementos por meio da mesma estrutura semântica da qual depende a navegação pelo teclado. Quando essa estrutura está ausente ou quebrada, os usuários do teclado chegam a becos sem saída, e os agentes também. Interfaces acessíveis fornecem aos agentes as informações de que precisam para agir. Interfaces inacessíveis os forçam a adivinhar, tentar novamente e, eventualmente, desistir.

As práticas de acessibilidade que mais importam

Você já sabe a maior parte disso. Esse é o ponto. O trabalho que os agentes de IA precisam do seu código é o mesmo que a comunidade de acessibilidade tem solicitado. Mas vamos ser específicos sobre o que é mais importante em um contexto de agência.

Use HTML semântico. Realmente use-o.

Esta é a base. Os elementos HTML nativos geram automaticamente entradas significativas na árvore de acessibilidade. UM

does not.

button type="submit">Complete Purchasebutton>


div class="btn btn-primary" onclick="handleSubmit()">Complete Purchasediv>

O


Written by

Categorias