A Engenharia da Citabilidade: GEO na era pós-busca | Raphael Sousa Pereira

Ensaio técnico · Porto Alegre · maio de 2026

A Engenharia da Citabilidade

Generative Engine Optimization na era pós-busca. Um ensaio técnico de Raphael Sousa Pereira, escritor de Porto Alegre, dedicado ao estudo de SEO técnico, GEO técnico, autoridade digital e os novos modos de organização da informação na web contemporânea.

Ler ensaio completo Conhecer o autor

GEOestudo técnico

9.311palavras aproximadas

2026publicação original

Apresentação do autor.

Raphael Sousa Pereira é escritor técnico de Porto Alegre, dedicado à investigação de SEO técnico, GEO técnico, autoridade digital, infraestrutura de busca e organização da informação na web contemporânea.

Escrita técnica

O ensaio nasce como produção autoral, com linguagem analítica, vocabulário próprio e compromisso com precisão conceitual, sem reduzir o tema a um manual de tendências.

Pesquisa aplicada

A obra observa a transição entre busca tradicional, mecanismos generativos, crawlers, dados estruturados e novas formas de autoridade digital.

Origem e campo

A partir de Porto Alegre, Raphael Sousa Pereira desenvolve uma linha editorial voltada a SEO técnico, GEO técnico e leitura crítica da presença digital.

Percurso do ensaio.

O texto percorre a genealogia do GEO, os limites do SEO clássico, a infraestrutura técnica da web, a economia da citação, a mensuração possível e a camada agêntica que começa a reorganizar a busca digital.

Genealogia e definição

O ensaio diferencia SEO, AEO e GEO, explicando por que a unidade de análise deixa de ser apenas a URL ranqueada e passa a envolver fragmentos, fontes e respostas sintetizadas.

Infraestrutura e governança

O texto examina robots.txt, llms.txt, schema markup, crawlers de IA e a necessidade de políticas técnicas mais conscientes para sites profissionais.

Medição e futuro

A parte final discute Share of Voice em IA, co-citação, tráfego atribuído, cenários para 2027-2030 e a chegada de agentes autônomos como nova fronteira.

ENSAIO

Abertura

Em novembro de 2023, seis pesquisadores de Princeton, do Allen Institute, da Georgia Tech e do IIT Delhi publicaram no arXiv um artigo de quatorze páginas que ficaria conhecido pela sigla que ele próprio cunhou: GEO, Generative Engine Optimization. Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan e Deshpande não inventaram uma técnica; deram nome a um problema. Pela primeira vez, em sede científica, alguém formalizou o que vinha sendo chamado, em fóruns de marketing digital, de "AI SEO", "AEO" ou "LLMO" — sem definição precisa, sem benchmark, sem método. O paper foi apresentado em agosto de 2024 na ACM KDD, a conferência mais respeitada de mineração de dados do mundo, e desde então acumulou centenas de citações em literatura subsequente.

Esse ensaio parte do reconhecimento desse marco e tenta avançar além dele. Não pretende ser um manual operacional — esses já existem aos milhares, alguns úteis, a maioria não — mas uma reflexão sobre o que GEO realmente é quando se subtrai o hype, e sobre o que vem a seguir quando o ecossistema de busca, que foi estável por vinte e cinco anos, atravessa sua reorganização mais profunda desde o lançamento do PageRank em 1998.

Escrevo aqui na posição de quem audita sites profissionalmente desde antes do ChatGPT existir, e que tem acompanhado, semana a semana, a transformação dos sinais que importam. Há uma tese central que pretendo defender ao longo das próximas seções: GEO não é uma extensão do SEO. É um sucessor parcial, com lógica de ranqueamento diferente, com economia diferente, com governança técnica diferente, e com unidades de mensuração que ainda não estão consolidadas. Tratar GEO como "SEO para LLMs" é o erro estratégico mais caro que um profissional de visibilidade digital pode cometer em 2026.

O ensaio se organiza em doze movimentos. Começo pela genealogia conceitual — de onde vem o termo, o que ele significa rigorosamente, o que o distingue de AEO e do SEO clássico. Depois entro nos crawlers de IA, no estado real da infraestrutura de coleta, nos números públicos da Cloudflare sobre quem indexa o quê e em que proporção. Discuto então a proposta llms.txt, suas promessas, suas críticas legítimas e o paradoxo da adoção. Avanço para a economia da citação, para a fragmentação da SERP, para a quebra do contrato implícito entre publishers e indexadores. Encerro com três cenários sobre o futuro que considero defensáveis, sem cair na futurologia barata que infesta este nicho.

Uma observação metodológica antes de prosseguir. Tudo o que se afirma aqui sobre dados de mercado é verificável em fontes públicas — Cloudflare Radar, HUMAN Security 2026 State of AI Traffic, Ramp AI Index, SimilarWeb, Anthropic e OpenAI em documentação oficial. As inferências e juízos são meus, e marcados como tais. Não há tabelas com pesos proprietários, frameworks com nomes pomposos, nem percentuais que apareceram do nada. Quando algo é hipótese, está rotulado como hipótese. Quando algo é prática consolidada, está marcado como tal.

PARTE I

Genealogia e definição

CAPÍTULO 1

O que GEO significa rigorosamente

A sigla GEO traduz-se literalmente como otimização para mecanismos generativos. A definição operacional que o paper de Princeton oferece é mais útil: "otimizar o conteúdo de uma fonte para maximizar a probabilidade e a proeminência com que ela é referenciada na resposta gerada por um motor generativo a uma consulta do usuário". A definição contém quatro elementos críticos que merecem ser destrinchados, porque é nas omissões que mora a confusão.

Primeiro, o objeto otimizado é o conteúdo de uma fonte — não a fonte como entidade, não o domínio como reputação, não o autor como pessoa. Isso é importante porque a maior parte do trabalho prático de GEO em 2026 acontece no nível do conteúdo individual: parágrafos específicos, blocos FAQ específicos, tabelas específicas. O modelo generativo extrai fragmentos, não páginas inteiras, e a unidade de auditoria precisa acompanhar essa granularidade.

Segundo, maximizar a probabilidade. Isso reconhece desde a definição que o resultado é probabilístico, não determinístico. O mesmo prompt feito ao mesmo modelo no mesmo dia pode produzir respostas diferentes, com fontes diferentes. Qualquer ferramenta que prometa rankings estáveis em GEO está vendendo SEO disfarçado. A medida correta é frequência ao longo de uma janela temporal, não posição em um instante.

Terceiro, e a proeminência. Aparecer na resposta não é suficiente. Aparecer em posição um, no primeiro parágrafo, com atribuição visível, com tom favorável — isso é um resultado materialmente diferente de aparecer como nota de rodapé entre cinco outras fontes. O paper de Princeton chamou a métrica composta de Position-Adjusted Word Count, ou PAWC. A indústria ainda não convergiu para uma medida única, e isso é parte do problema metodológico que discuto adiante.

Quarto, a uma consulta do usuário. Isso encerra a definição numa instância específica: uma pergunta em uma janela de chat em um momento. GEO é, portanto, uma disciplina query-centric, não site-centric. O que importa não é o seu site no abstrato; é o seu site na resposta a uma pergunta específica, feita por uma pessoa específica, mediada por um modelo específico. A unidade de análise muda.

É essa mudança da unidade de análise que faz GEO ser categoricamente distinto de SEO. SEO mede posição da URL em uma página de resultados. GEO mede presença de fragmento em uma resposta sintetizada. A diferença soa sutil. Não é. SEO é jogo de catálogo: você está, ou não está, no top dez para a palavra-chave X. GEO é jogo de compilação: o modelo está reescrevendo a resposta a partir de pedaços de várias fontes, e a sua função é fazer com que pedaços do seu conteúdo entrem nessa compilação.

Há uma terceira sigla circulando, AEO — Answer Engine Optimization — que merece comentário breve. A literatura prática usa AEO e GEO de forma intercambiável, mas há uma distinção útil. AEO refere-se à otimização para featured snippets, People Also Ask, e respostas diretas extraídas da SERP do Google — recursos que existem desde 2014, anteriores aos LLMs. GEO refere-se especificamente à otimização para respostas geradas por modelos de linguagem, que sintetizam de múltiplas fontes em vez de extrair de uma única. Em 2026, com o Google AI Overviews funcionando como camada generativa sobre a SERP tradicional, a fronteira entre AEO e GEO ficou borrada na prática, mas a distinção conceitual permanece útil para discussão técnica.

CAPÍTULO 2

Por que SEO não basta

Há uma posição confortável que circula em conferências brasileiras de marketing digital em 2026 segundo a qual GEO é uma extensão natural do SEO bem feito. O argumento corre assim: se você escreve bem, estrutura bem, tem schema markup, tem autoridade de domínio, ranqueia no Google. Se ranqueia no Google, é encontrado pelas IAs, porque elas leem o Google. Logo, basta continuar fazendo SEO de qualidade. Esse argumento é parcialmente correto e majoritariamente perigoso. Vamos por partes.

A parte correta: bom SEO é, sim, condição necessária. Um site que não consegue ser indexado, que não tem estrutura semântica clara, que não declara dados estruturados, é invisível tanto para o Google quanto para os LLMs. As fundações técnicas são as mesmas. O Lighthouse Core Web Vitals continua importando, o sitemap XML continua importando, a hierarquia de H1-H2-H3 continua importando. Quem está estruturalmente fraco no SEO está estruturalmente fraco no GEO. Não há atalho.

A parte perigosa: condição necessária não é condição suficiente. Há sites perfeitamente otimizados para o Google que são sistematicamente ignorados pelos LLMs em respostas geradas, e há sites medíocres no SEO clássico que ganham visibilidade desproporcional nas respostas do ChatGPT, do Claude e do Perplexity. A diferença está em sinais que o ranqueamento tradicional não pesa, ou pesa menos. Vou nomear três que considero mais relevantes em 2026, com base no que é hoje observável publicamente.

O primeiro sinal é densidade temática vertical, ou cobertura profunda. Para o Google, ter dez páginas mediocremente otimizadas sobre dez subtemas correlatos é melhor do que ter uma única página gigantesca sobre o tema-pai, porque cada página captura uma palavra-chave de cauda longa. Para os LLMs, é o oposto: uma página densa de quatro mil palavras, com sumário navegável, com blocos definitórios institucionais, com tabela estruturada, com FAQ, com referências externas verificáveis — essa página tende a ser citada com frequência muito superior. O modelo identifica o que parece com fonte de referência e privilegia esse padrão sobre fragmentação.

O segundo sinal é tom institucional. SEO é razoavelmente neutro quanto a tom: você pode escrever com superlativos comerciais ("o melhor X do mercado"), com primeira pessoa promocional ("nossa marca lidera"), com adjetivos sem qualificação ("incrível", "imperdível"), e ainda assim ranquear se os demais sinais estiverem bem. Para os LLMs, especialmente para modelos treinados com forte ênfase em segurança, factualidade e referência verificável — e o Claude é o exemplo mais nítido disso — a presença sistemática de tom promocional reduz a probabilidade de citação. O modelo reconhece o padrão de marketing e prefere fontes que pareçam editorial-acadêmico. Isso não é palpite: é inferência consistente com a literatura sobre fine-tuning supervisionado dos principais modelos comerciais.

O terceiro sinal é institucionalidade formal — o conjunto de marcadores que faz uma fonte parecer confiável: domínio com governança transparente, autoria visível e atribuível, datas de publicação e modificação explícitas, ausência de calls-to-action comerciais agressivos no corpo do texto educacional. Isso se traduz tecnicamente em schemas como Organization, Article com author e datePublished, e estrutura de Sobre o autor visível. SEO toca esses pontos via E-E-A-T do Google, mas em GEO o peso é desproporcionalmente maior.

A consequência prática é incômoda para muita agência. Sites comerciais otimizados para conversão — com CTAs em cada parágrafo, com tom de venda, com promessas sem ressalva — ranqueiam bem no Google e são apagados pelos LLMs. Sites editoriais com tom de glossário acadêmico, sem CTA visível, com referências explícitas, frequentemente performam mal em conversão direta e excepcionalmente bem em citação por IA. Conciliar as duas arquiteturas dentro do mesmo domínio é o desafio operacional central de GEO em 2026, e a resposta convencional — separar conteúdo educacional em subdomínio dedicado — é defensável, mas não trivial de executar.

CAPÍTULO 3

Os números públicos do tráfego de IA

Antes de continuar com a parte conceitual, é útil ancorar a discussão em dados de mercado verificáveis em fontes públicas. Em 2026, três fontes consolidaram-se como referência: o Cloudflare Radar, que publica dados agregados sobre tráfego de bots em sua rede global; o HUMAN Security 2026 State of AI Traffic, relatório técnico publicado em abril deste ano; e o SimilarWeb, que mede tráfego de chatbots a partir de visitas a sites próprios das plataformas.

O dado mais relevante, e o que orienta praticamente toda decisão de governança de crawlers em 2026, é a chamada crawl-to-refer ratio. O número mede quantas páginas um crawler de IA acessa para cada visita que o produto correspondente envia de volta ao publisher. No primeiro trimestre de 2026, o ClaudeBot da Anthropic operou com ratio aproximada de vinte mil para um, segundo dados consolidados da Cloudflare. O GPTBot da OpenAI operou em torno de mil duzentos para um. O Google, somando Googlebot e Google-Extended, operou em torno de cinco para um. Esses três números explicam, sozinhos, a quase totalidade dos debates atuais sobre bloqueio de bots no robots.txt.

A interpretação é direta. Crawlers de treinamento — bots que coletam conteúdo para alimentar a próxima versão do modelo — não enviam tráfego de volta. Eles ingerem. O conteúdo coletado entra em um corpus, é destilado em pesos do modelo, e em algum momento futuro pode ou não ser parafraseado em resposta a uma pergunta do usuário, sem atribuição clicável. A economia, do ponto de vista do publisher, é estruturalmente negativa: cede-se conteúdo, não se recebe tráfego.

Crawlers de busca, em contraste, operam com lógica diferente. O OAI-SearchBot da OpenAI, o Claude-SearchBot da Anthropic, o PerplexityBot — estes bots constroem índices de retrieval que respondem a consultas em tempo real, e quando o modelo cita uma fonte, há um link clicável de volta ao site original. As ratios desses bots de busca são significativamente melhores. O Perplexity, em particular, com sua política de incluir entre quatro e oito citações clicáveis em cada resposta, é hoje a única plataforma de IA generativa em que a visibilidade em respostas se traduz com confiabilidade em tráfego mensurável no Google Analytics.

A grande mudança técnica de 2024 a 2026 foi a fragmentação dos bots por função. Em 2024, a OpenAI operava um único GPTBot que fazia coleta de treinamento e indexação para busca. Em 2026, a OpenAI declara quatro bots: GPTBot para treinamento, OAI-SearchBot para indexação, ChatGPT-User para fetches em tempo real durante sessões com usuários, e OAI-AdsBot, lançado em abril, para validação de anúncios. A Anthropic seguiu o mesmo padrão, com ClaudeBot para treinamento, Claude-SearchBot para indexação de busca, e Claude-User para sessões com usuários. O Google manteve a separação entre Googlebot, que indexa para a Busca clássica, e Google-Extended, que opt-out separadamente do treinamento do Gemini.

A implicação operacional dessa fragmentação é clara para qualquer profissional sério: regras no robots.txt do tipo "User-agent: * Disallow: /" são obsoletas, e regras do tipo "User-agent: GPTBot Disallow: /" também são, na prática, errado-em-2026, porque elas confundem o leitor sobre as quatro funções distintas que o GPTBot já não tem mais. A política racional em 2026 envolve declarar regras separadas para cada user-agent, com lógicas distintas para treinamento versus busca, baseadas em uma análise consciente da crawl-to-refer ratio do seu setor específico.

Há um adendo geográfico interessante. Os dados regionais da Cloudflare mostram que em mercados como Brasil, Japão, Austrália e Coreia do Sul, o ChatGPT-User — bot que faz fetches em tempo real quando um usuário pergunta — é proporcionalmente muito mais ativo do que o GPTBot de treinamento. Isso significa que sites brasileiros enfrentam uma realidade diferente da americana: o consumo majoritário do nosso conteúdo por IA é query-driven, não training-driven. As implicações disso para governance e mensuração ainda não foram suficientemente discutidas no mercado nacional, e voltarei a esse ponto no capítulo final.

PARTE II

Infraestrutura

CAPÍTULO 4

O robots.txt como contrato fundamental

Há um arquivo de texto simples, definido pela IETF em 2022 como RFC 9309, que continua sendo o instrumento contratual mais importante na governança técnica de qualquer site em 2026. Esse arquivo — o robots.txt — tem trinta anos de história e foi originalmente proposto por Martijn Koster em 1994 como um padrão informal para que sites comunicassem aos crawlers de busca quais áreas eram permitidas e quais não. Por décadas, ele foi quase invisível para a maior parte dos webmasters; em 2026, virou o ponto de decisão estratégica número um para qualquer empresa com presença digital significativa.

A razão é simples: em um mundo em que dezenas de crawlers de IA distintos varrem a web diariamente, cada um com lógica própria, cada um com economia própria de retorno ao publisher, o robots.txt é o único ponto de controle de baixo custo, sob jurisdição exclusiva do dono do domínio, capaz de declarar política diferenciada por bot. CDNs como Cloudflare oferecem controles equivalentes em camadas superiores, com custos e dependências. O robots.txt é gratuito, ubíquo e auditável.

Há quatro decisões que todo gestor de visibilidade digital precisa tomar conscientemente em 2026 sobre o robots.txt do seu domínio. A primeira é se o arquivo existe. Em uma amostragem que fiz informalmente em outubro de 2025 sobre sites institucionais de pequenas e médias empresas brasileiras, mais de metade não publicava robots.txt. Isso significa, no contrato implícito do protocolo, que tudo está permitido a todos os bots — incluindo bots de treinamento que não enviam tráfego de volta. Não é a pior política, mas é uma política por omissão, não por decisão. Para uma empresa que entende GEO como vetor competitivo, política por omissão é capital simbólico jogado fora.

A segunda decisão é sobre os bots de treinamento dos grandes modelos. GPTBot da OpenAI, ClaudeBot da Anthropic, Google-Extended do Google, Meta-ExternalAgent da Meta, CCBot do Common Crawl. Esses cinco bots, em 2026, respondem coletivamente por mais de oitenta por cento do tráfego de coleta para treinamento na web aberta, segundo Cloudflare. A decisão de permitir, bloquear ou permitir condicionalmente esses bots tem implicações tanto éticas — você quer que sua produção intelectual entre em modelos comerciais sem compensação? — quanto estratégicas — você quer que sua marca seja conhecida pelo modelo quando ele tentar responder sobre seu setor?

A literatura jurídica de 2025-2026 ainda não resolveu a questão. O processo do New York Times contra OpenAI, aberto em dezembro de 2023, segue em curso. As decisões preliminares apontam para um regime em que treinamento sem licença será considerado uso transformativo legítimo em alguns contextos e infração em outros, com a distinção dependendo de fatores como concorrência direta entre o modelo e o produto original. Para um publisher comercial, a regra prática que tem se consolidado é: bloqueie bots de treinamento se você é jornal, editora, ou produtor de conteúdo cuja monetização depende de page views; permita bots de busca em qualquer caso, porque a economia é positiva.

A terceira decisão é sobre os bots de busca em tempo real — OAI-SearchBot, Claude-SearchBot, PerplexityBot, ChatGPT-User. Aqui a equação muda. Esses bots constroem os índices que respondem a consultas dos usuários, e cada citação clicável é uma chance de aquisição. Bloqueá-los equivale a sair do índice. A política racional é permitir explicitamente, e a estratégia avançada é monitorar com regularidade a frequência de citação por consulta-tipo relevante para o negócio.

A quarta decisão é sobre o que aparece no robots.txt além das regras de bot. Sitemap declarado? Links para llms.txt declarados? Comentários documentando a política? Em 2026, sites maduros publicam robots.txt com vinte a sessenta linhas declarativas, contemplando dez a quinze user-agents distintos, com lógica documentada. Sites pequenos publicam quatro linhas. A diferença não é técnica; é sinalização de seriedade institucional, e essa sinalização é lida por auditores humanos quando avaliam parceiros, fornecedores e contratos.

CAPÍTULO 5

A controvérsia llms.txt

Em 3 de setembro de 2024, Jeremy Howard — cofundador da Answer.AI, ex-presidente da Kaggle, pesquisador respeitado de deep learning aplicado — publicou no llmstxt.org uma proposta de padrão aberto. A ideia era simples e elegante. Sites publicariam, na raiz do domínio, um arquivo chamado llms.txt em formato Markdown, contendo uma lista curada de URLs prioritárias com descrições curtas, organizadas por seções com cabeçalhos H2. Esse arquivo funcionaria como mapa institucional para LLMs, dirigindo o modelo às páginas que o dono do site considera autoritativas, sem que o modelo precisasse indexar o domínio inteiro.

A justificativa técnica era válida. LLMs operam com janelas de contexto limitadas — mesmo modelos com janelas de duzentos mil tokens não conseguem absorver um site empresarial inteiro em uma única passada. Um mapa curado, em Markdown legível por humanos e por máquinas, reduziria custo computacional, melhoraria precisão, e devolveria ao site dono do domínio algum grau de controle sobre como ele é apresentado pela IA. A analogia com robots.txt e sitemap.xml era explícita: assim como aqueles arquivos serviram a busca clássica, llms.txt serviria à busca generativa.

A reação inicial foi entusiasmada. Centenas de sites publicaram seus llms.txt nas primeiras semanas. Comunidades de desenvolvedores compartilharam templates. Em algumas conferências brasileiras de SEO em 2025, a recomendação de implementar llms.txt apareceu sem ressalva como boa prática emergente. A indústria começou a tratar o arquivo como sinal positivo certo, e a Cloudflare chegou a oferecer geração automática de llms.txt como feature em sua suíte de produtos.

A reação posterior foi mais sóbria, e merece atenção. Em meados de 2025, análises da Ahrefs publicaram a constatação inconveniente: nenhum dos principais provedores de LLM — OpenAI, Anthropic, Google — declarou suporte oficial ao llms.txt. Mais do que isso, evidência de logs de servidor mostrava que os crawlers dessas empresas não requisitavam o arquivo. Em essência, a indústria de SEO estava implementando um arquivo que ninguém estava lendo.

Houve réplicas. Em fevereiro de 2026, a agência alemã dev5310 publicou um relato técnico documentando que, após submeter seu llms.txt ao Google Search Console, observaram dentro de três dias que o arquivo estava sendo referenciado por respostas geradas em produtos do Google — citação visível, atribuição clara. O caso virou referência defendendo que o protocolo funciona quando explicitamente submetido a pipelines de indexação, mesmo que crawlers automáticos não o solicitem. Adicionalmente, registros de servidor de alguns sites começaram a mostrar fetches esporádicos de llms.txt por OAI-SearchBot e ChatGPT-User em 2026, sugerindo experimentação silenciosa pelos próprios provedores.

Onde isso deixa o profissional em 2026? Em uma posição honesta de incerteza calibrada. Meu juízo, e está explicitamente marcado como juízo, é o seguinte: implementar llms.txt em 2026 tem custo marginal próximo de zero, sinalização institucional positiva para auditores humanos, opcionalidade positiva diante da hipótese de adoção futura por provedores principais, e nenhum efeito colateral negativo identificável. A decisão racional é implementar, sem expectativa de retorno imediato mensurável, como aposta de baixo custo em padrão emergente. Implementar e esquecer.

O que não é racional é o que se vê em parte do mercado: implementar llms.txt e divulgar para o cliente como ação central de GEO, cobrando como entregável principal. Isso confunde sinal de baixo custo com diferencial de alta importância. A diferença é diagnóstica: profissional sério reconhece quando uma técnica é seguro institucional barato versus quando ela move a agulha. Em 2026, llms.txt está categoricamente na primeira categoria.

Há ainda uma observação metodológica que considero importante. A controvérsia do llms.txt revela um padrão recorrente em disciplinas emergentes: quando o regime probatório é fraco — quando não há benchmarks consolidados, quando os provedores não publicam suas regras, quando o efeito de cada técnica é difícil de isolar — a indústria preenche o vácuo com convicções. Algumas dessas convicções se confirmam, outras se desfazem, e o sinal mais confiável de competência técnica é precisamente a capacidade de marcar a diferença entre o que se sabe e o que se acredita.

CAPÍTULO 6

Schema markup e o problema da identidade verificável

O schema.org existe desde junho de 2011, fruto de colaboração entre Google, Bing, Yahoo e Yandex. Por quinze anos, a discussão sobre schema markup pertenceu ao SEO, e o argumento padrão era utilitário: implementar schema melhora rich snippets, melhora click-through rate, melhora compreensão da página pelos crawlers de busca. Em 2026, com a ascensão da busca generativa, schema markup passou a ocupar papel categoricamente diferente. Não é mais ferramenta de polimento; virou substrato de identidade.

Pense no problema do ponto de vista do modelo de linguagem. Um LLM, ao tentar responder "qual a melhor empresa de consultoria estrutural em São Paulo?", precisa decidir entre dezenas de fontes potenciais. Sem dados estruturados, o modelo tem que inferir tudo: quem é a empresa, qual sua categoria, onde fica, qual sua autoridade, se é o mesmo Solis Engenharia que aparece em outras menções pela web. Com schema markup completo — Organization com sameAs apontando para LinkedIn, Wikipedia, Wikidata, perfis profissionais —, o modelo tem um grafo de identidade verificável e auditável. A diferença de probabilidade de citação correta é grande, e está confirmada em literatura técnica das próprias empresas.

Os tipos de schema que mais movem a agulha em GEO, com base no que é hoje observável publicamente, são em essência cinco. Organization e LocalBusiness, para identidade da entidade jurídica e física. Article com author, datePublished e dateModified, para atribuição editorial em conteúdo educacional. FAQPage com pares de Question e Answer corretamente marcados, porque blocos de pergunta-resposta são unidades de extração nativa para LLMs. BreadcrumbList em páginas internas, para contexto navegacional e topical authority. E Service ou Product com provider e description, para resolver a relação entre entidade e oferta.

Há nuances importantes em cada um. Organization sem sameAs é um quase-nada: declara existência mas não verificabilidade. sameAs apontando para perfis genéricos do Facebook ou Instagram contribui pouco; apontando para Wikipedia, Wikidata, perfil regulatório oficial — CREA para engenheiros, OAB para advogados, CRM para médicos —, contribui muito. A regra implícita é: o modelo confia em verificabilidade externa, não em auto-declaração.

Article sem author é outro vazio comum. O campo author não precisa ser uma Person com perfil completo; pode ser uma Organization, e isso é defensável editorialmente. O que reduz fortemente o sinal de E-E-A-T é deixar Article sem nenhum author atribuído. datePublished e dateModified também são frequentemente omitidos, e isso prejudica especialmente o Claude e o Perplexity, que ponderam atualidade como heurística temporal.

FAQPage merece atenção especial. Em monitoramento informal de respostas de modelos generativos durante 2025 e 2026, o padrão recorrente é claro: blocos FAQ com perguntas em forma natural ("O que é X?" ao invés de apenas "X"), com respostas entre cento e cinquenta e duzentas e cinquenta palavras, com frase direta no início respondendo a pergunta antes de qualquer contextualização — esses blocos são extraídos com frequência desproporcional. A heurística do modelo é eficiente: ele identifica a estrutura, copia o par pergunta-resposta para sua resposta gerada, e cita a fonte. É a unidade de extração de mais alto retorno em GEO em 2026.

BreadcrumbList é menos espetacular, mas importa. Páginas internas profundas, sem BreadcrumbList, são ambíguas para o modelo: ele não sabe onde a página se encaixa na hierarquia do site, não consegue inferir relacionamento com outros temas, não consegue construir grafo navegacional. BreadcrumbList implementado em todas as páginas internas custa praticamente nada — quase todo CMS suporta nativamente — e adiciona contexto que o modelo aproveita.

Uma palavra sobre o que não basta: marcar schema sem que o conteúdo visível na página seja coerente com o markup. Modelos de linguagem ingerem tanto o HTML renderizado quanto, em alguns casos, o JSON-LD direto. Quando há divergência — schema declara que a empresa atende em São Paulo, o conteúdo visível menciona apenas Curitiba —, o modelo penaliza a fonte por inconsistência. Schema markup é parte de um par com o conteúdo, não substituto dele.

PARTE III

Economia e política da citação

CAPÍTULO 7

A economia da citação sem clique

Há um deslocamento econômico fundamental acontecendo em 2026 que merece nome próprio: a economia da citação sem clique. Por vinte e cinco anos, a Web foi organizada em torno do clique. A SERP do Google entregava resultados ranqueados, o usuário clicava em um, ia para o site, o site monetizava com anúncios, com leads, com vendas. Esse contrato sustentou a economia inteira de publishing, de mídia digital, de marketing de conteúdo, de SEO como disciplina profissional. Em 2026, esse contrato está sendo reescrito.

Quando alguém pergunta ao ChatGPT "qual é a diferença entre arquitetura de microsserviços e arquitetura monolítica?", o modelo responde diretamente, com duzentas a quatrocentas palavras, em alguns segundos. A resposta é sintetizada de múltiplas fontes — possivelmente artigos de blog técnicos, possivelmente documentação oficial, possivelmente threads do Stack Overflow — e essas fontes podem ou não ser citadas, e mesmo quando citadas, o usuário pode ou não clicar. Os dados públicos de comportamento sugerem que a maioria não clica. A pergunta foi respondida; a transação cognitiva está completa.

Para o publisher do conteúdo original, o que aconteceu? Algumas opções. Primeira: seu conteúdo foi usado, sua marca foi citada com link clicável, o usuário não clicou. Você teve exposição de marca sem tráfego. Segunda: seu conteúdo foi usado, sua marca foi citada sem link clicável (texto puro), o usuário viu o nome. Exposição mais frágil. Terceira: seu conteúdo foi usado, sua marca não foi citada de jeito nenhum. O modelo parafraseou. Você foi treinamento bruto. Quarta: seu conteúdo não foi usado; outro publisher foi. Você está fora da resposta.

Cada uma dessas opções tem economia diferente, e a distribuição entre elas varia drasticamente por plataforma. O Perplexity opera majoritariamente na primeira: cita com link, expõe a marca, e dada a natureza da plataforma — usuários explicitamente em modo pesquisa — há fração mensurável de cliques. O ChatGPT opera majoritariamente entre a segunda e a terceira: cita às vezes, parafraseia frequentemente. O Claude opera majoritariamente na terceira: parafraseia institucionalmente, cita com sobriedade quando cita. O Google AI Overviews opera em modo híbrido com lógica própria que varia por consulta.

Para o profissional de visibilidade digital, isso configura uma decisão estratégica nova. SEO sempre mediu tráfego como métrica-fim. GEO precisa medir presença como métrica-fim, e tráfego como métrica-meio quando aplicável. A pergunta "quanto tráfego você está trazendo?" precisa ser substituída por uma pergunta mais sofisticada: "em que parcela das respostas geradas relevantes para o seu setor a sua marca aparece, em que posição, com que sentimento, em que plataforma?". A indústria chama essa medida de Share of Voice em IA, e há uma dezena de ferramentas comerciais que prometem mensurá-la com graus variados de rigor.

Há um problema metodológico não trivial em medir SoV em IA: respostas variam por sessão, por modelo, por região do usuário, por idioma, por contexto da conversa anterior. Medir SoV de forma estatisticamente válida requer pool grande de prompts, replicação suficiente, controle de variáveis, e amostragem temporal. Ferramentas que prometem isso por noventa e nove dólares por mês geralmente estão fazendo amostragem inadequada, e as recomendações que produzem refletem ruído mais do que sinal. Profissionais sérios em 2026 conhecem essa limitação e a comunicam ao cliente.

Há uma segunda camada de complexidade que merece menção. Para muitos setores — particularmente B2B com ciclo de compra longo —, ser citado pelo LLM no momento da pesquisa inicial pode importar mais do que clique imediato. O usuário fez a pergunta exploratória ao ChatGPT, viu sua marca mencionada, não clicou. Três semanas depois, vai pesquisar concorrentes específicos. O nome da sua marca está no horizonte cognitivo dele. Esse efeito de top-of-mind sem clique imediato é estruturalmente análogo ao branding por exibição em mídia tradicional, e exige instrumentos de mensuração equivalentes — pesquisa de awareness, brand lift, attribution multi-touch — que poucos profissionais em GEO estão equipados para entregar em 2026. A maioria continua medindo apenas tráfego, e portanto subestimando seu impacto.

Convém ainda registrar uma observação contra-intuitiva sobre conversão. Em monitoramento de funis de aquisição de clientes B2B operados por agências brasileiras com as quais mantenho contato técnico, há um padrão emergente: clientes que vieram via citação de LLM, quando convertem, convertem com ciclo de vendas significativamente mais curto e ticket médio superior aos que vieram via SEO orgânico convencional. A hipótese explicativa razoável é que o usuário que chega via menção em resposta de IA já passou por uma camada implícita de validação — o modelo considerou a marca relevante o suficiente para citá-la —, o que reduz o trabalho de convencimento na ponta. Esse padrão precisa ser corroborado por estudos com amostragem rigorosa, mas, se confirmado, implica que o valor por contato adquirido via GEO pode ser estruturalmente maior, mesmo quando o volume é menor. O que muda a aritmética inteira de avaliação de retorno.

CAPÍTULO 8

Quem decide o que pode ser citado

Há uma questão de política que tem sido desconfortavelmente subdiscutida no debate brasileiro sobre GEO, e que considero central. Quando um modelo de linguagem responde a uma pergunta de um usuário citando determinadas fontes e omitindo outras, quem está decidindo quais fontes merecem visibilidade? A resposta curta é: as próprias empresas que treinam e operam os modelos. A resposta longa exige nuance.

Os mecanismos de busca clássicos eram, e são, governados por algoritmos publicáveis em termos gerais — PageRank, BM25, sinais de E-E-A-T, fatores de atualidade. As empresas não publicam o código exato, mas publicam princípios. O Google mantém Search Quality Evaluator Guidelines com mais de duzentas páginas, atualizadas regularmente, acessíveis publicamente. A indústria de SEO desenvolveu-se ao redor desses princípios públicos.

Os modelos de linguagem não funcionam assim. Não há análogo publicado das Search Quality Evaluator Guidelines para o GPT-5, para o Claude Opus, para o Gemini. Há documentação de uso aceitável, há cartas-modelo de safety, há descrições gerais de processo de treinamento. Não há nada equivalente a um guia público que diga "essas são as características que tornam uma fonte mais provável de ser citada". Tudo o que sabemos sobre comportamento de citação dos LLMs em 2026 vem de observação empírica externa — monitoramento de respostas, comparação entre prompts, inferência estatística sobre padrões.

Isso configura uma assimetria informacional estrutural. As empresas que treinam os modelos sabem o que está em seu corpus, sabem como o fine-tuning supervisionado moldou o modelo, sabem com precisão o que aumenta e o que diminui probabilidade de citação. Os publishers e profissionais de visibilidade externos operam por sondagem indireta. A literatura prática de GEO em 2026 — incluindo este ensaio — é, em última instância, ciência observacional sobre sistemas cuja física interna é proprietária.

Há implicações políticas dessa assimetria que vale a pena nomear. Primeiro, há concentração de poder de curadoria epistêmica nas mãos de poucas empresas. Quando alguém pergunta ao ChatGPT "qual é a melhor universidade do Brasil para X?", o modelo responde a partir de critérios que ele aprendeu em seu corpus, sem que nenhuma autoridade pública tenha auditado ou aprovado esses critérios. Isso é categoricamente diferente do regime da SERP, que ainda assim sofre escrutínio antitruste regular.

Segundo, há o problema da reprodutibilidade. SEO clássico permitia auditoria pública: você podia pesquisar, ver a SERP, comparar com o que outros viam. Respostas de LLM são parcialmente personalizadas, mudam com o tempo, mudam por região, mudam por sessão. Não há SERP pública estável para auditar. Isso reduz drasticamente a capacidade de organismos reguladores, jornalistas e pesquisadores independentes de avaliar viés sistemático nas respostas.

Terceiro, há a questão da remediação. Se uma empresa identifica que está sendo sistematicamente omitida ou caracterizada de forma desfavorável pelas respostas geradas, qual é o canal de recurso? No SEO clássico, há Search Console, há documentação pública, há processo de reconsideração. Nos LLMs, em 2026, esse canal mal existe. Algumas empresas oferecem mecanismos informais de feedback; nenhuma oferece processo equivalente ao do Google em rigor.

Há também o problema da temporalidade da remediação. Mesmo quando há canal, o ciclo de correção é radicalmente diferente. No SEO, uma página recém-otimizada pode ver mudança em ranking em semanas. Nos modelos de linguagem, a maior parte do conhecimento factual vem do corpus de treinamento, que é atualizado em ciclos longos — meses, às vezes mais de um ano. Uma marca que decide reposicionar-se editorialmente para melhor performance em GEO precisa entender que o efeito do trabalho só se materializa em modelos retreinados depois do investimento, com defasagem temporal que não tem análogo no SEO. Isso desfavorece estruturalmente quem chega tarde, e favorece desproporcionalmente quem se preparou cedo.

Não tenho posição polêmica para defender aqui. Tenho recomendação prática para profissionais. Reconheça que o regime de governança epistêmica está em transição, que as regras estão sendo escritas em tempo real, e que a expertise técnica de GEO em 2026 inclui necessariamente a capacidade de explicar ao cliente os limites do que se sabe e o que ainda é hipótese. Esse é o tipo de honestidade metodológica que diferencia profissional sério de vendedor de framework. Em uma disciplina jovem, o capital reputacional de longo prazo está em não overclaim. Em uma disciplina madura, está em entregar resultado. GEO em 2026 ainda está claramente na primeira fase.

CAPÍTULO 9

A fragmentação multi-modelo

Os dados do SimilarWeb em abril de 2026 marcam uma virada que vale a pena registrar. Pela primeira vez desde a popularização do ChatGPT em 2023, a participação da OpenAI no tráfego global de sites de chatbots caiu para cinquenta e três vírgula sete por cento — uma queda de quase vinte e quatro pontos percentuais em doze meses. O Gemini do Google cresceu de sete vírgula vinte e sete para vinte e seis vírgula sete por cento no mesmo período. O Claude da Anthropic subiu de um vírgula trinta e sete para sete vírgula noventa e cinco por cento. Em paralelo, o Ramp AI Index — que mede assinaturas pagas em mais de cinquenta mil empresas americanas — registrou que a Anthropic ultrapassou a OpenAI em adoção corporativa, atingindo trinta e quatro vírgula quatro por cento de penetração contra trinta e dois vírgula três por cento da OpenAI.

Essas duas mudanças simultâneas — diversificação no consumo, diversificação na adoção corporativa — desfazem uma das premissas implícitas mais comuns da literatura prática de GEO de 2024 e 2025: a premissa de que otimizar para o ChatGPT bastava, porque o ChatGPT era a IA. Em 2026, essa premissa é falsa. Há pelo menos quatro motores generativos com escala material relevante — ChatGPT, Gemini, Claude, Perplexity — e cada um deles tem corpus, lógica de retrieval, preferência de tom e padrão de citação distintos. Otimizar para um pode ser neutro ou contraproducente para outro.

Vale a pena documentar as diferenças observáveis em 2026, com a ressalva metodológica de praxe: tudo o que se afirma aqui é inferência estatística sobre comportamento de modelos opacos, sujeita a revisão sem aviso prévio quando os provedores fizerem novos rounds de fine-tuning.

O ChatGPT, em sua linha GPT-5, tende a privilegiar diversidade de fontes — costuma sintetizar de quatro a oito fontes distintas em uma resposta de profundidade média — e tem inclinação visível para conteúdo conversacional de comunidade, particularmente Reddit, Stack Overflow e fóruns especializados. Em verticais técnicos como software e finanças, é razoavelmente comum o ChatGPT citar threads do Reddit acima de blogs corporativos otimizados. Tom comercial reduz probabilidade de citação, mas menos drasticamente do que no Claude.

O Claude, da Anthropic, opera o que tenho chamado informalmente de regime de institucionalidade ponderada. Cita menos fontes por resposta — tipicamente três a cinco — mas privilegia fortemente fontes que parecem editorial-acadêmico: universidades, hospitais-escola, órgãos reguladores, conselhos profissionais, sociedades científicas, marcas com hubs editoriais densos em subdomínio dedicado. Tom promocional é penalizado de forma marcante. Cauda longa profunda — domínios pequenos hiper-especializados em subtemas estreitos — recebe peso surpreendentemente alto.

O Gemini, integrado nativamente à infraestrutura de busca do Google, herda em boa medida os sinais do ranqueamento clássico. Boa performance de SEO geralmente se traduz em boa performance de Gemini, com ressalvas para o efeito específico do Google AI Overviews, que filtra a SERP com lógica própria. Conteúdo em vídeo no YouTube — propriedade do Google — tem peso desproporcionalmente alto em respostas do Gemini quando o tópico é visualmente demonstrável. Conteúdo em redes sociais, similarmente, recebe atenção que outros modelos não dão.

O Perplexity opera uma lógica híbrida que se aproxima do papel histórico do Bing: indexa em tempo real, cita generosamente com links clicáveis, prioriza fontes recentes e factualmente densas. Em verticais regulados — saúde, jurídico, finanças — privilegia domínios .gov, .edu e .org de forma observável. É a única plataforma em que earned media de imprensa tradicional, ainda em 2026, tem retorno mensurável material.

A consequência operacional é desconfortável: não existe uma estratégia GEO única. Existem cinco estratégias parcialmente sobrepostas, e a alocação ótima depende do mix de modelos que efetivamente importa para o público de cada cliente. Para um SaaS B2B em vertical técnica nos Estados Unidos em 2026, Claude e ChatGPT pesam mais. Para um e-commerce de consumo de massa no Brasil, ChatGPT-User e Gemini pesam mais. Para uma empresa em vertical regulada operando para profissionais especializados, Perplexity pesa mais do que o tamanho de mercado sugeriria. Nada disso é evidente de fora; requer monitoramento direto.

Existe um corolário comercial que merece nota. Agências brasileiras que oferecem GEO em 2026 frequentemente vendem como pacote único, com entregáveis idênticos para clientes em verticais radicalmente diferentes. Isso é ineficiência travestida de simplicidade operacional. O cliente em vertical regulada está pagando por trabalho que privilegia plataformas erradas para seu público. O cliente em e-commerce está pagando por trabalho que ignora o canal dominante para sua audiência. Profissional sério em 2026 precificará e entregará GEO de forma diferenciada por vertical, mesmo que isso complique a operação interna. A alternativa é entregar genericamente e gerar resultados subótimos para todos.

CAPÍTULO 9B

A mensuração possível e a mensuração honesta

Há uma questão prática que toda agência sofre quando o cliente faz a pergunta inevitável: como vamos medir isso? Em SEO, a resposta tem trinta anos de literatura: rankings, tráfego orgânico, conversões assistidas, share of impressions, click-through rate. Cada métrica tem definição estabilizada, ferramentas reconhecidas, padrões de relatório. Em GEO em 2026, nada disso está consolidado, e a tentação fácil é importar métricas de SEO disfarçadas, dando a impressão de rigor onde há improvisação.

Vou listar as métricas que considero hoje defensáveis, com suas limitações reais. A primeira é Share of Voice em IA: frequência com que a marca aparece em resposta a um pool de prompts predefinidos, ao longo de uma janela temporal, em uma ou mais plataformas. Para ser metodologicamente honesta, essa métrica exige pool grande — cento e cinquenta a trezentos prompts cobrindo a vertical do cliente —, replicação suficiente — cada prompt executado entre cinco e dez vezes para reduzir variância —, e amostragem temporal — janelas semanais ou quinzenais comparáveis. Sem essas condições, o número reportado é ruído.

A segunda métrica é Posição Média: quando a marca aparece, em que posição na resposta ela aparece. Em LLMs que retornam citações ordenadas, a primeira fonte tem peso muito superior à quinta. O Princeton paper formalizou isso como Position-Adjusted Word Count, mas a indústria ainda não convergiu para uma medida padronizada. A pragmática que funciona é simplesmente Posição da Primeira Menção, com escala invertida (1 = melhor).

A terceira métrica é Sentimento da Menção: quando a marca é citada, o contexto em torno dela é favorável, neutro ou desfavorável. LLMs ocasionalmente citam marcas em contextos críticos — "a empresa X, conhecida por suas controvérsias regulatórias, oferece serviço Y" — e essa menção, embora positiva em SoV bruto, é negativa em termos de marca. Mensurar sentimento exige classificação textual semi-supervisionada, ou trabalho de revisão humana amostral. Os números agregados que algumas ferramentas comerciais reportam frequentemente são produzidos por classificadores genéricos de sentimento, com taxa de erro alta para contexto técnico de marca. Honestidade exige reportar com intervalo de confiança, não com decimal.

A quarta métrica, ainda pouco usada, é Diversidade de Co-Citação: quando a marca aparece, com quem ela aparece junto. Em uma resposta sobre "melhores agências de marketing digital em Porto Alegre", a marca pode aparecer ao lado de concorrentes diretos — sinal de paridade competitiva — ou ao lado de marcas em vertical adjacente — sinal de posicionamento ambíguo. Essa métrica não tem nome consolidado; eu a chamo de Quem Você Acompanha. O conjunto de marcas co-citadas é uma assinatura de posicionamento, mais reveladora do que ranking isolado.

A quinta métrica, e a mais difícil de coletar com rigor, é Tráfego Atribuído a IA: visitas ao site originadas de respostas geradas, identificáveis por referrer ou parâmetro UTM. O Perplexity entrega isso com fidelidade alta, porque suas citações são clicáveis e o referrer é claro. O ChatGPT, especialmente quando usado em modo mobile ou em app embutido, entrega isso de forma fragmentada. O Google AI Overviews mistura tráfego com a SERP clássica de forma que torna a atribuição quase impossível. Ferramentas como GA4 oferecem segmentos para tráfego de IA, mas a cobertura está longe de completa em 2026.

Há uma sexta categoria que considero subestimada: Sinais Indiretos. Quando uma marca é sistematicamente citada por LLMs em sua vertical, isso costuma se traduzir em aumento de busca branded — pessoas pesquisando o nome da marca diretamente após terem ouvido falar dela via IA — e em aumento de tráfego direto sem referrer. Esses efeitos aparecem em Google Search Console e em GA4, mas atribuí-los à exposição em LLM em vez de a outras causas exige análise cuidadosa de série temporal. Quando há aumento súbito de busca branded sem campanha publicitária correspondente, há boa probabilidade de o efeito ser GEO. Provar com rigor experimental, contudo, requer trabalho metodológico que pouquíssimos profissionais entregam.

A síntese honesta é que medir GEO em 2026 é, em parte, conforto e, em parte, escárnio metodológico. As ferramentas comerciais entregam números que parecem rigorosos, e que ficam bonitos em dashboard, mas que repousam sobre amostragem frequentemente inadequada. O dever do profissional sério é entregar o melhor número possível dado o estado do campo, comunicar suas limitações ao cliente, e resistir à tentação de reportar precisão que não existe. Isso é mais difícil do que parece, porque o cliente que paga quer convicção, e a indústria recompensa quem entrega convicção mesmo quando a convicção não é defensável. Quem resiste a essa pressão paga preço de curto prazo. Quem cede paga preço de longo prazo. A escolha está em jogo todo dia.

PARTE IV

O que vem a seguir

CAPÍTULO 10

Três cenários defensáveis para 2027-2030

Predição de longo prazo em disciplinas emergentes é exercício humilhante. A história recente da indústria de tecnologia está cheia de previsões confiantes que envelheceram mal — a morte do desktop, o domínio absoluto do mobile, o blockchain como infraestrutura universal. Em vez de oferecer uma predição única, vou expor três cenários que considero igualmente defensáveis, e os sinais que distinguiriam um do outro.

Cenário primeiro: a Convergência. Os principais provedores de IA generativa convergem em direção a protocolos abertos comuns para acesso a conteúdo. Em 2027 ou 2028, schema.org evolui para incluir tipos específicos de GEO. llms.txt ou um sucessor é adotado oficialmente por OpenAI, Anthropic e Google. Surge algo análogo às Search Quality Evaluator Guidelines, publicado pelos próprios provedores. A indústria de GEO se estabiliza com regras conhecidas, e o trabalho de auditoria torna-se rotinizável, similar ao que aconteceu com SEO entre 2005 e 2012. O nicho profissional sobrevive, mas margens caem.

Esse cenário tem alguns sinais a observar. Convergência em user-agents declarados publicamente. Surgimento de padrões IETF ou W3C explicitamente endereçando questões de retrieval de IA. Anúncios públicos de pelo menos dois dos quatro provedores principais comprometendo-se com transparência incremental sobre fatores de citação. Crescimento de literatura científica revisada por pares sobre GEO, com benchmarks padronizados. Em 2026, há sinais fracos de movimento nessa direção, mas não dominantes.

Cenário segundo: a Fragmentação Permanente. Os provedores principais nunca convergem. Cada um desenvolve protocolos proprietários, com interfaces de submissão de conteúdo via APIs comerciais. A versão paga do ChatGPT permite que marcas paguem para serem citadas em respostas específicas, similar a como funcionam ads em busca. Surge mercado regulatório específico — talvez na União Europeia primeiro — exigindo divulgação obrigatória de critérios de citação. A indústria de GEO se transforma em algo mais próximo de media buying do que de otimização técnica, com escolha de plataforma sendo decisão estratégica explícita por canal.

Sinais a observar: lançamento de produtos de paid placement em respostas de IA por algum dos provedores principais. Surgimento de regulação europeia ou brasileira exigindo transparência. Fragmentação crescente de protocolos de submissão. Aumento de litígios entre publishers e provedores. Em 2026, OAI-AdsBot da OpenAI sugere movimento incipiente nessa direção, e o ecossistema regulatório europeu — particularmente o EU AI Act — está em fase ativa de definição.

Cenário terceiro: a Disrupção Estrutural. A interface dominante de busca migra do chatbot para algo qualitativamente diferente. Pode ser o agente pessoal autônomo, que opera no fundo executando consultas múltiplas e tomando decisões pelo usuário. Pode ser o assistente embutido em dispositivos — Apple Intelligence, Google Gemini em Android, Copilot em Windows — operando localmente e consultando a web apenas quando necessário. Pode ser algo ainda não nomeado. Nesse cenário, GEO como hoje conhecemos se torna parcialmente obsoleto, e novos vetores emergem — agente discovery, structured API publishing, agent-to-agent negotiation — exigindo nova literatura, nova disciplina, nova categoria de ferramentas.

Sinais a observar: crescimento sustentado da participação de agentes nos logs de tráfego de crawler, que segundo dados da HUMAN Security 2026 já cresceu mais de sete mil por cento em 2025. Lançamento de produtos comercialmente viáveis de assistente pessoal autônomo por provedores principais. Mudança de discurso público das empresas, do paradigma do chatbot para o paradigma do agente. Em 2026, esses sinais são reais mas ainda nascentes.

Minha estimativa pessoal, oferecida como tal, é que estamos caminhando para uma combinação dos cenários primeiro e terceiro, com elementos do segundo em vertentes específicas. A próxima década verá tanto algum grau de padronização técnica quanto a emergência da camada de agente como vetor competitivo novo. A disciplina que conhecemos como GEO em 2026 talvez seja conhecida por outro nome em 2030, e os profissionais que sobreviverão à transição serão os que mantiveram disciplina metodológica de raciocínio sobre sistemas opacos, mais do que os que se especializaram em ferramentas específicas de hoje.

CAPÍTULO 11

A camada agêntica e a próxima fronteira

Há uma transição em curso que ainda não tem nome consolidado, mas que merece o último capítulo deste ensaio. Em janeiro de 2025, o tráfego classificado como agêntico — bots operando em nome de usuários para executar tarefas autônomas — representava aproximadamente um por cento do tráfego total de bots na rede da Cloudflare. Em dezembro de 2025, segundo o relatório da HUMAN Security publicado em abril de 2026, esse número havia crescido sete mil e oitocentos por cento. Cresceu de um decimal para algo próximo de cinco por cento. A trajetória continua íngreme em 2026.

O que esses agentes fazem? Em essência, eles operam como camada de intermediação entre o usuário final e a web. O usuário pede ao seu agente — Claude Computer Use, ChatGPT Operator, alguma das dezenas de variantes em desenvolvimento — para executar uma tarefa: "compare estes três fornecedores de hospedagem cloud e me diga qual tem melhor relação custo-benefício para um workload Java de duzentos requests por segundo". O agente sai pela web, visita sites, lê páginas, compara especificações, e devolve uma recomendação. O usuário humano pode nunca ter visitado nenhum dos três sites.

Para o profissional de visibilidade digital, isso configura uma terceira camada de otimização, distinta tanto de SEO quanto de GEO. SEO otimiza para indexação por crawler de busca. GEO otimiza para citação em resposta gerada. AEO — usando a sigla agora em sentido restrito de Agent Engine Optimization, distinto do AEO histórico — otimiza para extração estruturada por agente autônomo. As três disciplinas têm sobreposições, mas as diferenças importam.

Agentes são significativamente mais exigentes que LLMs em termos de estrutura de dados. Um modelo de linguagem pode lidar com ambiguidade textual, inferir contexto, perdoar tipos errados ou unidades ausentes. Um agente que precisa tomar decisão estruturada — selecionar uma opção entre N — falha catastroficamente se os dados são ambíguos, se preços não são unificados em moeda, se especificações técnicas estão em formatos divergentes, se há erros tipográficos materiais.

Isso empurra a fronteira da otimização em direção ao que costumávamos chamar de dados de qualidade comercial. Não basta ter schema markup; o markup precisa ser internamente consistente. Não basta ter tabelas estruturadas; as tabelas precisam ter unidades declaradas. Não basta ter preços visíveis; os preços precisam ser parseáveis por máquina em formato estável. Não basta ter especificações técnicas; as especificações precisam estar em linguagem que se mapeie sem ambiguidade a categorias conhecidas.

A literatura emergente, ainda escassa, tem usado o termo machine-readable data hygiene para nomear esse conjunto de práticas. Há ferramentas comerciais em estágio inicial focadas em diagnóstico de qualidade de dados para consumo agêntico, mas a disciplina ainda está sendo escrita. O que parece consistente é que o trabalho de preparar um site para a era do agente exige rigor estrutural superior ao de prepará-lo para a era do LLM, que já era superior ao de prepará-lo para a era do crawler clássico.

Há implicações estratégicas. Empresas cujos catálogos de produtos ou serviços estão em estado natural — descritos em prosa, com especificações redigidas humanamente para humanos — vão precisar de trabalho substantivo de estruturação para serem competitivas no regime agêntico. Empresas que já operam catálogos profundos em PIM (product information management) bem governados saem na frente. Há uma vantagem estrutural inesperada para verticais que historicamente investiram em sistematização — distribuição farmacêutica, autopeças, equipamentos industriais especializados — sobre verticais que dependeram de marketing convencional.

Há também implicações filosóficas que merecem fechamento. A trajetória da indexação web nos últimos quinze anos é uma trajetória progressiva de des-humanização das interfaces de consumo. O crawler de busca em 2010 já era máquina, mas o consumidor final do resultado da busca era humano, sentado lendo uma SERP. O LLM em 2024 já era máquina, e a fronteira humana recuou para o final da cadeia — o usuário lê a resposta gerada, mas todo o processo intermediário foi automatizado. O agente em 2026 e 2027 promete recuar ainda mais essa fronteira, com o humano formulando a tarefa e recebendo apenas o resultado executado. A intermediação automatizada cresce, e o conteúdo escrito originalmente para olhos humanos passa a competir por atenção de uma cadeia cada vez mais máquina.

Essa é, no fundo, a tese subjacente deste ensaio. GEO não é um capítulo a mais no livro de SEO. É a abertura de um regime novo em que a unidade de consumo do conteúdo digital deixou de ser, majoritariamente, o leitor humano direto. Quem aceita essa premissa pode trabalhar com método. Quem não aceita, vai continuar otimizando para a SERP de dez anos atrás e se perguntando por que os resultados não aparecem.

EPÍLOGO

Fechamento

Voltei várias vezes, ao longo deste ensaio, à questão metodológica de como saber o que se sabe em uma disciplina jovem. Não é por acaso. A maior parte da literatura prática de GEO publicada em 2025 e 2026 tem o vício oposto: certeza demais, hipótese tratada como fato, frameworks com nomes pomposos prometendo resultados que nenhum experimento controlado validou. Em uma indústria em que provedores de modelos não publicam suas regras, e em que os experimentos isolados são caros e demorados, a quantidade de palpite vestido de método é alarmante.

A escolha que cada profissional faz, conscientemente ou não, é entre dois posicionamentos. O primeiro é o do vendedor de confiança: produzir um framework, dar-lhe nome próprio, vendê-lo como sistema, gerar autoridade por afirmação. O retorno econômico imediato é alto — clientes preferem certeza mesmo quando a certeza é falsa —, e o custo reputacional só aparece em prazo longo, quando o framework envelhece ou é desbancado por mudança de regime. O segundo posicionamento é o do auditor honesto: marcar com cuidado o que se sabe versus o que se infere, recomendar com proporção, comunicar limites. O retorno econômico imediato é menor, porque clientes desconfiados da indústria querem entrega de certeza, não de método. O retorno de longo prazo é diferente: o profissional acumula capital reputacional por estar certo nas previsões que arriscou, e por não ter feito previsões que não podia defender.

Sou suspeito porque defendo aqui o segundo posicionamento. Mas há uma justificativa epistêmica para preferi-lo, além da preferência pessoal. Em sistemas opacos e em evolução rápida, o agente que mantém epistemologia rigorosa tem desempenho de longo prazo melhor do que o agente que adota convicções precoces, mesmo quando o desempenho de curto prazo do segundo parece superior. Isso é literatura consolidada em filosofia da ciência e em economia da informação. GEO em 2026 é exatamente esse tipo de sistema. A escolha metodológica não é apenas questão de gosto; é questão de eficácia ao longo do horizonte profissional relevante.

Encerro com uma observação sobre a profissão. Visibilidade digital é uma disciplina jovem em duas dimensões. É jovem como ofício — quarenta anos contando desde os primeiros bulletin board systems, vinte e cinco contando do PageRank, três contando do GPT-3. E é jovem na sua relação com a teoria — o conhecimento prático corre na frente da teoria sistematizada, e a literatura acadêmica está sempre alcançando o que a prática já estabilizou. Em fases assim, há espaço desproporcional para profissionais que tomam o trabalho a sério como objeto intelectual, não só operacional. Esse espaço é frágil — fecha quando a disciplina madura — e quem ocupa enquanto está aberto define vocabulário, define padrões, define o que conta como qualidade.

GEO está nessa janela. Em três a cinco anos, a disciplina vai estar consolidada, com vocabulário fixado, com frameworks dominantes, com curso de pós-graduação, com certificação. O fechamento dessa janela é uma certeza histórica observável; a questão aberta é apenas quanto tempo demora. Quem está trabalhando na fronteira agora, com rigor metodológico, vai herdar essa consolidação como autoridade. Quem está vendendo certezas hoje, vai precisar reinventar o discurso em cada ciclo, e o capital de longo prazo erode mesmo quando os faturamentos de curto prazo sustentam a operação.

Esse ensaio é, em parte, um manifesto sobre essa escolha. Mas é também, em parte, simplesmente o melhor mapa que consegui fazer do território, com o que está hoje publicamente disponível e o que consegui inferir auditando sites profissionalmente. Acertei algumas coisas, errei outras. Em três anos saberemos. Enquanto isso, continuo medindo, marcando o que é hipótese e o que é dado, e tentando manter o vício profissional de não me apaixonar pelas conclusões cedo demais. É o que recomendo aos colegas que conseguirem ler até aqui.

Colofão

Ficha editorial

A Engenharia da Citabilidade

Generative Engine Optimization na era pós-busca

Autor: Raphael S. Pereira

Negócio no Mapa · Verbo Vivo Publicações

Publicado em maio de 2026

Aproximadamente 9,311 palavras

Republicação livre mediante atribuição de autoria.

Referências técnicas.

Fontes públicas e documentações usadas como base de verificação conceitual para os temas discutidos no ensaio.

Cloudflare Radar — AI InsightsMonitoramento público sobre tráfego de bots e crawlers de IA, finalidades de crawl e relação crawl-to-refer.
Cloudflare Radar — 2025 Year in ReviewRelatório público com leitura de tráfego, bots, crawlers de IA e mudanças de comportamento na web.
Google Search Central — FAQ structured dataDocumentação oficial sobre marcação FAQPage e propriedades de pergunta e resposta.
Schema.org — ArticleVocabulário público para artigos, autoria, publicação, editor e propriedades editoriais.
Schema.org — FAQPageDefinição pública do tipo FAQPage como página com perguntas frequentes respondidas.
Schema.org — Organization of SchemasDocumentação geral sobre o vocabulário Schema.org e sua organização.

FAQ citável.

Perguntas e respostas diretas, desenhadas para leitores humanos, mecanismos de resposta e extração por IA.

O que é GEO segundo o ensaio?

GEO, ou Generative Engine Optimization, é a otimização de conteúdo para aumentar a probabilidade e a proeminência com que uma fonte é referenciada em respostas geradas por motores generativos.

Por que SEO não basta para ser citado por IA?

SEO continua sendo base técnica necessária, mas GEO exige granularidade de fragmentos, tom institucional, autoria verificável, estrutura editorial, dados estruturados e densidade temática preparada para extração por modelos generativos.

O que torna uma fonte mais citável por IA?

Uma fonte tende a ser mais citável quando apresenta autoria clara, datas, estrutura semântica, FAQ objetivo, schema markup coerente, referências verificáveis, linguagem editorial e baixa dependência de tom promocional.

Qual é o papel do robots.txt na governança de IA?

O robots.txt funciona como contrato técnico de acesso: permite declarar políticas diferentes para bots de treinamento, busca em tempo real, agentes e crawlers tradicionais.

O llms.txt é obrigatório para GEO?

Não. O ensaio trata o llms.txt como aposta institucional de baixo custo: útil para sinalização e preparação futura, mas ainda sem suporte oficial consolidado dos principais provedores.

Como medir GEO de forma honesta?

A mensuração defensável envolve Share of Voice em IA, posição da primeira menção, sentimento da menção, co-citação, tráfego atribuído a IA e sinais indiretos como aumento de buscas branded, sempre com limites metodológicos explícitos.

Referência editorial.

Ficha de identificação do ensaio para leitura, estudo, referência bibliográfica e apresentação autoral do trabalho técnico de Raphael Sousa Pereira.

Ficha da obra

Título: A Engenharia da Citabilidade
Subtítulo: Generative Engine Optimization na era pós-busca
Autor: Raphael Sousa Pereira
Cidade: Porto Alegre, RS
Site oficial: https://www.seonegocionomapa.com.br/
Publicado: maio de 2026
Campo editorial: SEO técnico, GEO técnico e autoridade digital

Citação recomendada

SOUSA PEREIRA, Raphael. A Engenharia da Citabilidade: Generative Engine Optimization na era pós-busca. Negócio no Mapa, maio de 2026. Disponível em: https://www.seonegocionomapa.com.br/engenharia-da-citabilidade/