Whitepaper

Anatomía de una Auditoría GEO

Whitepaper técnico que desglosa los 7 indicadores clave que analizamos en cada auditoría GEO, basado en datos propietarios de más de 500 sitios.

+500 sitios analizados|7 indicadores clave

Resumen Ejecutivo

Después de analizar más de 500 sitios web, hemos identificado los 7 indicadores clave que determinan si un sitio será citado por modelos de IA como ChatGPT, Claude, Gemini y Perplexity. Este whitepaper desglosa cada indicador con datos reales de nuestras auditorías.

Hallazgo principal: Los sitios con una proporción semántica superior a 0.85 tienen 3.2x más probabilidades de ser citados que aquellos por debajo de 0.60.

Los 7 Indicadores de una Auditoría GEO

Nuestra metodología evalúa 7 dimensiones técnicas que impactan directamente en la visibilidad ante sistemas de IA:

1. Estructura de Entidades

Analiza el uso de HTML semántico, Schema.org y jerarquía de encabezados.

Métricas clave:

  • Proporción semántica: Porcentaje de texto dentro de elementos semánticos vs total
  • Cantidad de encabezados: Número de encabezados estructurales
  • Saltos de jerarquía: Saltos en la jerarquía de encabezados (h1→h3 sin h2)
  • Bloques JSON-LD: Cantidad de bloques de datos estructurados

Valores óptimos de referencia:

MétricaValor ÓptimoPromedio en 500 sitios
Proporción semántica> 0.850.67
Saltos de jerarquía02.3
Bloques JSON-LD≥ 20.8

Ejemplo de sitio optimizado:

Un sitio bien estructurado muestra una proporción semántica de 0.87, con 14 encabezados sin saltos de jerarquía, y 2 bloques de datos estructurados (FAQPage y Organization).

2. Extractibilidad de Contenido

Evalúa qué tan fácil es para sistemas de IA extraer contenido significativo.

Métricas clave:

  • Ratio texto/código: Proporción de texto vs código HTML
  • Palabras extraíbles: Palabras que pueden extraerse del contenido principal
  • Bloqueo de contenido: Indicadores de contenido restringido
  • Contenedor semántico: Presencia de elemento <main> o <article>

Problema común detectado: El 34% de los sitios analizados tienen indicadores de "content gating" que limitan la extracción de contenido por sistemas de IA.

Valores óptimos:

MétricaValor ÓptimoImpacto
Ratio texto/código> 0.05Alto
Palabras extraíbles> 300Medio
Bloqueo de contenidoNoCrítico

3. Knowledge Graph (Grafos de Conocimiento)

Evalúa señales que establecen la identidad de marca en grafos de conocimiento.

Métricas clave:

  • Bloques Organization: Cantidad de schemas Organization
  • Enlaces sameAs: Enlaces a perfiles verificables (LinkedIn, Twitter)
  • Logos identificables: Presencia de logos
  • Nombre del sitio: Open Graph site name configurado

Hallazgo: Los sitios con 3+ enlaces a perfiles sociales tienen 2.1x más probabilidades de ser reconocidos como fuentes autoritativas.

4. Optimización RAG

Evalúa la calidad de segmentación del contenido para sistemas RAG.

Métricas clave:

  • Palabras por sección: Promedio de palabras por encabezado
  • Densidad de entidades: Proporción de entidades nombradas
  • Cantidad de párrafos: Número de párrafos
  • Tokens capitalizados: Palabras capitalizadas (posibles entidades)

Valores óptimos para RAG:

MétricaValor ÓptimoRazonamiento
Palabras por sección20-40Chunks manejables para embedding
Densidad de entidades0.10-0.20Suficientes entidades sin saturar
Párrafos10-25Buena segmentación

Ejemplo optimizado:

Un contenido bien segmentado tiene aproximadamente 27 palabras por sección, densidad de entidades de 0.15, y 17 párrafos bien estructurados.

5. Gobernanza de Robots

Analiza permisos de acceso para bots de IA en robots.txt.

Bots críticos evaluados:

BotPropietarioImpacto
GPTBotOpenAICrítico
ChatGPT-UserOpenAICrítico
ClaudeBotAnthropicCrítico
Google-ExtendedGoogleCrítico
PerplexityBotPerplexityAlto
Applebot-ExtendedAppleAlto
CCBotCommon CrawlMedio
BingbotMicrosoftMedio

Hallazgo alarmante: El 23% de los sitios analizados bloquean al menos un bot crítico de IA sin saberlo.

Configuración óptima de robots.txt:

User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Applebot-Extended
Allow: /

User-agent: CCBot
Allow: /

User-agent: Bingbot
Allow: /

Sitemap: https://tudominio.com/sitemap.xml

6. Optimización de Snippets

Evalúa datos estructurados para featured snippets en interfaces de IA.

Métricas clave:

  • Schema FAQ: FAQPage implementado
  • Bloques FAQ: Número de secciones de preguntas frecuentes
  • Listas estructuradas: Elementos de lista organizados
  • Marcadores Q&A: Indicadores de pregunta/respuesta

Impacto del FAQ Schema: Los sitios con FAQPage schema tienen 4.7x más probabilidades de aparecer en respuestas de Perplexity.

7. Señales de Confianza

Evalúa E-E-A-T (Experiencia, Expertise, Autoridad, Confianza).

Métricas clave:

  • Atribución de autor: Identificación del autor del contenido
  • Perfil del autor: Enlaces a perfiles profesionales
  • Fechas de publicación: Indicadores de cuándo se publicó/actualizó
  • Conexión segura: Uso de HTTPS
  • Enlaces legales: Links a políticas y términos

Hallazgo crítico: El 67% de los sitios no tienen señales de fecha, lo que reduce significativamente la percepción de frescura del contenido por sistemas de IA.

Cómo se Calcula el Score Global

Cada dimensión recibe un score de 0-100. El score global es un promedio ponderado:

DimensiónPeso
Estructura de Entidades20%
Extractibilidad de Contenido15%
Knowledge Graph15%
Optimización RAG15%
Gobernanza de Robots15%
Optimización de Snippets10%
Señales de Confianza10%

Interpretación del score:

  • 90-100: Excelente - Optimizado para visibilidad en IA
  • 70-89: Bueno - Mejoras menores necesarias
  • 50-69: Regular - Oportunidades significativas de mejora
  • <50: Crítico - Requiere atención inmediata

Conclusiones

Los datos de +500 auditorías revelan que la optimización para IA no es opcional: es el nuevo estándar de visibilidad digital. Los sitios que implementan estas 7 dimensiones correctamente tienen una ventaja competitiva significativa.

Próximos pasos recomendados:

1. Audita tu sitio con nuestras 7 dimensiones

2. Prioriza correcciones en dimensiones con score < 70

3. Monitorea cambios en permisos de robots.txt

4. Implementa Schema.org (mínimo: Organization + FAQPage)

5. Asegura que todo el contenido sea extraíble sin gating