User-agent: * Allow: / Sitemap: https://www.davisa.es/sitemap.xml # No indexar utilidades internas ni artefactos de build Disallow: /admin/ Disallow: /api/ Disallow: /_astro/ # URLs spam heredadas del hack al WP legacy (mayo 2026, antes de la migración). # Devuelven 410 Gone en vercel.json y aquí se bloquean para que ningún bot # vuelva a rastrearlas. Cuando GSC haya retirado todas las URLs históricas # del índice (ver docs/SEO-NEGATIVE-CLEANUP.md) se podrá revisar si retirar # esta regla. Disallow: /page/ # ============================================================================ # POLÍTICA EXPLÍCITA DE BOTS DE IA — Davisa Informática # ============================================================================ # Decisión 2026-05-31: Davisa es B2B nicho (Business Central + extensiones). # El valor SEO de aparecer recomendado en ChatGPT, Perplexity, Claude, # Gemini, Google AI Overviews supera con creces el "coste" de que esos # crawlers entrenen con nuestro contenido. # # Por tanto declaramos EXPLÍCITAMENTE allow a los crawlers que pueden: # (a) Citarnos en respuestas en tiempo real (search/answer bots), o # (b) Incluir nuestro contenido en futuros modelos que recomendarán # nuestros productos cuando alguien pregunte por GMAO / ERP / BC. # # Bloqueamos solo los que no aportan a B2B BC España y solo extraen valor: # scrapers SEO de competidores, crawlers de redes irrelevantes para B2B. # # Este archivo es complementario al Firewall de Vercel (defense in depth): # robots.txt = honor system; Firewall = enforcement de los bots maliciosos. # ============================================================================ # ── Search/Answer crawlers (citan en tiempo real, traen tráfico directo) ── User-agent: PerplexityBot Allow: / User-agent: Perplexity-User Allow: / User-agent: OAI-SearchBot Allow: / User-agent: ChatGPT-User Allow: / User-agent: Claude-Web Allow: / User-agent: Claude-User Allow: / User-agent: anthropic-ai Allow: / User-agent: Applebot Allow: / User-agent: Applebot-Extended Allow: / User-agent: Google-Extended Allow: / User-agent: DuckAssistBot Allow: / User-agent: YouBot Allow: / User-agent: meta-externalagent Allow: / # ── Training crawlers (alimentan modelos futuros — nos interesa estar) ── User-agent: GPTBot Allow: / User-agent: ClaudeBot Allow: / User-agent: cohere-ai Allow: / User-agent: cohere-training-data-crawler Allow: / # ── BLOQUEADOS: no aportan a B2B BC España, solo consumen ancho de banda ── # Estos respetan robots.txt. Los que no lo respeten serán filtrados por las # reglas Custom del Firewall de Vercel (Bytespider, AhrefsBot, SemrushBot, # MJ12Bot, DotBot) — gestionar desde: # https://vercel.com/lgomez-9898s-projects/davisa-web/firewall/rules User-agent: Bytespider Disallow: / User-agent: ImagesiftBot Disallow: / User-agent: AhrefsBot Disallow: / User-agent: SemrushBot Disallow: / User-agent: MJ12bot Disallow: / User-agent: DotBot Disallow: / User-agent: PetalBot Disallow: / User-agent: CCBot Disallow: / # Nota CCBot: lo bloqueamos porque Common Crawl es input "barato" para # muchos modelos secundarios y no aporta valor SEO directo. Los modelos # top (GPT/Claude/Gemini) tienen sus propios crawlers (GPTBot/ClaudeBot/ # Google-Extended) que SÍ permitimos arriba.