Casi la mitad de los portales web de los medios de comunicación en España, concretamente un 46% de las cerca de 150 cabeceras analizadas, impone ya algún tipo de restricción de acceso a sus contenidos a los rastreadores de las principales compañías de Inteligencia Artificial. Por el contrario, el 52% restante opta por dejar vía libre a estos algoritmos. Así lo desvela un estudio realizado por la consultora de marketing e IA Vipnet360 a través de su herramienta especializada AIBrandPulse360.
La auditoría, basada en el análisis técnico del funcionamiento de los archivos robots.txt, ha evaluado el comportamiento de diarios de información generalista, económica, deportiva, regional, así como portales de radio, televisión y cabeceras sectoriales. En total se han examinado 10 agentes de usuario diferentes, divididos entre bots destinados al entrenamiento de modelos lingüísticos y bots de agente o búsqueda de información en tiempo real.
Bloqueos selectivos: el entrenamiento de modelos, en el punto de mira
El informe revela que las restricciones aplicadas por los editores no son absolutas, sino que se ejecutan de forma selectiva tanto por la empresa que gestiona la IA como por la función del propio bot. En este sentido, la hostilidad de los medios es notablemente mayor hacia aquellos rastreadores que recopilan contenidos masivos para entrenar los modelos de lenguaje. Por el contrario, los bots de agente, aquellos que solo entran a una web cuando un usuario lo solicita expresamente en un chat, se bloquean tres veces menos (un 10,6% frente al 37,2%).
A nivel individual, ClaudeBot, propiedad de Anthropic, se corona como el rastreador más bloqueado al encontrarse las puertas cerradas en el 45,9% de los medios digitales. Le siguen muy de cerca GPTBot de OpenAI (43,2%), PerplexityBot (32,2%) y Google-Extended (27,4%), el comando vinculado a los modelos generativos de Google.
Las televisiones abren sus puertas; la prensa local e independiente echa el cierre
El estudio de Vipnet360 dibuja una clara línea de división según la tipología editorial de cada medio. Dentro del 52% de plataformas que se muestran totalmente "amables" y no aplican ningún veto figuran las grandes cadenas de televisión (RTVE, Antena 3, La Sexta, Telecinco y Cuatro), las agencias de noticias (Efe, Europa Press) y los portales especializados en tecnología.
En el extremo opuesto, la prensa local y regional destaca como el bloque más restrictivo del ecosistema, con un promedio de 3,75 bots bloqueados por cabecera. Una tendencia que también arrastra a la prensa deportiva (3,67 de media) y a los portales de turismo.
Los medios nativos e independientes, sin embargo, se sitúan a una gran distancia regulatoria, anotando un índice medio de bloqueo de apenas un 1,1.
El grupo editorial como factor decisivo
Más allá del tipo de contenido, pertenecer a un gran grupo de comunicación unifica las políticas de restricción tecnológica. El informe sitúa a Vocento (5,8 bloqueos de media en 14 cabeceras), Unidad Editorial (5,8 en 4 cabeceras) y Prensa Ibérica (5,6 de promedio en 15 cabeceras) como las corporaciones más herméticas ante el avance de las IA.
La gran excepción a esta uniformidad corporativa la protagoniza el Grupo PRISA, que aplica políticas dispares según el medio: mientras que en El País permite el acceso a OpenAI, Perplexity y Google pero bloquea a Claude, en la Cadena SER veta tanto a Claude como a Perplexity. Por su parte, el diario económico Cinco Días mantiene una política de apertura total y no restringe a ninguno de los 10 rastreadores analizados.