Cómo la inteligencia artificial está transformando la medicina: “La analítica de datos será la clave de la salud personalizada del futuro”

La catedrática de la Universidad Carlos III de Madrid y directora del Instituto UC3M-Santander Big Data (IBiDat), Rosa Elvira Lillo, analiza cómo el big data y la inteligencia artificial están revolucionando la medicina moderna, desde el diagnóstico hasta la prevención, y advierte de los retos éticos, técnicos y económicos que aún debe superar el sistema sanitario.

Rosa Elvira Lillo, catedrática de la Universidad Carlos III de Madrid y directora del Instituto UC3M-Santander Big Data (IBiDat)
photo_camera Rosa Elvira Lillo, catedrática de la Universidad Carlos III de Madrid y directora del Instituto UC3M-Santander Big Data (IBiDat)

La inteligencia artificial ya no es una promesa, sino una herramienta que está cambiando la forma en que se diagnostican enfermedades, se diseñan tratamientos y se planifica la salud pública. Así lo explica Rosa Elvira Lillo, una de las mayores expertas españolas en análisis de datos aplicados a la medicina.

Catedrática de Estadística e Investigación Operativa en la Universidad Carlos III de Madrid, Lillo dirige el Instituto UC3M-Santander de Big Data (IBiDat), un referente en investigación avanzada que colabora con hospitales, farmacéuticas y empresas de múltiples sectores. Desde su participación en Madrid Connect 2025, defiende que la medicina del futuro será predictiva, preventiva, participativa y personalizada, pero también recuerda que para llegar a ella será necesario garantizar infraestructuras adecuadas, estandarización de datos y una inteligencia artificial ética e interpretable.

Profesora Lillo, dirige usted el Instituto UC3M-Santander Big Data. ¿En qué consiste exactamente su labor?

Dirijo desde hace casi siete años el UC3M-Santander Big Data Institute (IBiDat), un centro dedicado al análisis masivo de datos, la analítica compleja y la inteligencia artificial. Nos especializamos en lo que llamamos proyectos boutique, muy personalizados, en los que ayudamos a empresas a resolver problemas disruptivos que requieren conocimiento avanzado. No somos un gran centro de producción con cientos de técnicos, sino un instituto con mano de obra altamente especializada, formada por investigadores y doctores que al estar en frontera del conocimiento pueden/podemos aportar gran valor a las empresas e insituciones con las que colaboramos.

Desarrollamos proyectos en múltiples ámbitos: desde la banca y las finanzas —nuestros orígenes están ligados al patrocinio del Banco Santander— hasta el sector sanitario, farmacéutico, industrial o de marketing digital. Por ejemplo, mantenemos una línea de investigación con el Hospital Gregorio Marañón centrada en oncología y cáncer de mama, y colaboramos con otras instituciones en el desarrollo de metodologías aplicadas a la salud.

“La capacidad actual de cálculo permite analizar datos heterogéneos y tomar decisiones más inteligentes”

Su mesa en Madrid Connect trató sobre ciencia de datos y medicina. ¿Qué papel juega hoy la analítica de datos en la salud?

Estamos viviendo una revolución sin precedentes impulsada por dos factores: la enorme capacidad de almacenar información y el desarrollo de nuevas metodologías potenciadas por la inteligencia artificial. Esto nos permite extraer conclusiones y tomar decisiones basadas en datos procedentes de fuentes muy diversas.

Pensemos en una historia clínica: incluye analíticas cuantitativas, datos sensorizados de escáneres o electrocardiogramas, imágenes médicas y también comentarios de los facultativos. Todo ese conjunto crea una mezcla de datos heterogéneos que antes era casi imposible analizar. Hoy, gracias a la potencia de cálculo, la analítica avanzada que viene de metodologías estadísticas y a lo los nuevos algoritmos, podemos detectar patrones, anticipar enfermedades y optimizar tratamientos.

La analítica de datos ya está ayudando en cuatro grandes áreas: el diagnóstico, la evaluación del riesgo de morbilidad o mortalidad, la predicción y vigilancia de brotes epidemiológicos —como vimos en la pandemia— y la planificación sanitaria y reducción de costes, especialmente a través de políticas preventivas.

“La medicina del futuro será predictiva, preventiva, participativa y personalizada”

¿Estamos entonces ante una nueva forma de entender la medicina?

Sin duda. Todo esto nos conduce a la llamada medicina de las cuatro P: prevención, predicción, participación y personalización. Cada una de estas dimensiones depende de los datos, y por tanto, de su análisis y de la ayuda en la toma de decisiones que estos datos sugieren.

Hoy sabemos que las enfermedades no se manifiestan igual en todas las personas. La inteligencia artificial ha revelado una gran heterogeneidad en los procesos fisiopatológicos, y eso ha impulsado la medicina personalizada. El objetivo es ajustar los tratamientos a las características individuales de cada paciente, reduciendo efectos adversos y aumentando la eficacia.

Un ejemplo claro es IBM Watson Health, pionero en el uso del bBg data y la IA para crear bases de datos médicas masivas que permiten identificar patrones y diseñar tratamientos más específicos. Otro caso es el de DeepMind, capaz de diagnosticar enfermedades oculares como la retinopatía diabética analizando imágenes de la retina.

Estos avances permiten anticiparse a los problemas de salud y mejorar la prevención, que es, en definitiva, la base de un sistema sanitario más eficiente.

¿Qué papel juegan los datos genéticos en esta transformación?

Los llamados datos ómicos —es decir, genéticos— son yun tipo de datos que está generando muchos retos tanto desde un punto de vista biológico como desde el ámbito del análisis de datos. Constituyen una de las fronteras más apasionantes y exigentes Hasta hace poco, realizar un mapa genético era muy caro, pero los costes de secuenciación han bajado notablemente. Aun así, sigue habiendo tres grandes retos para que se puedan gestionar eficientemente:

Primero, la infraestructura: el genoma de una sola persona puede ocupar entre 100 y 200 gigabytes, y la mayoría de hospitales y centros de investigación no tienen capacidad suficiente de almacenamiento ni procesado. Haría falta una red de infraestructuras centralizadas o federadas de alto rendimiento, accesible para todos los centros sanitarios.

Segundo, la falta de estandarización. En España, la información médica está fragmentada por comunidades autónomas e incluso por hospitales, lo que impide comparar datos o integrarlos en una historia clínica unificada. Esto ya lo vivimos durante la pandemia con las diferencias en la definición de “caso COVID”. En nuestro proyecto CoronaSurveys, creamos una metodología homogénea de medición que permitió comparar países con datos consistentes.

Y tercero, la sostenibilidad económica. Muchos proyectos de investigación en salud dependen de financiaciones temporales, y cuando se interrumpen, se pierde continuidad. Además, mantener el software, los equipos y el procesamiento de grandes volúmenes de datos requiere una inversión constante. Sin financiación estable, el progreso se detiene.

“La IA en salud debe ser ética, justa y comprensible para los profesionales”

En sus investigaciones también aborda los riesgos y dilemas éticos de la IA en medicina.

Sí. En la Cátedra de Inteligencia Artificial que impulsamos desde el instituto (AImpulsa) trabajamos en dos temas que considero cruciales.

El primero es cómo reducir los sesgos en los algoritmos de inteligencia artificial. Ya hay muchos casos documentados de discriminación algorítmica en medicina por razones de sexo o raza. Estos sesgos pueden afectar al diagnóstico o al tratamiento, y nuestra misión como investigadoras es entender y corregir esos errores para que la IA sea realmente justa.

El segundo tema es la interpretabilidad de los modelos. En ámbitos tan sensibles como la salud o las finanzas, no basta con que un algoritmo acierte: debemos saber por qué acierta, qué variables influyen en sus predicciones y cómo lo hace. Solo así la inteligencia artificial será una herramienta fiable y transparente para los profesionales médicos.