En el mundo de la prevención y la medicina personalizada,
es clave la capacidad de prever con mucho tiempo de antelación, incluso
décadas, la posibilidad de que una enfermedad aparezca, para atajar los
procesos que la producirían mucho antes de que haya empezado a hacer daño. Eso
es lo que parece que se puede lograr gracias a la inteligencia artificial,
según un estudio publicado hoy en la revista Nature.
A lo largo de la vida, empezamos estando bien con mayor
frecuencia, de vez en cuando pasamos algún día enfermos, y con el paso del
tiempo empiezan a aparecer las dolencias crónicas. Estos patrones afectan de
una forma distinta a cada individuo, dependiendo de la herencia, el estilo de
vida o su estatus socioeconómico. Para entender bien la salud de una persona y
valorar los riesgos que la acechan en el futuro, no basta con tomar los
diagnósticos aislados que recibió a lo largo de su vida; es necesario entender
la evolución de cada persona, conocer las enfermedades que sufrió para saber
cómo se influyen entre sí y promover cambios de vida específicos o recomendar
pruebas diagnósticas que vigilen dolencias concretas con mayor probabilidad de
aparecer.
Hoy, un grupo de investigadores del Instituto Europeo de
Bioinformática, el DKFZ (Centro Alemán de Investigación del Cáncer) y varias
instituciones danesas propone aplicar la misma tecnología que da vida a los
grandes modelos de lenguaje –como ChatGPT– para aprender y predecir la historia
natural de más de mil enfermedades al mismo tiempo. El modelo resultante,
bautizado como Delphi-2M, es capaz de identificar patrones de enfermedad a
partir de historiales médicos, factores de estilo de vida y condiciones previas
de salud.
“El hallazgo más inesperado fue que el modelo puede
predecir más de 1.000 enfermedades. Habríamos esperado que funcionara con
algunas, pero que fallara con muchas otras. Esto muestra lo interconectadas que
están muchas enfermedades y resalta la necesidad de investigar los mecanismos
subyacentes que las conectan”, explica sobre sus resultados Moritz Gerstung,
director de la División de Inteligencia Artificial en Oncología del DKFZ y
coautor del estudio.
El algoritmo ha sido entrenado con datos de 400.000
personas del Reino Unido y validado con registros de casi dos millones de
pacientes en Dinamarca, y es capaz de proyectar trayectorias de salud, tanto a
nivel poblacional como individual, de hasta dos décadas.
Como sucede con las predicciones meteorológicas, este
modelo no ofrece certezas, sino probabilidades. Más que adivinar exactamente
qué le ocurrirá a una persona concreta en un momento determinado, calcula las
probabilidades de que sufra ciertas enfermedades en un periodo concreto. Como
sucede con el tiempo, las predicciones a corto plazo son más fiables que las
que intentan predecir un futuro más lejano. Cuando se calculan si alguien
sufrirá un infarto en los próximos 10 años, el modelo acierta alrededor de
siete de cada diez casos. Cuando el periodo temporal se amplía a las dos
décadas, se queda en un 14%, algo superior al 12% que se logra sabiendo edad y
sexo.
Siguiendo con el caso del infarto, según el modelo, en la
cohorte del Biobanco del Reino Unido, los hombres de entre 60 y 65 años pueden
tener un riesgo anual de 4 de cada 10.000 hasta 1 de cada 100, dependiendo de
sus antecedentes médicos y de sus hábitos de vida. En las mujeres el riesgo
medio es menor, pero la dispersión de probabilidades es parecida. Lo más
relevante es que, al comparar las predicciones del modelo con datos reales del
biobanco que no se usaron en el entrenamiento, se comprobó que los riesgos
calculados coincidían con la incidencia observada de casos en distintos grupos
de edad y sexo. Esto demuestra que las estimaciones reflejan de forma fiel las
tendencias poblacionales reales.
Delphi-2M alcanza una precisión comparable a los mejores
modelos específicos para enfermedades como la demencia o el infarto de
miocardio, y supera a los algoritmos de predicción de mortalidad. Solo en el
caso de la diabetes, un marcador del análisis de sangre (la hemoglobina
glicosilada HbA1c) sigue siendo más fiable. Además, el estudio identificó
enfermedades que incrementan el riesgo de sufrir otras, como los trastornos
mentales o algunos tumores del aparato reproductivo femenino.
Sobre la posibilidad de que conocer con tanta antelación de
enfermedades que solo son una posibilidad nos convierta a todos en enfermos
preventivos, Gerstung cree que hacen falta más estudios para plantear cómo este
conocimiento puede beneficiar a los pacientes. Eso requeriría que las posibles
aplicaciones de la IA como asistente de la medicina “deberían probarse en
ensayos clínicos aleatorizados, en los que un grupo reciba visitas médicas con
apoyo de IA y otro grupo sin él. Tras un período de seguimiento, se evaluará si
el grupo asistido por IA obtuvo mayores beneficios en comparación con las
consultas tradicionales”, apunta. “Esto también puede incluir evaluaciones subjetivas
del bienestar de las personas para valorar los efectos emocionales de conocer o
no sus riesgos”, concluye.

En el apartado de posibles riesgos de una herramienta tan
potente de predicción de la salud, como la discriminación por parte de las
aseguradoras de pacientes con riesgos que les hacen poco interesantes como
clientes, Guillermo Lazcoz, miembro del Comité de Ética de la Investigación del
Instituto de Salud Carlos III, considera que la aplicación de la IA al
procesado de grandes bases de datos de salud añade “una capa más de riesgos a
los que ya conocíamos”, como que estos datos acaben en manos de un banco que
los utilice para saber, antes de conceder un crédito, si el cliente es propenso
a contraer un tipo de cáncer o tener un infarto.
“La IA puede identificar a una persona a partir de datos
que se suponían anónimos, lo que exige nuevas medidas de protección”, continúa
Lazcoz. Para aplicar estas medidas, “en Europa se están desarrollando espacios
seguros del tratamiento de datos, donde el dato no viaja y el acceso a terceros
está limitado en el tiempo y a un propósito”, explica. Por último, advierte de
que no es lo mismo hablar de organizaciones como el Biobanco del Reino Unido,
utilizado en el estudio que hoy publica Nature, que cuenta con estrictos
controles, que de empresas como 23andMe, en la que uno puede analizar su ADN
para conocer su linaje y que ya se ha visto envuelta en escándalos por
problemas con la protección de datos.
Mikel Recuero, investigador de la Universidad del País
Vasco (EHU) y abogado especializado en protección de datos, coincide en que, al
menos en el ámbito europeo, hay muchas capas de control que buscan impedir el
uso indebido de datos biomédicos.
“El acceso a
biobancos ya implica un primer filtro ético, porque los investigadores deben
justificar la finalidad científica de su solicitud y no pueden emplear muestras
con fines espurios”, señala. “A ello se suman los controles de protección de
datos: si la información es identificable, la normativa obliga a restringir su
uso a los propósitos autorizados, evitando, por ejemplo, las aplicaciones en
seguros o banca”, añade.
En este sentido, “el nuevo reglamento del espacio europeo
de datos de salud refuerza esta lógica al prohibir expresamente decisiones
comerciales —como la modificación de primas de un seguro— basadas en
información genética”, asevera. “Aunque los riesgos nunca desaparecen del todo,
existen mecanismos sucesivos (éticos, regulatorios, jurídicos) que actúan de
forma preventiva, limitando las posibilidades de discriminación y obligando a
acreditar un beneficio social en cada proyecto que vaya a usar estos datos”,
concluye.
Los modelos como GPT-4 o Gemini aprenden el lenguaje como
una secuencia de palabras. Predicen la siguiente palabra en función del
contexto y los investigadores vieron una analogía con la salud. El historial
médico de una persona también puede entenderse como una secuencia de eventos
–diagnósticos, factores de riesgo, hábitos de vida– que siguen un orden
temporal para hacer predicciones.
De momento, el modelo se debe mejorar para tener utilidad
para cuidar la salud de pacientes reales, pero ya es una herramienta útil para
entender mejor cómo se desarrollan las enfermedades y cómo progresan, o evaluar
los efectos del estilo de vida o las enfermedades pasadas influye en el riesgo
de enfermedades futuras.
Uno de los aspectos más innovadores del trabajo es la
capacidad de Delphi para generar datos de salud sintéticos. A partir de
información parcial, el modelo puede imaginar trayectorias completas que mantienen
las mismas propiedades estadísticas que los datos reales, pero sin
corresponderse con ninguna persona en particular. Esto protege la privacidad de
los pacientes, ya que los datos no pueden vincularse a individuos reales y
permiten entrenar otros modelos de IA sin necesidad de acceder a datos clínicos
sensibles. Así se podría, por ejemplo, calcular qué le puede pasar a la salud
de la población si se incrementa la obesidad en un 5%.
Ahora, ya hay algoritmos que predicen el riesgo de sufrir
algunas enfermedades, como los problemas cardiacos o el cáncer de mama, pero
ese enfoque no abarca la complejidad real de la salud humana, en la que, muchas
veces, conviven múltiples enfermedades que se condicionan entre ellas. En unas
sociedades cada vez más envejecidas, será crítica la capacidad para prever la
carga de muchas enfermedades y diseñar políticas e inversiones para intentar
prevenirlas y estar preparados cuando lleguen.
TEL/El País