¿Y si reunimos todos los datos de salud en un mismo lugar?

La creación de un ‘Data Lake’ sanitario con todas las historias clínicas permitiría poner todos esos datos anonimizados al servicio de la investigación. El Gobierno lo ha incluido en su plan para la recuperación ‘España puede’. 40.000 médicos y 600.000 pacientes ya han dado el ‘sí, quiero’ a la iniciativa

Durante la pandemia, se ha demostrado el poder que la tecnología ha asumido a la hora de caracterizar las variantes del Sars-Cov-2, también en el diseño de las distintas vacunas... Herramientas como el big data, la inteligencia artificial o el machine learning salen en nuestro auxilio cuando más perdidos nos encontramos. Ahora tenemos la oportunidad de continuar a esa velocidad de crucero en el uso de la tecnología para mejorar la salud con la creación de lo que sería el primer Data Lake sanitario en España.

Esto se traduciría en aglutinar en un mismo contenedor todas las historias clínicas del país para ponerlas así al servicio de la investigación. “La inteligencia artificial, en concreto el machine learning y el procesamiento del lenguaje natural, son ya capaces de analizar los diferentes formatos de Historias Clínicas Electrónicas de los diferentes hospitales y centros de atención primaria, y convertir en tiempo real toda su información en conocimiento científico, para ponerlo a disposición de la comunidad médica e investigadora, sin poner en riesgo la seguridad de los datos y con pleno respeto por la privacidad de los pacientes”. Así nos lo resume el doctor Antonio Urda, vicepresidente de Hospitales en Savana.

Esta compañía creada en 2014 está especializada en el uso de la tecnología para sacar todo el valor posible a los datos sanitarios, algo que ya hace en la Red de Investigación de Savana, un ecosistema formado por más de 160 hospitales en Europa y América. Ahora, se ha propuesto liderar esta iniciativa de un Data Lake sanitario en España, para lo que ya cuenta con el apoyo del Gobierno, que lo ha incluido entre sus propuestas del Plan de Recuperación, Transformación y Resiliencia, España Puede. También se han adherido a la iniciativa más de 40.000 médicos y 600.000 pacientes, a través de la Sociedad Española de Oncología Médica, la Sociedad Española de Médicos de Atención Primaria, la de Endocrinología y Nutrición, la Sociedad de Medicina Intensiva, la Plataforma de Organizaciones de Pacientes o la Asociación Española contra el Cáncer, entre otras. Quienes quieran sumarse a la propuesta pueden hacerlo a través de la web que ha creado Savana a tal efecto.

“Pacientes, ciencia nacional y sector económico recibirán un impacto positivo directo. Por ejemplo, en cuanto a investigación, tener una fuente homogénea de datos clínicos de millones de pacientes generará un ecosistema que favorecerá un mayor número de estudios clínicos dirigidos por parte de los institutos de investigación y organismos científicos del país, permitiendo que se genere investigación de alto impacto”, explica el doctor Antonio Urda. Añade también que la iniciativa permitiría no solo a los hospitales transformar sus datos en conocimiento clínico -“sin poner en riesgo la seguridad y con pleno respeto por la privacidad de los pacientes”-, sino también guiar la toma de decisiones en salud pública a partir de la evidencia científica, eliminando la heterogeneidad de las fuentes de información.

“España se convertirá en espacio preferente para cualquier desarrollo innovador sanitario, desde fármacos a dispositivos médicos -en todas sus fases- o de nuevas metodologías de investigación basadas en el análisis de datos. Esto nos ayudará a situarnos como un país puntero en investigación científica. Por consiguiente, para el paciente todo esto mejorará la calidad asistencial, generando conocimiento sobre las distintas patologías, aumentando el conocimiento de enfermedades raras, mejorando los resultados en salud y el desarrollo de nuevos fármacos”, añade. Este Data Lake sanitario también ayudaría a los gestores del sistema, que conocerían la situación real sanitaria de todo el país y podría ayudarles a mejorar el uso de los recursos.

Entre sus promesas, también incluye la atracción y retención de talento investigador. Preguntamos al doctor Urda cómo garantizarían la privacidad y la seguridad en un tipo de datos de especialísima protección: “En Savana tenemos ya muchísima experiencia generando investigación a partir de este tipo de datos con absoluto respeto por la privacidad de los pacientes. Usamos Privacidad Natural, un nuevo método que mantiene la privacidad de cada paciente con los más altos estándares de privacidad que existen actualmente, eliminando todos los datos de carácter personal”. Y si esos datos están anonimizados, ¿cómo siguen siendo válidos y útiles para extraer conclusiones? “Ya existen herramientas que permiten desvincular la persona que origina la información de su contenido, con instrumentos de eliminación de información personal y de anonimización. Además, ya a día de hoy encontramos las herramientas, dentro del campo de la inteligencia artificial, que nos permiten tratar la información, independientemente de cómo se haya generado, de una manera homogénea”. Esto les permitiría, por un lado, crear una base de datos donde se ha eliminado cualquier información personal, pero en la que el gestor podría identificar, en caso necesario, la fuente de esa información. Esto significa que se podría identificar de qué paciente procede esa información, siendo esto muy útil para reclutar pacientes para ensayos clínicos o localizar grupos poblacionales concretos a los que emitir alertas sanitarias o dirigir campañas públicas de prevención. “Por otro lado, esa gran base de datos anónimos nos permitiría realizar grandes estudios de investigación, cambiando el concepto de estudio multicéntrico con un número de pacientes limitado, y permitiendo hacer grandes estudios como país”.

Entendemos que otra de las barreras para la creación de este Data Lake sanitario sería administrativa al estar transferidas las competencias de sanidad a las Comunidades Autónomas. ¿Cómo podrían aglutinar todos los datos? “Aunque las competencias están transferidas a las comunidades, ya hemos superado la barrera tecnológica, por lo que tenemos la capacidad de homogeneizar la información independientemente de la fuente a la hora de tratar la información. Por eso, consideramos que es ahora el momento de presentar un proyecto de sector, ya que desde la comunidad médico-científica tenemos claros los beneficios y potencial que este Data Lake nacional supondría para la investigación”, afirma el doctor Urda.

Reconocen desde Savana que ya han tenido conversaciones en distintos organismos del Gobierno y “la acogida ha sido muy buena”. “Actualmente estamos a la espera de que se den a conocer las características para su creación y seguimos dando a conocer esta propuesta conjunta del sector de la investigación clínica de España para recabar el mayor número de apoyos posibles porque la clave pasa por hacer partícipes al máximo número de sociedades científicas, asociaciones de pacientes, centros de investigación, etc.”, añade el vicepresidente de hospitales de Savana.

Y concluye: “Ya tenemos la capacidad tecnológica y científica y sabemos cuál es el camino para hacerlo de manera ética, que supone no solamente cumplir legalmente con todas las normativas de protección de datos, sino ir un paso más allá en cuanto al escrupuloso respeto por la privacidad de los pacientes y poner siempre en el centro el beneficio del paciente y la mejora de la calidad asistencial. Ahora es cuestión de esperar que se tomen las decisiones políticas para ponerlo en marcha”.