La inteligencia artificial aplicada al sector de la salud

La Cátedra iDanae (inteligencia, datos, análisis y estrategia) en Big Data y Analytics, creada en el marco de colaboración de la Universidad Politécnica de Madrid (UPM) y Management Solutions, publica su newsletter trimestral correspondiente al 1T23 sobre la inteligencia artificial aplicada al sector de la salud


La inteligencia artificial aplicada al sector de la salud

Ver vídeo

Introducción

El rápido desarrollo de la tecnología durante los últimos años ha propiciado la generación de grandes cantidades de datos disponibles a partir de diferentes fuentes de información, y la posibilidad de su tratamiento y análisis. En el ámbito del sector sanitario, estos datos permiten realizar estudios más eficaces para numerosas aplicaciones, como el diagnóstico, la prevención de enfermedades, la comprensión de la evolución de los virus o los desarrollos farmacéuticos, entre muchas otras. De hecho, las inversiones en tecnología sanitaria no sólo pueden salvar vidas, sino también hacer que los sistemas sanitarios sean más eficientes. 

La medicina basada en la experiencia está siendo sustituida por un enfoque basado en la evidencia y centrado en el paciente. La identificación de los estados de enfermedad y de las opciones de tratamiento basada en datos es un reto crucial para la medicina de precisión. La inteligencia artificial (IA) se perfila como una nueva herramienta esencial para mejorar la capacidad de predicción del diagnóstico de enfermedades y los resultados de los tratamientos, tanto en el laboratorio como en la clínica. 

La IA, y más en general el aprendizaje automático, tiene un importante potencial y debe seguir ampliándose para lograr avances innovadores que puedan transformar el sector sanitario y la industria farmacéutica. Sin embargo, este potencial de desarrollo requiere la aplicación de enfoques de modelización que puedan ayudar a los investigadores a comprender mejor los procesos y sistemas biológicos. Además, estos enfoques deben abordar los problemas actuales, como el trabajo con múltiples tipos de datos heterogéneos, datos insuficientes o de baja calidad, la necesidad de interpretabilidad y explicabilidad de los resultados o el uso de enfoques de aprendizaje alternativos. 

Manejar grandes cantidades de datos es un reto desde el punto de vista técnico. Para disponer de datos suficientes que permitan obtener perspectivas útiles a partir de ellos, suelen intervenir diferentes fuentes de información (por ejemplo, información procedente de hospitales, wearables, la industria farmacéutica, etc.). Además, se requiere un conocimiento técnico de las técnicas de Big Data y aprendizaje automático para poder abordar los complejos retos a los que se enfrenta el sector sanitario desde hace tiempo. La modelización de datos biológicos y químicos podría aportar importantes avances en problemas complejos de la industria, como el descubrimiento de fármacos o la farmacovigilancia. 

Un buen ejemplo que muestra el aprovechamiento del uso de grandes cantidades de datos, así como el aumento de la velocidad de computación, es el rápido desarrollo de las vacunas COVID-19 [3]. Además, hay muchas ventajas en el descubrimiento de fármacos. Tales herramientas pueden ser muy importantes en la identificación de antibióticos. Por ejemplo, han demostrado ser muy útiles para descubrir determinados tratamientos antibacterianos, una tarea definida como prioritaria por la Organización Mundial de la Salud.

Estos ejemplos demuestran que, aunque el esfuerzo técnico en términos de Big Data y Data Science es considerable, los beneficios obtenidos podrían ser incalculables. Por ejemplo, los ingresos de la industria farmacéutica no dejan de crecer, y han alcanzado los 1,48 billones de dólares en todo el mundo en 2022. Además, iniciativas públicas como los fondos Next Generation de la UE están invirtiendo recursos económicos y fondos para mejorar los servicios públicos de salud. 

Sin embargo, es esencial tener en cuenta la importancia de la precisión, la fiabilidad y la interpretación de los resultados para su aplicación en este sector. Los posibles errores en los modelos pueden acarrear graves consecuencias, como diagnósticos incorrectos, que pueden repercutir negativamente en la salud, provocar el despilfarro de fondos en tratamientos ineficaces o conducir a investigaciones infructuosas. En consecuencia, es vital que los profesionales médicos y los investigadores utilicen estos resultados como herramienta. Además, hay que considerar el aspecto ético del uso de estos algoritmos (por ejemplo, ¿quién es responsable de un error en el proceso de toma de decisiones para un diagnóstico, el médico o el algoritmo?. Estos aspectos incluyen no sólo la responsabilidad, sino el ciclo de vida completo del modelo.

En este documento se repasan algunos de los distintos tipos de repositorios de datos disponibles en el sector sanitario. A continuación, se explican tres casos de uso diferentes que han tenido éxito para ilustrar las posibilidades de la aplicación de técnicas de IA y tipos de datos específicos. Posteriormente, se discuten los retos y oportunidades generales en este campo. Por último, se presentan las principales conclusiones.

Algunos repositorios de datos

Dentro del sector sanitario, el proceso de generación de datos se produce en diferentes unidades y geografías, no necesariamente conectadas entre sí (por ejemplo, diferentes hospitales, grupos de investigación, estudios, etc.). Para aprovechar los datos producidos y realizar su explotación, es necesario un proceso adecuado de recopilación de datos. La falta de intercambio de información entre diferentes empresas ha llevado a la creación de iniciativas públicas para recopilar y compartir datos. 

Por ejemplo, la Unión Europea está trabajando en el Espacio Europeo de Datos Sanitarios, que permitirá a las personas controlar y utilizar sus datos sanitarios en su país de origen o en otros Estados miembros mediante el fomento de un verdadero mercado único de servicios y productos sanitarios digitales y la generación de un marco coherente, fiable y eficiente para utilizar los datos sanitarios con fines de investigación, innovación, elaboración de políticas y actividades reguladoras, garantizando al mismo tiempo el pleno cumplimiento de las estrictas normas de protección de datos de la UE. 

Puede haber muchas fuentes diferentes de repositorios de datos. Por ejemplo, historias clínicas digitales, datos de cuidados intensivos, tratamientos y monitorización, catálogos de medicamentos, datos laborales, redes sociales, wearables, datos ómicos o imágenes. Cada uno de estos muchos tipos de datos tiene sus propias especificidades. A modo de ejemplo, se pueden destacar algunos de estos tipos de repositorios: catálogos de tipos de enfermedades, repositorios de imágenes, datos ómicos y weareables. 

  • Catálogos de tipos de enfermedades. En la actualidad existen miles de enfermedades catalogadas según diferentes normas, bases de datos y vocabularios. El número total de enfermedades es muy difícil de determinar. Parte de esta catalogación se asocia a veces con las características que definen las enfermedades. Utilizar la información sobre estas características es vital para comprender el aspecto y el comportamiento de las enfermedades. 
  • Repositorios de imágenes. Los datos de imágenes médicas, como radiografías, tomografías computerizadas, resonancias magnéticas y ecografías, pueden utilizarse para proyectos de ciencia de datos en el sector sanitario. Una iniciativa muy conocida para la descarga pública de imágenes médicas relacionadas con el cáncer es The Cancer Imaging Archive (TCIA). 
  • Datos ómicos. Los datos ómicos son datos biológicos a gran escala generados por tecnologías de alto rendimiento que estudian distintos tipos de biomoléculas, como la genómica, la transcriptómica, la proteómica, la metabolómica y la epigenómica. El análisis y la integración de los datos ómicos pueden proporcionar una visión más completa de los sistemas biológicos y ayudar en el desarrollo de fármacos y la prevención de enfermedades. Se han realizado múltiples iniciativas con los datos ómicos. Algunos ejemplos son Paired Omics Data Platform [8], European Genome-Phenome Archive, Chinese CNSA, o The Cancer Genome Atlas Program (TCGA). 
  • Wearables. Estos datos hacen referencia a los datos generados por dispositivos wearables, como smartwatches, fitnesstrackers y otros sensores portátiles que están diseñados para rastrear y monitorizar diversos parámetros fisiológicos y relacionados con la actividad de un individuo, como la frecuencia cardíaca, los pasos dados, los patrones de sueño y las calorías quemadas. Hoy en día, es habitual encontrar casos en los que los sensores incorporados a los smartwatches han salvado vidas al identificar métricas de salud anómalas. Un buen ejemplo de proyecto de recopilación de datos de wearables es la Open WearablesInitiative (OWEAR), que es una colaboración diseñada para promover el uso eficaz de medidas de salud de alta calidad generadas por sensores en la investigación clínica mediante el intercambio abierto de algoritmos y conjuntos de datos.

 

Aplicaciones con éxito de la ciencia de datos a la sanidad

Hay muchos casos de uso diferentes en los que la IA se ha aplicado con éxito en el sector sanitario. Algunos de ellos muestran el uso de diferentes repositorios de datos y técnicas de modelización, así como la diversidad de resultados que pueden obtenerse. En esta sección se analizarán tres casos de uso exitosos para ilustrar las posibilidades de aplicación de la IA en el sector sanitario: 

⦁ Descubrimiento y reposicionamiento de fármacos 

⦁ Imágenes biomédicas e investigación farmacéutica 

⦁ Modelización de datos ómicos

 

Descubrimiento y reposicionamiento de fármacos

El descubrimiento de fármacos para el tratamiento de enfermedades causadas por microorganismos patógenos es un proceso largo y costoso  Supone analizar datos de catálogos de enfermedades y datos ómicos que muestran moléculas que podrían producir la inhibición de microbios. Esto implica el cribado de una cantidad significativa de bibliotecas químicas sintéticas. La información analizada se aloja en bases de datos como ChEMBL o ZINC. A continuación, se identifican las moléculas que muestran actividad biológica, más comúnmente conocidas como hits. El proceso continúa con la optimización del compuesto activo para aumentar la actividad biológica.

Recientemente, el entrenamiento de modelos de Deep Learning ha llevado a acelerar la tarea de encontrar las moléculas activas y es útil para descubrir nuevos tratamientos antibacterianos. Ayudan a reducir considerablemente el tiempo empleado y a mejorar la precisión de las predicciones. Por ejemplo, en Stokes et al. 2022, una red neuronal profunda puede identificar la denominada molécula activa Halicina. Esta molécula es eficaz en el tratamiento de infecciones bacterianas como las producidas por Clostridioides difficile, un microorganismo que podría causar una inflamación del colon. Además, ha demostrado que puede ser útil contra la bacteria Acinetobacter Baumannii, calificada por la Organización Mundial de la Salud como patógeno prioritario contra el que se necesitan nuevos antibióticos.

El método aplicado se basa en dos etapas: 

  1. En primer lugar, se binarizaron los datos de diferentes bases de datos con información sobre moléculas activas para construir el conjunto de datos de entrada. La binarización se llevó a cabo para indicar si las moléculas tenían actividad. 
  2. A continuación, estos datos se utilizaron para entrenar un modelo de clasificación binaria basado en una red neuronal profunda que predice la probabilidad de que un nuevo compuesto inhiba el crecimiento de la bacteria, basándose en su estructura. Para alimentar el modelo, la representación gráfica de una molécula se transforma en un vector continuo. 

Además, estas nuevas herramientas computacionales se han aplicado para identificar fármacos candidatos contra otros microorganismos infecciosos, como los parásitos. Por ejemplo, en Neves et al. 2020 [15], se utilizan enfoques de inteligencia artificial para encontrar soluciones terapéuticas contra la malaria, una grave enfermedad tropical causada por parásitos del género Plasmodium. Como ocurre con otros microorganismos patógenos, los parásitos pueden mutar y mostrar una mayor resistencia a los fármacos. Por ello, es necesario identificar nuevos fármacos más eficaces que sustituyan a los antiguos. 

Neves et al. 2020 proponen el desarollo de modelos cuantitativos de relaciones estructura-actividad (QSAR). Los modelos QSAR son capaces de establecer relaciones entre los atributos de la estructura química y la actividad biológica de los compuestos. La metodología es la siguiente: 

  • En primer lugar, las características químicas se convierten en descriptores moleculares. Serán las variables independientes del problema. La actividad biológica se transformará en la variable dependiente del problema. 
  • En segundo lugar, se utiliza un modelo predictivo específico. Los modelos de regresión lineal habían sido los preferidos hasta que aparecieron técnicas nuevas y potentes. Las redes neuronales bayesianas, Support Vector Machine, Random Forests y Deep Neural Networks han sustituido ahora a este método estadístico. 
  • Por último, los resultados predichos por el modelo se aplican para realizar el cribado virtual (CV). El CV es un procedimiento habitual en el desarrollo de fármacos y se basa en probar todas las hipótesis necesarias antes de realizar ensayos clínicos. 

Además, las características de las enfermedades pueden utilizarse para el reposicionamiento de fármacos, que consiste en intentar utilizar medicamentos que ya han sido aprobados y están en uso para tratar una enfermedad distinta de su indicación original. Esto puede servir tanto para encontrar tratamientos para enfermedades que no los tienen, como para encontrar alternativas terapéuticas a enfermedades que ya tienen fármacos asociados, lo que también puede ser muy útil. 

Para ello pueden utilizarse las llamadas "redes de enfermedades": grafos en los que las enfermedades pueden relacionarse a través de sus características bajo el supuesto de que dos enfermedades comparten algunos de estos elementos. Esto se discute, por ejemplo, en el proyecto DISNET. El objetivo del proyecto DISNET es integrar en una única base de datos información procedente de fuentes públicas y heterogéneas que permita analizar y comprender las relaciones entre enfermedades. Como parte del conocimiento que se derivará de esta comprensión, el proyecto pretende crear redes de enfermedades que puedan ser analizadas para crear nuevas estrategias en términos de reutilización de fármacos, principalmente aplicadas a enfermedades raras.

 

Imágenes biomédicas e investigación farmacéutica

La visión por ordenador se utiliza en el sector sanitario para realizar muchas tareas. Aplicaciones como la detección de tumores, el recuento automático de células o la detección precoz rápida de enfermedades se utilizan para ayudar a los profesionales sanitarios.

En la industria farmacéutica, la visión por ordenador se utiliza para resolver diferentes problemas y mejorar la eficacia de determinados procesos. En procesos como los ensayos clínicos o los estudios preclínicos se pueden utilizar diferentes técnicas de análisis de imágenes e imágenes biológicas. Recientemente, las técnicas de Deep Learning como las Redes Neuronales Convolucionales (CNN) se han convertido en el método preferido por los científicos para llevar a cabo tareas de procesamiento de imágenes, debido a la eficiencia y los buenos resultados que ofrecen. 

Una actividad interesante en el sector sanitario es investigar la composición de las células, ya que permite analizar, por ejemplo, las características de los tumores. Sin embargo, representa una tarea difícil, ya que las células suelen mostrar una naturaleza heterogénea. En este contexto, los métodos basados en aprendizaje profundo mencionados se utilizan para llevar a cabo tareas de análisis de imágenes a través de imágenes celulares. Estas actividades son, por ejemplo, la identificación de hits, cribado fenotípico o la clasificación de fenotipos.

Las CNN han sustituido a las técnicas convencionales de análisis automático [19]. Antes de la aparición de las CNN, se aplicaban métodos de procesamiento de imágenes para identificar la región de interés (ROI). A continuación, se extraían diferentes características y se convertían en rasgos, es decir, en una serie de vectores. Por último, estas características se utilizan para entrenar un modelo de clasificación estadística como el análisis discriminante lineal (LDA) o una máquina de vectores de soporte (SVM). De este modo, se puede cuantificar la información sobre los efectos de los fármacos y las enfermedades. Sin embargo, las CNN no necesitan definir estas características; pueden aprender las características de las imágenes por sí mismas. Las CNN no sólo ofrecen mejores resultados en tareas de clasificación y segmentación, sino que también permiten realizar otras tareas como la mejora de la resolución de las imágenes o la eliminación del ruido de estas. Además, estas nuevas técnicas reducen el elevado coste computacional que supone la extracción de características y la selección de métodos de análisis (véase la figura 1). En resumen, se sabe que las CNN proporcionan datos más útiles para las actividades realizadas en el campo biológico que los enfoques tradicionales. Es decir, la alta precisión que presentan estos métodos y la eficiencia suponen un importante avance en el descubrimiento de fármacos.

 

Modelización de datos ómicos

Los datos ómicos abarcan información de múltiples conjuntos de biodatos: genómica, fenómica, epigenómica, farmacogenómica, transcriptómica, proteómica, metabolómica, lipidómica, etc. 

Desde la perspectiva de la modelización genómica, una de las fuentes potenciales que puede explotar el campo de la ciencia de datos es el análisis de las cadenas de nucleótidos de los virus. Los virus son microorganismos infecciosos cuyos principales componentes son biomoléculas de ácidos nucleicos. Hay virus que se basan en el ADN y otros que se basan en el ARN. Además de tener estructuras distintas, estos virus difieren también en la tasa de mutación, así como en cómo y dónde llevan a cabo procesos como la replicación. 

Dos características de los virus son sus elevadas tasas de mutación y replicación. A medida que el virus se replica dentro del huésped, la secuencia de nucleótidos cambia. En consecuencia, algunos de sus atributos pueden modificarse, como la capacidad de adaptación o la virulencia. Así, la comprensión de esta evolución viral ha sido una tarea compleja para los científicos a lo largo de los años. 

Por tanto, modelizar el complejo comportamiento de los virus podría reportar interesantes beneficios a la industria farmacéutica: identificar patrones y proporcionar información sobre la dinámica de la evolución de los virus podría llevar a diseñar terapias antivirales más eficaces. Para llevar a cabo esta tarea se pueden utilizar herramientas de aprendizaje automático. Varios trabajos las utilizan y proponen distintos enfoques para abordar este problema. 

Los conjuntos de datos utilizados como entrada de los modelos de Machine Learning y Deep Learning se basan en secuencias de nucleótidos. En estas secuencias de nucleótidos se pueden encontrar cuatro tipos de nucleótidos, cada uno asociado a una letra única. Así, estas secuencias pueden tratarse de dos formas diferentes:

  • Nucleótidos como caracteres: no requiere ningún preprocesamiento, ya que la secuencia se introduce como entrada directamente.
  • Nucleótidos como resultado de la codificación numérica: en este escenario, cada nucleótido se transforma en vectores numéricos. 

Además, las cadenas de nucleótidos pueden convertirse en secuencias de aminoácidos. Se realiza siguiendo el código genético. Este código asigna aminoácidos específicos a grupos de tres nucleótidos, lo que significa que cada secuencia de tres nucleótidos corresponderá a un aminoácido específico. Como resultado, el conjunto de datos estará formado por secuencias de aminoácidos en lugar de secuencias de nucleótidos. Estos conjuntos de datos podrían ser interesantes si el objetivo es, por ejemplo, predecir qué estructura tridimensional adoptará una proteína. 

Otras técnicas en estudio son el uso de redes neuronales para predecir mutaciones en secuencias de nucleótidos. Mostafa et al. 2016 proponen alimentar la red neuronal con una secuencia como entrada, y obtener como salida la secuencia inmediatamente posterior de la siguiente generación. Por lo tanto, las secuencias del conjunto de entrenamiento se ordenan en el tiempo de acuerdo con la dinámica del comportamiento viral, es decir, se trata de series temporales. Para el entrenamiento de este modelo, cada letra de nucleótido se codifica utilizando la codificación one-hot. 

Este entrenamiento finaliza cuando la precisión alcanza el 70%. Sin embargo, esta técnica presenta algunos inconvenientes:

  • Las redes neuronales son modelos de caja negra. Esto significa que estos modelos intentan aproximar una función compleja de la que no es posible obtener conocimientos. Por tanto, no es posible obtener reglas o patrones del modelo. 
  • Complejidad computacional. Codificar las secuencias de nucleótidos siguiendo el esquema anterior lleva a cuadruplicar la longitud de las secuencias. 
  • Para entrenar el modelo, se necesita un gran conjunto de datos con muchas secuencias. Además, simular el comportamiento de un virus en el laboratorio para estudiar su aptitud es un proceso largo y costoso.

Por último, otra línea de investigación interesante es la desarrollada por Delgado et al. [23]. En este trabajo se utiliza una técnica de aprendizaje automático para encontrar similitudes entre diferentes poblaciones del virus de la hepatitis C. En este caso, se implementa el método de Mapas AutoOrganizados (SOM por sus siglas en inglés) [24]. Esta técnica de aprendizaje automático no supervisado proporciona una representación bidimensional que preserva la estructura topológica de los datos. A diferencia de otros métodos no supervisados, SOM permite visualizar los resultados en un formato 2D. Esto la convierte en una técnica poderosa, ya que puede agrupar y reducir datos de alta dimensión. 

Los resultados arrojados por el SOM sugieren que, a medida que el virus muta, aumenta el número de grupos diferentes. Es decir, se pueden encontrar más diferencias entre las secuencias de nucleótidos a medida que el virus se desarrolla en las células.

 

Retos y oportunidades

Aunque hay muchos ejemplos de casos de uso con éxito, los datos sanitarios están muy fragmentados y se ven afectados por muchas barreras que incluyen, entre otras, marcos internacionales heterogéneos de cumplimiento ético y legal, así como cuestiones de propiedad, confianza y trazabilidad de los datos. Este panorama indefinido de los datos esconde un potencial sin explotar que, cuando se descubre, puede conducir a mejoras significativas en la salud y la innovación sanitaria a través de una ciencia de datos innovadora. Además, el sector sanitario se enfrenta a numerosos retos debido a la complejidad y diversidad de los datos biomédicos. Algunas de las cuestiones más relevantes en este campo son las siguientes: 

  • Calidad de los datos: la calidad de los datos sanitarios puede variar considerablemente en función de la fuente y el método de recopilación. Limpiar, agregar y estructurar estos datos en un formato utilizable es un reto importante. 
  • Privacidad y seguridad: los datos sanitarios son sensibles, y la cuestión de la privacidad es un reto importante en el sector. Los datos deben almacenarse de forma segura y el acceso debe restringirse a las personas autorizadas. 
  • Interoperabilidad: los datos sanitarios suelen almacenarse en distintos formatos y sistemas que no se comunican fácilmente entre sí. Integrar y armonizar datos de diversas fuentes para hacerlos más útiles para el análisis es crucial para su uso posterior. 
  • Implementación: incluso con técnicas sencillas de ciencia de datos, la implementación de cambios en el sector sanitario puede resultar complicada. Los científicos de datos deben trabajar con los profesionales sanitarios para garantizar que Retos y oportunidades sus hallazgos se transformen en acciones significativas que mejoren los resultados de los pacientes. 

Sin embargo, la naturaleza rutinaria de la recopilación de datos en el sistema sanitario proporciona una fuente de información inestimable y continuamente actualizada que puede utilizarse para la automejora de los sistemas sanitarios y para fundamentar rápidamente los procesos de toma de decisiones con el fin de mejorar la atención sanitaria y las estrategias de salud pública en general. Además, el uso de técnicas de ciencia de datos ofrece varias oportunidades de negocio importantes para las empresas del sector. De hecho, según la OCDE, los datos y las tecnologías digitales en la sanidad pueden suponer una disminución del 30% de los despilfarros y las ineficiencias (casi 400.000 millones de euros al año) [25]. Como ejemplo, cabe mencionar los siguientes: 

  • Gestión y análisis de datos: dado que la calidad de los datos sanitarios puede variar mucho y ser compleja, las empresas especializadas en gestión y análisis de datos sanitarios pueden ayudar a las organizaciones sanitarias a recopilar, limpiar y analizar sus datos para mejorar los resultados de los pacientes. Estas empresas pueden ofrecer soluciones de datos que aborden problemas de calidad, privacidad e interoperabilidad de los datos para ayudar a los proveedores sanitarios a tomar decisiones más informadas. 
  • Desarrollo y aplicación de tecnologías de aprendizaje automático e IA: las técnicas de IA pueden ayudar a lograr nuevos descubrimientos, y los profesionales sanitarios pueden ofrecer tratamientos más personalizados y eficaces a sus pacientes. 
  • Dispositivos médicos y wearables: estos dispositivos recogen datos sobre la salud del paciente y pueden utilizarse para mejorar la calidad de los datos sanitarios. Estos datos ayudan a los profesionales sanitarios a ofrecer una atención más personalizada. Además, los dispositivos médicos y los wearables pueden proporcionar a los profesionales sanitarios datos en tiempo real sobre la salud de los pacientes, lo que permite la detección precoz de posibles problemas de salud y la elaboración de planes de tratamiento más personalizados. 

En conclusión, los retos a los que se enfrenta el sector sanitario a la hora de utilizar técnicas de ciencia de datos ofrecen varias oportunidades de negocio importantes. Las empresas que pueden ofrecer soluciones de gestión y análisis de datos, desarrollar tecnologías de aprendizaje automático e IA o prestar servicios de consultoría sanitaria, entre otras muchas, pueden tener un potencial de crecimiento y éxito significativos en el sector sanitario. 

 

Conclusiones

Los avances tecnológicos y la disponibilidad de nuevas fuentes de datos han abierto grandes avances en el sector sanitario. El aumento de la velocidad de cálculo ha traído consigo la posibilidad de aplicar complejos algoritmos de ciencia de datos a los datos sanitarios. Así, se obtienen conocimientos que pueden ser útiles para encontrar nuevos fármacos o en la prevención de enfermedades. 

Algunos ejemplos de repositorios de datos útiles para obtener resultados valiosos para la investigación sanitaria son los catálogos de tipos de enfermedades, los repositorios de imágenes, los datos ómicos y los wearables, entre muchos otros. El uso de técnicas avanzadas de modelización saca provecho de todos estos repositorios de datos. Se están desarrollando iniciativas públicas para que los investigadores sanitarios puedan acceder abiertamente a las fuentes de información y a los algoritmos. 

En resumen, la explotación de los datos sanitarios y la aplicación de la IA en el sector sanitario son tareas complejas que requieren conocimientos especializados y plantean algunos grandes retos, pero también crean nuevas oportunidades de negocio que pueden ser explotadas.


La newsletter "La inteligencia artificial aplicada al sector de la salud " ya está disponible para su descarga en la web de la Cátedra tanto en españ​ol como en inglés.