La digitalización creciente de los datos clínicos representa una oportunidad clave para mejorar tanto la investigación como la atención sanitaria. No obstante, gran parte de esta información en las historias clínicas electrónicas se encuentra en formato de texto libre, lo que dificulta su organización, la interoperabilidad entre sistemas y su aprovechamiento en investigación clínica.
Este proyecto busca abordar este desafío mediante el uso de estándares como openEHR y SNOMED CT, que permiten estructurar y acceder a la información sanitaria de manera más eficiente. Nuestro objetivo principal es maximizar el valor de los datos de las historias clínicas electrónicas en la investigación clínica, combinando estos estándares con técnicas avanzadas como el procesamiento de lenguaje natural (NLP) y los grafos de conocimiento.
Como resultado, desarrollaremos herramientas y metodologías que, por un lado, faciliten la estructuración y normalización de textos clínicos narrativos y, por otro, mejoren el uso de la información almacenada en repositorios openEHR para la investigación clínica.
Nos centraremos en los siguientes objetivos:
- Structuring clinical texts in Spanish in openEHR format, which involves identifying and organizing relevant information within these texts.
- Crear un grafo de conocimiento a partir de los estos textos clínicos y datos openEHR para facilitar búsquedas más precisas y avanzadas en las historias clínicas electrónicas.
- Developing an advanced query engine that enables searches guided by SNOMED CT terminology on openEHR repositories, improving the accuracy of analyses.
Esperamos que este proyecto mejore significativamente la capacidad de realizar análisis y búsquedas semánticas, beneficiando tanto a los investigadores como al personal médico, quienes podrán acceder a información más detallada para tomar decisiones.
El proyecto será ejecutado por la empresa VeraTech for Health en colaboración con la empresa alemana Vitagroup (
https://hip.vitagroup.ag/en/) which will contribute its expertise and tools for managing openEHR data.
El proyecto está subvencionado por el CDTI dentro de la convocatoria de Proyectos “Multi-país 2024” vinculados al PERTE de Salud de Vanguardia en el marco del Plan de Recuperación, Transformación y Resiliencia.