[ad_1]
En los últimos años, los científicos han logrado grandes avances en el desarrollo de algoritmos de inteligencia artificial que pueden analizar los datos de los pacientes y encontrar nuevas formas de diagnosticar enfermedades o predecir qué tratamientos funcionarán mejor en diferentes pacientes.
El éxito de estos algoritmos depende del acceso a los registros de salud de los pacientes despojados de información personal que podría usarse para identificar a las personas del conjunto de datos. Sin embargo, la posibilidad de que las personas puedan ser identificadas de otras maneras ha generado preocupación entre los defensores de la privacidad.
En un nuevo estudio, un equipo de investigadores dirigido por el director de investigación del MIT, Leo Anthony Celi, cuantificó el riesgo potencial de este tipo de reidentificación de pacientes y descubrió que es extremadamente pequeño en comparación con el riesgo actual de una violación de datos. De hecho, entre 2016 y 2021, el período examinado en el estudio, no hubo informes de reidentificación de pacientes a través de registros de salud disponibles públicamente.
Los resultados sugieren que el riesgo potencial para la privacidad del paciente es superado con creces por los beneficios para los pacientes que se benefician de un mejor diagnóstico y tratamiento, dice Celi. Él espera que estos conjuntos de datos estén más disponibles e incluyan un grupo más diverso de pacientes en un futuro próximo.
«Estamos de acuerdo en que existe cierto riesgo para la privacidad del paciente, pero también existe el riesgo de no compartir datos», dice. «Hay daño cuando los datos no se comparten, y eso debe tenerse en cuenta en la ecuación».
Celi, quien también es instructora en la Escuela de Salud Pública TH Chan de Harvard y médica asistente en la División de Medicina Pulmonar, Cuidados Críticos y del Sueño en el Centro Médico Beth Israel Deaconess, es la autora principal del nuevo estudio. Kenneth Seastedt, Fellow en Cirugía Torácica en el Centro Médico Beth Israel Deaconess, es el autor principal del artículo, que se publica hoy en PLOS Salud Digital.
Análisis de riesgo / beneficio
Grandes bases de datos de salud creadas por hospitales y otras instituciones contienen una gran cantidad de información sobre enfermedades como enfermedades cardíacas, cáncer, degeneración macular y Covid-19, que los investigadores utilizan para tratar de encontrar nuevas formas de diagnosticar y tratar enfermedades.
Celi y otros en el Laboratorio de Fisiología Computacional del MIT han creado varias bases de datos disponibles públicamente, incluido el Medical Information Mart for Intensive Care (MIMIC), que recientemente usaron para desarrollar algoritmos que pueden ayudar a los médicos a tomar mejores decisiones médicas. Muchos otros grupos de investigación también han utilizado los datos y otros han creado bases de datos similares en países de todo el mundo.
Cuando se ingresan datos de pacientes en este tipo de base de datos, normalmente se eliminan ciertos tipos de información de identificación, incluidos los nombres, direcciones y números de teléfono de los pacientes. Esto es para evitar que los pacientes sean reidentificados y se publique información sobre su salud.
Sin embargo, las preocupaciones sobre la privacidad han frenado el desarrollo de más bases de datos disponibles públicamente de este tipo de información, dice Celi. En el nuevo estudio, él y sus colegas querían preguntar cuál es el riesgo real de reidentificación del paciente. Primero, buscaron en PubMed, una base de datos de artículos científicos, informes de reidentificación de pacientes de los registros de salud pública, pero no encontraron ninguno.
Para ampliar la búsqueda, los investigadores luego examinaron los informes de los medios desde septiembre de 2016 hasta septiembre de 2021 utilizando Media Cloud, una base de datos de noticias global de código abierto y una herramienta de análisis. En una búsqueda de más de 10,000 publicaciones de medios estadounidenses durante ese tiempo, no encontraron ni un solo caso de reidentificación de pacientes de los registros de salud pública.
Por el contrario, descubrieron que durante el mismo período, se robaron los registros de salud de casi 100 millones de personas a través de violaciones de datos de información que debería haberse mantenido segura.
“Por supuesto, es bueno preocuparse por la privacidad del paciente y el riesgo de reidentificación, pero ese riesgo, aunque no es cero, es pequeño en comparación con el tema de la ciberseguridad”, dice Celi.
Mejor representación
Se necesita un intercambio más amplio de datos de salud no identificados, según Celi, para ampliar la representación de los grupos minoritarios en los Estados Unidos que tradicionalmente han estado subrepresentados en los estudios médicos. También está trabajando para fomentar el desarrollo de más bases de datos de este tipo en países de bajos y medianos ingresos.
«No podemos avanzar con la IA a menos que abordemos los sesgos que acechan en nuestros conjuntos de datos», dice. “Cuando tenemos este debate sobre la protección de datos, nadie escucha la voz de las personas que no están representadas. Las personas deciden por ellos que sus datos deben protegerse y no deben compartirse. Pero ellos son aquellos cuya salud está en juego; Son los que tienen más probabilidades de beneficiarse del intercambio de datos”.
En lugar de pedir el consentimiento del paciente para compartir datos, lo que, según él, podría agravar la exclusión de muchas personas que ahora están subrepresentadas en los datos de salud disponibles públicamente, Celi recomienda mejorar las salvaguardas existentes para proteger dichos conjuntos de datos. Una nueva estrategia que él y sus colegas están usando es compartir los datos para que no se puedan descargar y los administradores de la base de datos puedan monitorear cualquier consulta que se realice sobre ellos. Esto les permite marcar cualquier solicitud de usuario que no parezca estar destinada a fines de investigación legítimos, dice Celi.
«A lo que nos comprometemos es a realizar análisis de datos en un entorno muy seguro, de modo que eliminemos a cualquier jugador infame que intente utilizar los datos por motivos distintos a la mejora de la salud pública», dice. “No estamos diciendo que debamos ignorar la privacidad del paciente. Lo que estamos diciendo es que también debemos equilibrar esto con el valor de compartir datos”.
La investigación fue financiada por los Institutos Nacionales de Salud a través del Instituto Nacional de Imágenes Biomédicas y Bioingeniería.
[ad_2]