Investigadors de Tarragona creen un sistema que oculta automàticament dades confidencials de textos

El mètode ofereix una precisió equiparable al procés manual que han de fer actualment els experts en privacitat, que consisteix a identificar i eliminar paraules

19 mayo 2017 15:31 | Actualizado a 19 mayo 2017 15:31
Se lee en minutos
Participa:
Para guardar el artículo tienes que navegar logueado/a. Puedes iniciar sesión en este enlace.
Comparte en:

Temas:

Un grup d'investigadors ha creat un sistema que oculta automàticament dades confidencials de documents de text, informa la Universitat Rovira i Virgili (URV).

El mètode ofereix una precisió equiparable al procés manual que han de fer actualment els experts en privacitat, que consisteix a identificar i eliminar paraules.

D'aquesta manera, els documents es poden enviar a tercers sense comprometre la privacitat i mantenint l'anonimat de les entitats (persones, organitzacions, etc.) a les qual fan referència.

El sistema l'han desenvolupat els investigadors David Sánchez, del grup d'investigació CRISES-Càtedra UNESCO de Privacitat de Dades, d'Enginyeria Informàtica i Matemàtiques de la URV, i Montserrat Batet, del grup d'investigació KISON de la Universitat Oberta de Catalunya (UOC).

Les dades personals resulten de gran utilitat en molts àmbits, tant d'investigació com de negocis o planificació.

Per exemple, les històries mèdiques, les operacions bancàries o l'anàlisi de les transaccions comercials, però com que moltes d'aquestes dades són confidencials, els documents que els contenen han de protegir-se abans de ser enviats als investigadors.

Per tant, és imprescindible usar mecanismes de protecció adequats per garantir l'anonimat.

La Unió Europea és molt estricta quant a la cessió de dades personals sense consentiment dels implicats, però a d'altres països, com els Estats Units, és habitual l'ús de documents privats en assumptes judicials, baixes laborals, assegurances, etc.

No obstant això, en tots els casos cal garantir que els documents facilitats no revelen informació confidencial.

El mètode que han desenvolupat els investigadors automatitza tot el procés d'eliminar paraules o frases sensibles, fet que permet manejar i protegir de manera eficient el gran volum de dades que s'utilitzen actualment en investigació.

Per a això, el sistema analitza la informació disponible a internet, que és la que un tercer podria utilitzar com a base de coneixement per deduir informació confidencial d'un document protegit.

Seguidament protegeix aquells termes que podrien facilitar aquestes deduccions.

Les proves han demostrat que aquest mètode és més exhaustiu i ofereix una precisió equiparable a la d'un expert humà. A més, a diferència dels experts, el sistema no es limita a eliminar termes perillosos, sinó que, fins a on sigui possible, intenta reemplaçar-los per conceptes més generals que resultin més ambigus.

Per exemple, en lloc d'especificar que un pacient té una pneumònia, indicaria que pateix una malaltia del sistema respiratori.

Comentarios
Multimedia Diari