J. San Vicente
El Reglamento (UE) nº 557/2013 de la Comisión, establece las condiciones para el acceso a datos estadísticos confidenciales con fines científicos, promoviendo el uso de estos datos para el avance del conocimiento, a la vez que garantiza la protección de la privacidad y la confidencialidad. En EUSTAT, esta normativa se implementa un servicio de acceso presencial para investigadores, que trabajan desde ordenadores sin puertos de salida, lo que impide extraer o transferir los resultados, garantizando así la seguridad y confidencialidad de los datos.
Sin embargo, este enfoque genera ineficiencias al limitar la autonomía de los investigadores y aumentar la carga operativa de EUSTAT en tareas sin valor añadido. Para solucionarlo, se ha llevado a cabo un POC (Prueba de Concepto) consistente en el desarrollo de un espacio de datos seguro que permita a los investigadores realizar análisis estadísticos en remoto, garantizando la confidencialidad de los datos.
La infraestructura del proyecto se apoya en dos conectores seguros alojados en servidores OVH, uno para Eustat y otro para los investigadores, que gestionan el intercambio de información mediante sistemas de autenticación, módulos de seguridad, limpieza de datos y certificados digitales. El procesamiento se realiza en un entorno seguro (sandbox) de Eustat con scripts en Python. Para proteger la confidencialidad estadística, se utiliza la librería ACRO, que permite configurar controles de confidencialidad personalizados. En caso de dudas, se prevé el diálogo entre los investigadores y Eustat.
Se ha diseñado un portal web que centraliza y gestiona todo el ciclo de análisis estadístico entre EUSTAT y los investigadores, desde la solicitud hasta la entrega de resultados. El proceso es guiado: los investigadores consultan el catálogo de datos, selecciona el servicio de análisis (como fusiones, tabulaciones o regresiones), configura el análisis y envía la solicitud. Una vez aprobada, el análisis se ejecuta y los resultados se entregan en un archivo ZIP. El portal también permite gestionar y hacer seguimiento de las solicitudes y del historial de análisis.
Esta prueba de concepto ha demostrado que el sistema permite realizar análisis y modelización garantizando la confidencialidad, ya que los investigadores ni visualizan ni acceden directamente a los micro datos. La interfaz es sencilla y resulta útil para fases iniciales de investigación, aunque la arquitectura actual limita los análisis avanzados y la personalización. Por ello, se plantea la necesidad de seguir desarrollando el sistema. En conjunto, la solución se confirma como escalable y efectiva.
Keywords: Confidencialidad, Librería Acro, Acceso remoto, Espacio de datos seguro.
Scheduled
Data Gobernment and confidential data access
June 13, 2025 9:00 AM
Auditorio 1. Ricard Vinyes