N. Amama Ben Hassun, J. Cortés Martínez, D. Fernández

The need to comply with privacy rules and reluctance to share original datasets have fueled synthetic data (SD) adoption. While current methods mimic original data, their quality assessment relies on validation metrics, whose reliability is uncertain, making it a key research focus.
This research introduces key validation metrics, focusing on tabular SD. After an extensive state of art, we describe a broad set of measures, some of them adapted from other contexts, and propose a framework to guide the selection of appropriate metrics based on specific use cases.
We set a comprehensive simulation study aim to assess the reliability of resemblance metrics, including the Propensity Score Mean-Squared Error and the Kolmogorov-Smirnov statistics, among others, when applied to different generation methods. The goals are twofold: first, to enhance the evaluation of synthetic data quality, and second, to address current deficiencies and facilitate their use in privacy-invasive domains.

Palabras clave: Synthetic Data, Tabular Data, Data Privacy, Data Utility, Validation Metrics

Programado

Análisis de Datos II
10 de junio de 2025  15:30
Auditorio 2. Leandre Cristòfol


Otros trabajos en la misma sesión

Estrategias para clasificación de datos tridimensionales utilizando LPDA

C. Gandia Tortosa, M. D. Molina Vila, M. J. Nueda Roldán

On confidence intervals obtained from the fusion of samples

S. Fernández Alonso, J. Baz González, S. Diaz-Vazquez, S. Montes

Redes Neuronales y Técnicas de Aprendizaje Automático para la Detección de Phishing

B. Pérez Sánchez, C. Perea, M. González Espinosa, J. J. López-Espín


Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.