P. Lacroix, B. Michel, F. Picard, V. Rivoirard

We observe two populations of multivariate data described by p variables, where p is significantly larger than the population sizes. A two-sample test has to be performed to decide between the null hypothesis (the distributions of both populations are equal) and the alternative hypothesis (distributions are different). To take into account the complex structure of variables and overcome the curse of dimensionality problems, data are embedded in a well-chosen Reproducing Kernel Hilbert Space (RKHS).
In our work, we study a test statistic inspired by Harchaoui et al. (2008) generalizing the student t-test in a RKHS, and propose a non-asymptotic and implementable method to calibrate the test. First, through a spectral analysis, a theoretical upper bound of the test quantile is proposed. Second, a data-driven algorithm is implemented satisfying a control of the type I error and including the calibration of the unknown regularization hyperparameter.

Palabras clave: statistical tests, kernel methods, non-asymptotic, data-dependent calibration.

Programado

FENStatS-SEIO: Statistics and Data Science
11 de junio de 2025  10:30
Auditorio 1. Ricard Vinyes


Otros trabajos en la misma sesión


Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.