L. A. Rodríguez Ramírez, J. Cárcamo, A. Cuevas González

En esta ponencia proporcionamos condiciones necesarias y suficientes para la unicidad del conjunto de $k$-medias de una distribución de probabilidad. Este problema de unicidad está relacionado con la elección de $k$: dependiendo de la distribución subyacente, algunos valores de este parámetro podrían conducir a múltiples conjuntos de $k$-medias, lo que dificulta la interpretación de los resultados o la estabilidad de los algoritmos.

Ofreceremos una evaluación general sobre la consistencia del $k$-medias empírico adaptado al contexto de no unicidad. Además, proporcionamos una caracterización estadística de la unicidad del $k$-medias en términos de la normalidad asintótica de la suma de cuadrados dentro del clúster. Como consecuencia, derivamos una prueba bootstrap para la unicidad del conjunto de $k$-medias. Los resultados se ilustran con ejemplos de diferentes tipos de no unicidad. Finalmente, verificamos mediante simulaciones el desempeño de la metodología propuesta.

Keywords: Clustering, $k$-medias, caracterización de conjuntos de puntos principales, proceso empírico

Scheduled

Nonparametric Statistics: Nonparametric Test
June 13, 2025  11:00 AM
MR 1


Other papers in the same session

A kernel-based goodness-of-fit test for regression models

M. Vidal García, I. Van Keilegom, R. Crujeiras, W. González Manteiga

Nonparametric model check for cure rate quantile regression

M. Conde-Amboage, W. González-Manteiga, C. A. Sánchez-Sellero

Testing a parametric circular regression function with spatially correlated data

A. Meilán Vila, M. Francisco Fernandez, R. M. Crujeiras Casais

The k-sample problem with left-truncated and right-censored data

A. Lago, J. C. Pardo Fernández, J. de Uña Álvarez


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.