L. A. Rodríguez Ramírez, J. Cárcamo, A. Cuevas González
En esta ponencia proporcionamos condiciones necesarias y suficientes para la unicidad del conjunto de $k$-medias de una distribución de probabilidad. Este problema de unicidad está relacionado con la elección de $k$: dependiendo de la distribución subyacente, algunos valores de este parámetro podrían conducir a múltiples conjuntos de $k$-medias, lo que dificulta la interpretación de los resultados o la estabilidad de los algoritmos.
Ofreceremos una evaluación general sobre la consistencia del $k$-medias empírico adaptado al contexto de no unicidad. Además, proporcionamos una caracterización estadística de la unicidad del $k$-medias en términos de la normalidad asintótica de la suma de cuadrados dentro del clúster. Como consecuencia, derivamos una prueba bootstrap para la unicidad del conjunto de $k$-medias. Los resultados se ilustran con ejemplos de diferentes tipos de no unicidad. Finalmente, verificamos mediante simulaciones el desempeño de la metodología propuesta.
Palabras clave: Clustering, $k$-medias, caracterización de conjuntos de puntos principales, proceso empírico
Programado
Estadística no paramétrica: Contrastes no paramétricos
13 de junio de 2025 11:00
MR 1