Comparative Analysis of L¹ Norm Variants for Convex Clustering in Compositional Data | SEIO2025

M. Comas Cufí, P. De La Lama, J. Saperas Riera

Significant advancements in compositional data (CoDa) analysis using Aitchison geometry enable robust metric space exploration. CoDa resides in the Simplex, a (D-1)-dimensional space. This study compares various norms, focusing on the L1-norm, and applies convex clustering algorithms adapted to CoDa. We evaluate different L1-based penalization terms: the L1-olr norms (derived from Principal Components and a Sequential Binary Partition -default in CoDaPack-), the L1-clr norm, and the L1-CoDa norm, using a dataset on milk composition from 24 mammals. Results show that L1-olr lacks subcompositional coherence and basis independence but is suitable for agglomerative clustering, whereas L1-clr preserves those properties but is less effective for agglomerative clustering. The L1-CoDa norm maintains the compositional properties and supports agglomeration, enhancing meaningful data interpretation. These findings highlight the importance of tailored norms for CoDa clustering.

Palabras clave: compositional data, L¹-Norm, clustering

Programado

Sesión de pósters I
12 de junio de 2025 19:00
Foyer principal

Otros trabajos en la misma sesión

A Novel Approach for Deconvolution of Bulk Transcriptomic Data Using Single-Cell RNA-Seq information and Weighted Least Squares (wLS)

N. Alonso Moreda, A. Berral González, J. M. Sánchez Santos, J. De Las Rivas

Algoritmo de estimación lineal en sistemas multitasa bajo ataques DoS

R. Caballero Águila, M. P. Frías Bustamante, A. Oya Lechuga

Contraste de cointegración no lineal basado en estadísticos de orden.

A. E. García Sipols, M. T. Santos Martín, C. Simon, L. Atil, H. Fellag

Diseño de un Sistema de Alerta Temprana Dinámico para la Optimización de la Carga de Entrenamiento en el Contexto de un Club de Primera División Española

E. Benéitez-Andrés, M. Anciones Polo, J. L. Quintero-Illera, M. Sánchez Barba, M. Sánchez García, L. Pérez Serrano

Efficient estimation with Bayesian EM and inlabru methods for spatio-temporal Hawkes point processes: an application to real-world data

A. Bernabeu, F. Lindgren, F. Serafini, J. Mateu

Estimating optimal spatial resolution for biodiversity studies: case study of the Ebro region

E. S. Martinez, E. Vilaprinyo, J. Asín, R. C. Vaqueiro de Castro Alves

Impacto de las alineaciones en la estrategia de un partido de fútbol aplicando Double Machine Learning

G. Ruiz, L. Badiella

Information and complexity-based evaluation of spatial point process models

A. Medialdea Villanueva, J. M. Angulo Ibáñez, J. Mateu Mahiques

Interacción entre humanos y vida silvestre: Su impacto en la resistencia antimicrobiana de Escherichia coli en perezosos de Costa Rica desde un enfoque One Health

C. Calvo Fernández, M. M. Dolcet Negre, B. Martín Maldonado, M. Pulido Vadillo, R. Such, E. García Vila, J. F. Delgado Blas, B. Gonzalez Zorn

Segmentación Inteligente: Cómo Aplicar Sistemas de Ranking a la Red de Ventas de Seguros mediante el sistema ELO-GLICKO-2.

J. Segura Gisbert, J. Morala Girón

Data mining y drones multiespectrales en el control de especies invasoras.

N. Montiel, P. J. Hidalgo, C. Pérez-Carral, M. Ortega Moreno

Estimación distribuida en redes de sensores con dos canales afectados por ataques aleatorios

M. J. García-Ligero Ramírez

Modelización estadística del impacto topográfico en los patrones de movimiento animal

A. Oya Lechuga, J. M. Valderrama Zafra, R. Torres Román

Redes Bayesianas para la Abducción y Predicción en Sistemas Complejos: Un Caso en Ganadería

M. Rodríguez Rosa, L. Jiménez-Mínguez, M. Anciones-Polo

Compresión de imágenes en el álgebra tessarine

J. D. Jiménez López, A. Molina Rescalvo, J. Navarro-Moreno, R. M. Fernández-Alcalá, J. C. Ruiz-Molina

Estimación de modelos lineales con multicolinealidad mediante penalizaciones

R. Salmerón Gómez, C. García García