Modelos de mixturas en el análisis de datos de single-cell RNA-seq.
La distribución binomial negativa ha sido ampliamente utilizada en la literatura para modelar los datos de recuento obtenidos a partir de experimentos de secuenciación de célula única (scRNA-Seq) por su capacidad para recoger la sobredispersión de dichos conteos. Sin embargo, esta modelización no siempre es adecuada, por ejemplo cuando se observa un exceso de ceros, y se han propuesto otros como el ZINB ( Zero Inflated Negative Binomial) que es una mixtura de una binomial negativa y una distribución de Dirac (en cero). Nosotros proponemos una modelización de los recuentos como mixtura de binomiales negativas. Hemos programado un algoritmo EM y realizado experimentos computacionales, obteniendo resultados prometedores.
Palabras clave: Mixturas Binomial negativa scRNA-Seq