J. C-Rella, D. Martinez Rego, J. M. Vilar Fernandez
En el estado del arte hay numerosas propuestas dentro del aprendizaje por refuerzo. Sin embargo, prácticamente ningún trabajo explora los beneficios potenciales de combinar estas propuestas con un enfoque sensible al coste. Por ejemplo, el problema del riesgo de crédito es dinámico y especialmente sensible al coste, dado que los resultados dependen del monto del préstamo. Sin embargo, no se disponen de técnicas adecuadas para su modelización. En este trabajo se proponen nuevas estrategias de aprendizaje dinámico que adaptan el aprendizaje en línea y los algoritmos de bandidos al aprendizaje sensible al coste. Los experimentos con simulaciones y conjuntos de datos reales demuestran la efectividad de los algoritmos propuestos, abriendo la puerta a una nueva metodología dentro del aprendizaje por refuerzo.
Palabras clave: Aprendizaje por refuerzo, clasificación, sensible al coste
Programado
Clasificación y reconocimiento de patrones
11 de junio de 2025 15:30
Auditorio 1. Ricard Vinyes