J. C-Rella, D. Martinez Rego, J. M. Vilar Fernandez

En el estado del arte hay numerosas propuestas dentro del aprendizaje por refuerzo. Sin embargo, prácticamente ningún trabajo explora los beneficios potenciales de combinar estas propuestas con un enfoque sensible al coste. Por ejemplo, el problema del riesgo de crédito es dinámico y especialmente sensible al coste, dado que los resultados dependen del monto del préstamo. Sin embargo, no se disponen de técnicas adecuadas para su modelización. En este trabajo se proponen nuevas estrategias de aprendizaje dinámico que adaptan el aprendizaje en línea y los algoritmos de bandidos al aprendizaje sensible al coste. Los experimentos con simulaciones y conjuntos de datos reales demuestran la efectividad de los algoritmos propuestos, abriendo la puerta a una nueva metodología dentro del aprendizaje por refuerzo.

Palabras clave: Aprendizaje por refuerzo, clasificación, sensible al coste

Programado

Clasificación y reconocimiento de patrones
11 de junio de 2025  15:30
Auditorio 1. Ricard Vinyes


Otros trabajos en la misma sesión

Clasificadores basados en árboles de expansión mínima

J. González Díaz, B. Pateiro López, I. Rodríguez Acevedo

Classifying Mood States Using Wearable Sensor Data

P. Llamocca Portella, R. Morales Arsenal, V. López López


Política de cookies

Usamos cookies solamente para poder idenfiticarte y autenticarte dentro del sitio web. Son necesarias para el correcto funcionamiento del mismo y por tanto no pueden ser desactivadas. Si continúas navegando estás dando tu consentimiento para su aceptación, así como la de nuestra Política de Privacidad.

Adicionalmente, utilizamos Google Analytics para analizar el tráfico del sitio web. Ellos almacenan cookies también, y puedes aceptarlas o rechazarlas en los botones de más abajo.

Aquí puedes ver más detalles de nuestra Política de Cookies y nuestra Política de Privacidad.