J. C-Rella, D. Martinez Rego, J. M. Vilar Fernandez

En el estado del arte hay numerosas propuestas dentro del aprendizaje por refuerzo. Sin embargo, prácticamente ningún trabajo explora los beneficios potenciales de combinar estas propuestas con un enfoque sensible al coste. Por ejemplo, el problema del riesgo de crédito es dinámico y especialmente sensible al coste, dado que los resultados dependen del monto del préstamo. Sin embargo, no se disponen de técnicas adecuadas para su modelización. En este trabajo se proponen nuevas estrategias de aprendizaje dinámico que adaptan el aprendizaje en línea y los algoritmos de bandidos al aprendizaje sensible al coste. Los experimentos con simulaciones y conjuntos de datos reales demuestran la efectividad de los algoritmos propuestos, abriendo la puerta a una nueva metodología dentro del aprendizaje por refuerzo.

Keywords: Aprendizaje por refuerzo, clasificación, sensible al coste

Scheduled

Classification and pattern recognition
June 11, 2025  3:30 PM
Auditorio 1. Ricard Vinyes


Other papers in the same session

Clasificadores basados en árboles de expansión mínima

J. González Díaz, B. Pateiro López, I. Rodríguez Acevedo

Classifying Mood States Using Wearable Sensor Data

P. Llamocca Portella, R. Morales Arsenal, V. López López


Cookie policy

We use cookies in order to be able to identify and authenticate you on the website. They are necessary for the correct functioning of it, and therefore they can not be disabled. If you continue browsing the website, you are agreeing with their acceptance, as well as our Privacy Policy.

Additionally, we use Google Analytics in order to analyze the website traffic. They also use cookies and you can accept or refuse them with the buttons below.

You can read more details about our Cookie Policy and our Privacy Policy.