https://stats.stackexchange.com/questions/171850/why-regret-is-used-in-online-machine-learning-and-is-there-any-intuitive-explana
คือ state ที่เกิดขึ้นไปแล้ว แล้วมองย้อนกลับไป(hindsight)พบว่าเป็นแค่ suboptimal จริงๆยังมี state ที่ดีกว่า ณ เวลานั้นที่ควรเลือก