Regret Analysis of Stochastic and Nonstochastic Multi-armed Bandit Problems - Foundations and Trends (R) in Machine Learning - Sebastien Bubeck - Bøker - now publishers Inc - 9781601986269 - 12. desember 2012
Ved uoverensstemmelse mellom cover og tittel gjelder tittel

Regret Analysis of Stochastic and Nonstochastic Multi-armed Bandit Problems - Foundations and Trends (R) in Machine Learning


Få en e-post når varen er tilgjengelig
Har du en profil? Logg inn
Julegaver kan byttes frem til 31. januar
Legg til iMusic ønskeliste
eller

Mathematically, a multi-armed bandit is defined by the payoff process associated with each option. In this book, the focus is on two extreme cases in which the analysis of regret is particularly simple and elegant: independent and identically distributed payoffs and adversarial payoffs.


138 pages

Media Bøker     Pocketbok   (Bok med mykt omslag og limt rygg)
Utgitt 12. desember 2012
ISBN13 9781601986269
Utgivere now publishers Inc
Antall sider 138
Mål 234 × 159 × 8 mm   ·   204 g
Språk Engelsk