دورية أكاديمية

Online Markov Decision Processes Under Bandit Feedback

التفاصيل البيبلوغرافية
العنوان: Online Markov Decision Processes Under Bandit Feedback
المؤلفون: Neu, G., Gyorgy, A., Szepesvari, C., Antos, A.
المصدر: IEEE Transactions on Automatic Control IEEE Trans. Automat. Contr. Automatic Control, IEEE Transactions on. 59(3):676-691 Mar, 2014
قاعدة البيانات: IEEE Xplore Digital Library
الوصف
تدمد:00189286
15582523
23343303
DOI:10.1109/TAC.2013.2292137