Reward estimation with scheduled knowledge distillation for dialogue policy learning

التفاصيل البيبلوغرافية
العنوان: Reward estimation with scheduled knowledge distillation for dialogue policy learning
المؤلفون: Junyan Qiu, Haidong Zhang, Yiping Yang
المصدر: Connection Science. 35
بيانات النشر: Informa UK Limited, 2023.
سنة النشر: 2023
مصطلحات موضوعية: Human-Computer Interaction, Artificial Intelligence, Software
تدمد: 1360-0494
0954-0091
URL الوصول: https://explore.openaire.eu/search/publication?articleId=doi_________::a1066268526a3a9bf85228cefd71fd1a
https://doi.org/10.1080/09540091.2023.2174078
حقوق: OPEN
رقم الأكسشن: edsair.doi...........a1066268526a3a9bf85228cefd71fd1a
قاعدة البيانات: OpenAIRE