Reward estimation with scheduled knowledge distillation for dialogue policy learning
العنوان: | Reward estimation with scheduled knowledge distillation for dialogue policy learning |
---|---|
المؤلفون: | Junyan Qiu, Haidong Zhang, Yiping Yang |
المصدر: | Connection Science. 35 |
بيانات النشر: | Informa UK Limited, 2023. |
سنة النشر: | 2023 |
مصطلحات موضوعية: | Human-Computer Interaction, Artificial Intelligence, Software |
تدمد: | 1360-0494 0954-0091 |
URL الوصول: | https://explore.openaire.eu/search/publication?articleId=doi_________::a1066268526a3a9bf85228cefd71fd1a https://doi.org/10.1080/09540091.2023.2174078 |
حقوق: | OPEN |
رقم الأكسشن: | edsair.doi...........a1066268526a3a9bf85228cefd71fd1a |
قاعدة البيانات: | OpenAIRE |
تدمد: | 13600494 09540091 |
---|