• 简体   /   繁体
异策略模仿-强化学习序列推荐算法-计算机应用研究2024年05期

异策略模仿-强化学习序列推荐算法

作者:刘珈麟 贺泽宇 李俊 字体:      

摘 要:最近,强化学习序列推荐系统受到研究者们的广泛关注,这得益于它能更好地联合建模用户感兴趣的内动态和外倾向。然而,现有方法面临同策略评估方法数据利用率低,导致模型依赖大量的专家标注数据,以及启发式价(试读)...

计算机应用研究

2024年第05期