异策略模仿-强化学习序列推荐算法-计算机应用研究2024年05期

异策略模仿-强化学习序列推荐算法

作者：刘珈麟贺泽宇李俊字体：小中大

打印

摘要：最近，强化学习序列推荐系统受到研究者们的广泛关注，这得益于它能更好地联合建模用户感兴趣的内动态和外倾向。然而，现有方法面临同策略评估方法数据利用率低，导致模型依赖大量的专家标注数据，以及启发式价（试读）...

计算机应用研究

2024年第05期

期刊目录

面向图像文本的多模态处理方法综述
基于深度学习的医学图像分析域自适应研究
针对视频监控系统隐蔽式攻击及蜜罐防御
基于区块链的可信制造供应链溯源框架设计
基于改进Raft共识算法和PBFT共识算法的双层共识算法
基于区块链和亲友节点的电子健康记录安全共享方案
面向车联网的联邦学习模型定制框架及算法改进
基于Spark Streaming的海量GPS数据实时地图匹配算法
基于高频车站及时间窗的立体轨道交通系统智能调度算法
异策略模仿-强化学习序列推荐算法
一种基于梯度的多智能体元深度强化学习算法
基于知识图谱的多特征融合谣言检测方法
基于相关性分析的不完整数据函数依赖挖掘方法
基于改进列计算的空间并置模式挖掘方法
时空相关性融合表征的知识追踪模型
基于查询语义特性的稠密文本检索模型
两种高效局部搜索算法求解RB模型实例
一种基于图神经网络的改进邻域搜索算法
渐进式分组狩猎的灰狼优化算法及其工程应用
一种应用于旅行商问题的莱维飞行转移规则蚁群优化算法
基于图嵌入和多标签传播的重叠社区检测算法
基于改进MOEAD算法的主从式PID控制器参数寻优
一种基于多层次校验的低恢复成本纠删码
基于用户密度和平均访问时间的边缘服务器放置方法
基于轨迹引导的移动机器人导航策略优化算法
多搬运任务下考虑碰撞避免的AGV路径规划
一种基于离散时间一致性理论的多机器人分布式巡逻算法
VECSim:改进iFogSim2的面向车载边缘计算的建模与仿真模拟器
基于时域依赖的编码树单元级零延时码率控制算法
基于高速安全存储SoC芯片的PCIe与SATA通路验证
基于代码注释调优的智能合约自动生成方法
基于近端策略优化算法含碳捕集的综合能源系统低碳经济调度
无人机群场景下边端协同计算卸载技术
去蜂窝大规模MIMO辅助的移动边缘计算系统计算任务卸载与分配策略
算力网络下的算力边缘服务器部署算法
基于差分隐私的分段裁剪联邦学习算法
一种基于区块链的医疗数据隐私保护方法
面向去中心化存储的数据流行度去重模型
面向多模态交互式融合与渐进式优化的三维视觉理解
基于多模态特征频域融合的零样本指称图像分割
结合细粒度自注意力的实例图像着色
FFDNet:复杂环境中的细粒度面部表情识别
融合背景上下文特征的视觉情感识别与预测方法
基于特征调节器和双路径引导的RGB-D室内语义分割

山东工艺美术学院电子阅览室

异策略模仿-强化学习序列推荐算法

计算机应用研究

2024年第05期

期刊目录

山东工艺美术学院电子阅览室

新用户注册

注册成功

修改电子邮件