基于改进好奇心的深度强化学习方法-计算机应用研究2024年09期

基于改进好奇心的深度强化学习方法

作者：乔和李增辉刘春胡嗣栋字体：小中大

打印

摘要：

在深度强化学习方法中，针对内在好奇心模块（intrinsic curiosity model，ICM）指导智能体在稀疏奖励环境中获得未知策略学习的机会，但好奇心奖励是一个状态差异值，会使智能体过度关注于对新状态的探索，进（试读）...

计算机应用研究

2024年第09期

期刊目录

基于强化学习的知识图谱推理研究综述
基于区块链技术的医疗信息共享研究综述
混合内存架构下数据放置研究综述
基于强化图卷积和时空循环门的区块链非法交易检测方法
基于SVM的DPoS共识机制改进
面向服务优化组合的云双链结构
基于跨视图原型非对比学习的异构图嵌入模型
CMHICL: 基于跨模态分层交互网络和对比学习的多模态讽刺检测
基于辅助信息与长短期偏好的序列推荐
基于改进好奇心的深度强化学习方法
面向异构数据的个性化联邦多任务学习优化方法
基于时间分段和重组聚类的说话人日志方法
非连通空间对象方向关系表达与推理
基于互信息解决多标签文本分类中的长尾问题
基于提示学习和超球原型的小样本ICD自动编码方法
面向功能语义增强与标签关联的Web服务标签推荐
基于实体级联类型的中文关系抽取管道模型
面向流程偏差根因分析的港口物流流程挖掘方法及应用
基于深度强化学习的单通道EEG信号自动睡眠分期算法
边缘环境下基于移动群智感知计算卸载的数据汇聚
结合精英初始化和K近邻的蛇优化算法
基于新颖二进制人工蜂群算法求解带权集合覆盖问题
基于PPO算法的自动驾驶人机交互式强化学习方法
基于鱼群涌现行为启发的集群机器人硬注意力强化模型
融合人工势场法的动态快速行进树路径规划算法
一种基于共轭次梯度算法的非光滑布图规划方法
扩展帝国竞争算法求解分布式不相关并行机车间调度问题
高效混合预测策略的设计
基于多要素的短临降水预报及可解释性分析
一种引入元路径相似性度量的材料实体检索方法
基于S-MCLSTM和DANN的滚动轴承剩余寿命预测方法
KubeTea:面向容器云环境的轻量级多维度微服务应用调度框架
融合表字段的NL2SQL多任务学习方法
无线传感器网络中一种基于聚合层次聚类的分簇路由算法
基于排队论的一种高吞吐量信道分配协议设计
面向多租户数据中心的联邦学习架构下通信开销优化方法
车联网基于稀疏用户环境的LBS隐私保护方案
基于上下文感知的自适应访问控制模型
抗恶意敌手的线性门限隐私集合交集协议
基于集中注意力接受场网络的偏振成像伪装目标检测
融合双目信息的队列姿态检测
基于全局频域池化的行为识别算法
基于频谱特征混合Transformer的红外和可见光图像融合

山东工艺美术学院电子阅览室

基于改进好奇心的深度强化学习方法

计算机应用研究

2024年第09期

期刊目录

山东工艺美术学院电子阅览室

新用户注册

注册成功

修改电子邮件