面向动态三维迷宫的综合奖励设计-计算机应用研究2024年06期

面向动态三维迷宫的综合奖励设计

作者：焦昌成王少威字体：小中大

打印

摘要：动态三维迷宫是较为困难的、具有不确定性和不完全信息的强化学习任务环境，使用常规奖励函数在此环境中训练任务，速度缓慢甚至可能无法完成。为解决利用强化学习在动态迷宫中寻找多目标的问题，提出一种基于事（试读）...

计算机应用研究

2024年第06期

期刊目录

强化学习的可解释方法分类研究
面向分布式复杂数据样本的联邦语义分割方法综述
大规模智慧交通信号控制中的强化学习和深度强化学习方法综述
基于信誉机制的改进PBFT共识算法
区块链预言机节点选择的深度强化学习中间件
基于相对距离和历史成功率机制的增强麻雀搜索算法
基于改进粒子群算法的机械臂能耗轨迹优化
基于自适应交叉与协方差学习的改进平衡优化器算法
基于自变量简约的大规模稀疏多目标优化
基于改进双档案多目标进化算法的柔性作业车间批量流混排调度
图文语义增强的多模态命名实体识别方法
基于双层图注意力网络的邻域信息聚合实体对齐方法
基于空间注意力图的知识蒸馏算法
面向动态三维迷宫的综合奖励设计
考虑实时订单更新的拼车调度双层规划模型
基于测距与GNSS信息融合的车联网协同定位技术
一种二进制癌症单驱动通路识别模型和算法
基于GPU的zk-SNARK中多标量乘法的并行计算方法
面向简化规则的集成学习模型及规则约简策略
基于自适应重加权和正则化的集成元学习算法
基于鲁棒和可靠对称交叉熵的测试时适应算法
基于行为轮廓矩阵增强的业务流程结果预测方法
困难样本采样联合对比增强的深度图聚类
基于双层解码的多轮情感对话生成模型
基于TransMP模型的Web系统剩余寿命预测方法
基于深度学习的融合流程多视角行为分析:预测业务流程监控
基于深度强化学习的电子政务云动态化任务调度方法
快速视频去雾改进算法的FPGA实现
考虑多源供能波动性的企业生产运作与能源计划耦合优化
非正交多址系统中基于公平性改善的双层挤压迭代功率分配方法
多域网络中基于域间时延博弈的端到端动态协同切片方法
基于深度强化学习的边缘网络内容协作缓存与传输方案研究
非完美频谱感知下认知超密集网络的资源分配
基于可逆神经网络的神经辐射场水印
基于可学习攻击步长的联合对抗训练方法
梯度隐藏的安全聚类与隐私保护联邦学习
基于不经意多项式估值的SM4协同加解密方案
基于内容风格增强和特征嵌入优化的人脸活体检测方法
3D UNeXt:轻量级快速脑提取网络
基于特征级损失和可学习噪声的医学图像域泛化方法
基于局部-全局特征耦合与边界引导的遥感图像建筑物变化检测
基于优化感受野策略的图像修复方法
基于目标图像先验信息的无监督多聚焦图像融合
一种面向机器视觉感知的暗光图像增强网络
基于嵌套剖分的位姿图分层优化算法

山东工艺美术学院电子阅览室

面向动态三维迷宫的综合奖励设计

计算机应用研究

2024年第06期

期刊目录

山东工艺美术学院电子阅览室

新用户注册

注册成功

修改电子邮件