基于图嵌入编码形态信息的非均匀多任务强化学习方法-计算机应用研究2024年04期

基于图嵌入编码形态信息的非均匀多任务强化学习方法

作者：贺晓　王文学字体：小中大

打印

摘要：传统强化学习方法存在效率低下、泛化性能差、策略模型不可迁移的问题。针对此问题，提出了一种非均匀多任务强化学习方法，通过学习多个强化任务提升效率和泛化性能，将智能体形态构建为图，利用图神经网络能处（试读）...

计算机应用研究

2024年第04期

期刊目录

卷积神经网络的正则化方法综述
车联网安全标准综述
一种监管友好的可编辑区块链方案
基于节点动态评分机制的分组共识算法
CS－Raft:适用于联盟链的拜占庭容错共识算法
基于特征增强与时空信息嵌入的涡扇发动机剩余寿命预测
模型未知的离散事件系统故障诊断方法
基于申威NMII的锁死故障监测与诊断
基于图嵌入编码形态信息的非均匀多任务强化学习方法
基于Informer算法的网联车辆运动轨迹预测模型
TRGATLog：基于日志时间图注意力网络的日志异常检测方法
基于周期图卷积与多头注意力GRU组合的交通流量预测模型
一种基于信息熵加权的属性约简算法
基于任务权重自动优化的多任务序数回归算法
基于网格近邻优化的密度峰值聚类算法
基于时效性和相关性约束的周期模式挖掘
基于可重构阵列的CNN数据量化方法
融合小生境机制的增强麻雀搜索算法及其应用
融入武装部队的鲸鱼优化算法用于社区发现
MCI患者高阶动态功能连接的图论网络构建方法及分类
二级垃圾回收中转设施选址问题的降阶回溯算法
基于双分支注意力U－Net的语音增强方法
改进双向动态JPS算法的移动机器人全局路径规划
基于对比学习的心电信号情绪识别方法
基于模态语义增强的跨模态食谱检索方法
面向降雨预报的雷达回波预测序列外推方法
移动边缘计算中的无人机三维部署和内容缓存优化方法
基于联邦共识机制的多视频流带宽分配策略
智能反射面辅助的OFDM系统稀疏信道估计研究
基于进化多任务多目标优化的边缘计算任务卸载
一种基于联邦学习参与方的投毒攻击防御方法
基于JPEG图像的模块化可逆信息隐藏方法
多级敏感区域室内定位中的隐私保护算法
适用于智能家居的格上基于身份多方认证密钥协商协议
面向电力物联网流数据的一种具有隐私保护的KNN查询方法
边缘辅助群智感知位置隐私保护多任务分配机制
结合注意力机制与多尺度特征融合的视频彩色化方法
TCSNGAN:基于Transformer和谱归一化CNN的图像生成模型
基于可靠性集成的无监督域自适应行人重识别
基于形变估计与运动补偿的医学CT图像层间超分辨率算法
基于二重语义相关性图卷积网络的跨模态检索方法
基于多传感信息融合的语义词袋SLAM优化算法
改进视觉Transformer的视频插帧方法
AF－CenterNet:基于交叉注意力机制的毫米波雷达和相机融合的目标检测
基于卷积胶囊编码器和多尺度局部特征共现的图像分割网络
基于视觉强化学习的数字芯片全局布局方法
基于颜色编码和图像隐写术的可逆灰度方法

山东工艺美术学院电子阅览室

基于图嵌入编码形态信息的非均匀多任务强化学习方法

计算机应用研究

2024年第04期

期刊目录

山东工艺美术学院电子阅览室

新用户注册

注册成功

修改电子邮件