• 简体   /   繁体
基于双路径投影层和注意力机制的知识蒸馏-计算机应用研究2025年02期

基于双路径投影层和注意力机制的知识蒸馏

作者:周勤 范永胜 桑彬彬 何攀 字体:      

摘 要:现有的知识蒸馏技术主要集中于知识表示、目标损失函数和蒸馏位置的选择,而忽视了特征对齐和融合的重要性,从而限制了学生模型的学习能力。为此,提出了一种基于双路径投影层和注意力机制的知识蒸馏方法。该方(试读)...

计算机应用研究

2025年第02期