摘 要:现有的知识蒸馏技术主要集中于知识表示、目标损失函数和蒸馏位置的选择,而忽视了特征对齐和融合的重要性,从而限制了学生模型的学习能力。为此,提出了一种基于双路径投影层和注意力机制的知识蒸馏方法。该方(试读)...