• 简体   /   繁体
面向图像文本的多模态处理方法综述-计算机应用研究2024年05期

面向图像文本的多模态处理方法综述

作者:姜丽梅 李秉龙 字体:      

摘 要:在深度学习领域,解决实际应用问题往往需要结合多种模态信息进行推理和决策,其中视觉和语言信息是交互过程中重要的两种模态。在诸多应用场景中,处理多模态任务往往面临着模型架构组织方式庞杂、训练方法效率(试读)...

计算机应用研究

2024年第05期