成果介绍
本发明属于计算机视觉以及自然语音处理技术领域,具体涉及一种基于融合注意力机制的图像识别方法,包括:获取待识别的图像,将待识别图像输入到图像描述模型中,首先进行初始特征提取,分别采用通道注意力机制和空间注意力机制对初始特征图进行加权处理,并进行特征融合;
成果亮点
采用两层长短期记忆网络对融合特征图进行识别解码,得到图像描述结果;本发明提出了使用两层长短期记忆网络融合多头注意力机制解决特征解码不准确的问题,提升了生成单词的准确性,提升图像描述模型的整体性能。
团队介绍
陈善学,林家镔
成果资料