一种用于三维目标检测的注意力增强多模态融合方法
DOI:
https://doi.org/10.70695/AA1202502A18关键词:
BEV;三维目标检测;多模态融合摘要
为了解决自动驾驶中目标检测精度低的问题,我们提出了一种注意力增强的多模态融合三维目标检测方法(EA-BEV)。该方法在图像处理网络中引入了自注意力机制,能够有效提取深层特征,减少因语义信息模糊而导致的图像特征提取不足的问题。在点云处理网络中,我们设计了一种高阶卷积空间注意力机制,显著增强了网络对点云非线性深层特征的建模和表达能力,从而提高了点云信息的全局描述能力。我们在nuScenes数据集上进行了对比实验,结果显示mAP指标为 76.2%,NDS 指标为 74.4%。EA-BEV方法在三维目标检测的精度方面表现出明显的优势,为自动驾驶的环境感知提供了一种新方法。
已发布
2025-06-30
如何引用
丁叶., & 史运. (2025). 一种用于三维目标检测的注意力增强多模态融合方法. 人工智能应用创新, 2(2), 61-69. https://doi.org/10.70695/AA1202502A18