一种用于三维目标检测的注意力增强多模态融合方法

作者

  • 叶辉 丁 北方工业大学 作者
  • 运涛 史 北方工业大学 作者

DOI:

https://doi.org/10.70695/AA1202502A18

关键词:

BEV;三维目标检测;多模态融合

摘要

为了解决自动驾驶中目标检测精度低的问题,我们提出了一种注意力增强的多模态融合三维目标检测方法(EA-BEV)。该方法在图像处理网络中引入了自注意力机制,能够有效提取深层特征,减少因语义信息模糊而导致的图像特征提取不足的问题。在点云处理网络中,我们设计了一种高阶卷积空间注意力机制,显著增强了网络对点云非线性深层特征的建模和表达能力,从而提高了点云信息的全局描述能力。我们在nuScenes数据集上进行了对比实验,结果显示mAP指标为 76.2%,NDS 指标为 74.4%。EA-BEV方法在三维目标检测的精度方面表现出明显的优势,为自动驾驶的环境感知提供了一种新方法。

作者传记

  • 叶辉 丁, 北方工业大学

    Yehui Ding is currently pursuing the phd degree in Control Science and Engineering at the School of Electrical and Control Engineering, North China University of Technology, Beijing, China. His research interests focus on environmental perception for autonomous driving, including computer vision, object detection, and multimodal perception.

  • 运涛 史, 北方工业大学

    Yuntao Shi is a professor, master's student advisor, and doctoral student advisor at the School of Electrical and Control Engineering, North China University of Technology, Beijing, China. His research interests include cloud computing, the industrial internet, and environmental perception for autonomous driving.

已发布

2025-06-30

如何引用

丁叶., & 史运. (2025). 一种用于三维目标检测的注意力增强多模态融合方法. 人工智能应用创新, 2(2), 61-69. https://doi.org/10.70695/AA1202502A18