一種用於三維目標檢測的註意力增強多模態融合方法

作者

  • 葉輝 丁 北方工業大學 作者
  • 運濤 史 北方工業大學 作者

DOI:

https://doi.org/10.70695/AA1202502A18

關鍵詞:

BEV;三維目標檢測;多模態融合

摘要

為了解決自動駕駛中目標檢測精度低的問題,我們提出了一種註意力增強的多模態融合三維目標檢測方法(EA-BEV)。該方法在圖像處理網絡中引入了自註意力機製,能夠有效提取深層特征,減少因語義信息模糊而導致的圖像特征提取不足的問題。在點雲處理網絡中,我們設計了一種高階卷積空間註意力機製,顯著增強了網絡對點雲非線性深層特征的建模和表達能力,從而提高了點雲信息的全局描述能力。我們在nuScenes數據集上進行了對比實驗,結果顯示mAP指標為 76.2%,NDS 指標為 74.4%。EA-BEV方法在三維目標檢測的精度方面表現出明顯的優勢,為自動駕駛的環境感知提供了一種新方法。

作者传记

  • 葉輝 丁, 北方工業大學

    Yehui Ding is currently pursuing the phd degree in Control Science and Engineering at the School of Electrical and Control Engineering, North China University of Technology, Beijing, China. His research interests focus on environmental perception for autonomous driving, including computer vision, object detection, and multimodal perception.

  • 運濤 史, 北方工業大學

    Yuntao Shi is a professor, master's student advisor, and doctoral student advisor at the School of Electrical and Control Engineering, North China University of Technology, Beijing, China. His research interests include cloud computing, the industrial internet, and environmental perception for autonomous driving.

已發表

2025-06-30