融合激光雷達與圖像等多模態感知智能機器人軌跡決策方法研究
DOI:
https://doi.org/10.70695/IAAI202504A12關鍵詞:
Multimodal Perception; LiDAR-image Fusion; Trajectory Decision; Reinforcement Learning; Model Predictive Control摘要
複雜場景裏,單一傳感器感知不穩定,軌跡規劃缺少安全約束,而且存在多元協同方面的問題。為了應對這些問題,本文提出了結合激光雷達和圖像的智能機器人軌跡決策方法,形成了多模態感知體係,該體系需要包含機器人平臺,並做好外參標定並實現時間同步,從統一的 BEV視角出發來設計LiDAR–Image特徵獲取及注意力融合網絡,進而進生成既關注幾何又重視語義的環境代價圖。進而基於該代價圖構建RL/MPC軌跡決策模型,並引入機會約束與動態邊界以確保安全裕度。仿真和實機實驗室包含了室內走廊,辦公區域以及人羣聚集的地方。結果顯示,多模態方案在mAP,距離RMSE,最小障礙距離以及任務達成率這些指標上都比DWA和單模態RL更好,而且它還能在嵌入式平臺上持續運行,這表明所提方法有效具備工程應用的價值。