近日,廣汽研究院X lab團(tuán)隊在國際權(quán)威的nuScenes自動駕駛測試競賽中,依靠自主研發(fā)的XTracker方法在動態(tài)多目標(biāo)跟蹤MOT(Multi-Object Tracking)領(lǐng)域獲得純視覺榜單全球第一名,并將關(guān)鍵指標(biāo)AMOTA(多目標(biāo)跟蹤平均準(zhǔn)確度)從此前39.8%大幅提升到43.0%。
nuScenes數(shù)據(jù)集是國際公認(rèn)的權(quán)威自動駕駛公開數(shù)據(jù)集之一,數(shù)據(jù)采集自美國波士頓和新加坡的實際自動駕駛場景,是第一個提供360度的全傳感器覆蓋,同時包括攝像頭、激光雷達(dá)和毫米波雷達(dá)數(shù)據(jù)的數(shù)據(jù)集,是唯一提供雷達(dá)數(shù)據(jù)標(biāo)注的數(shù)據(jù)集,覆蓋多種氣候條件及多種道路場景,數(shù)據(jù)集總共包含了1000個場景、140萬幀圖像、39萬幀激光雷達(dá)點(diǎn)云、23個物體類別、140萬個三維標(biāo)注框。
動態(tài)多目標(biāo)跟蹤MOT是對感知數(shù)據(jù)中檢測出的多個動態(tài)目標(biāo)重建運(yùn)動軌跡,以確保隨著時間推移動態(tài)目標(biāo)軌跡ID不變,是自動駕駛中目標(biāo)意圖與軌跡預(yù)測、決策規(guī)劃等下游任務(wù)的重要依賴項,在自動駕駛行車中跟車、變道等場景中起到關(guān)鍵作用。
近年來,隨著自動駕駛的火熱,數(shù)據(jù)、算法、算力成為企業(yè)之間的競爭要塞,一方面參與純視覺3D目標(biāo)跟蹤的團(tuán)隊技術(shù)實力均處于世界先進(jìn)水平,競爭十分激烈,不僅涵蓋了理想汽車、地平線、DeepMotion、Aurora等業(yè)界知名企業(yè),還吸引了麻省理工學(xué)院、卡內(nèi)基·梅隆大學(xué)、清華大學(xué)、復(fù)旦大學(xué)、華中科技大學(xué)等國內(nèi)外重點(diǎn)高校;另一方面,純視覺多目標(biāo)跟蹤需要處理不同光線、視線遮擋、圖像模糊等關(guān)鍵問題。目前業(yè)內(nèi)尚未有成熟的技術(shù)可參照,識別跟蹤速度慢、目標(biāo)運(yùn)動模糊、準(zhǔn)確率低等問題成為行業(yè)共同難點(diǎn)。
廣汽研究院X lab團(tuán)隊提出了XTracker方法,整體上有三大技術(shù)突破:
一是在自動駕駛行業(yè)內(nèi)首次將跟蹤的多視角數(shù)據(jù),通過Transformer統(tǒng)一轉(zhuǎn)換到BEV(Bird's Eye View, 鳥瞰圖)特征空間下,從Decoder輸出聚合后的BEV表征。
二是首個在BEV空間下的端到端跟蹤方法——XTracker,解決了傳統(tǒng)的跟蹤方案主要采用運(yùn)動建?;蛳嗨菩越?,導(dǎo)致檢測和跟蹤之間存在信息流斷點(diǎn),XTracker采用端到端的統(tǒng)一建模方式,使檢測和跟蹤能夠一起訓(xùn)練,結(jié)構(gòu)簡單、高效。
三是結(jié)合自車運(yùn)動和多幀連續(xù)變化的方法,更好地完成時序特征的對齊,提高BEV表征空間下運(yùn)動預(yù)測的魯棒性*。
目前自動駕駛主要分為兩條探索路徑,一條是以攝像頭為主的視覺感知路線,另一條是以激光雷達(dá)為主的多傳感器融合路線。在自動駕駛視覺感知技術(shù)大規(guī)模應(yīng)用過程中,尤其是在汽車對周圍運(yùn)動物體的感知跟蹤領(lǐng)域,動態(tài)多目標(biāo)跟蹤MOT是技術(shù)要求極高的基礎(chǔ)性感知技術(shù)任務(wù),該技術(shù)作為自動駕駛感知部分的必備環(huán)節(jié),將直接影響到自動駕駛系統(tǒng)魯棒性和用戶體驗感。廣汽研究院X lab團(tuán)隊深耕自動駕駛視覺領(lǐng)域,推進(jìn)多目標(biāo)跟蹤技術(shù)在自動駕駛落地場景中的應(yīng)用,助力廣汽智能化升級。
上一篇:理想汽車連云港成立新公司
下一篇:沒有了