智駕網(wǎng) 2025-06-13 10:57
元戎啟行周光:攜手火山引擎,基于豆包大模型打造物理世界Agent
分享
周光表示:“VLA的四大核心功能,相當(dāng)于為AI汽車(chē)增加‘透視眼’‘百事通’‘翻譯官’‘應(yīng)答靈’等屬性,讓AI汽車(chē)更全面地了解駕駛環(huán)境,準(zhǔn)確預(yù)測(cè)潛在駕駛危險(xiǎn)因素,顯著提升輔助駕駛的安全性?!?/div>

6月11日,元戎啟行CEO周光受邀出席2025年火山引擎Force原動(dòng)力大會(huì),宣布元戎啟行將攜手火山引擎,基于豆包大模型,共同研發(fā)VLA等前瞻技術(shù),打造物理世界的Agent。


同時(shí),周光宣布元戎啟行的VLA模型將于2025年第三季度推向消費(fèi)者市場(chǎng),并展示了VLA模型的四大功能——空間語(yǔ)義理解、異形障礙物識(shí)別、文字類(lèi)引導(dǎo)牌理解、語(yǔ)音控車(chē),功能將隨量產(chǎn)逐步釋放。

 

image.png 

▲元戎啟行CEO周光

 

周光表示:“VLA的四大核心功能,相當(dāng)于為AI汽車(chē)增加‘透視眼’‘百事通’‘翻譯官’‘應(yīng)答靈’等屬性,讓AI汽車(chē)更全面地了解駕駛環(huán)境,準(zhǔn)確預(yù)測(cè)潛在駕駛危險(xiǎn)因素,顯著提升輔助駕駛的安全性。”

 

空間語(yǔ)義理解:駕駛“透視眼”


VLA模型能夠全維度解構(gòu)駕駛環(huán)境,精準(zhǔn)破解橋洞通行、公交車(chē)遮擋視野等動(dòng)靜態(tài)駕駛盲區(qū)場(chǎng)景駕駛風(fēng)險(xiǎn)。

例如,在通過(guò)無(wú)紅綠燈的路口時(shí),VLA模型能提前識(shí)別到“注意橫穿,減速慢行”的指示牌,即使公交車(chē)通行造成動(dòng)態(tài)盲區(qū),VLA也會(huì)結(jié)合公交車(chē)的動(dòng)作去做出準(zhǔn)確的決策。當(dāng)公交車(chē)進(jìn)行減速時(shí),它會(huì)通過(guò)推理前方可能有行人穿行,并做出“立即減速、注意風(fēng)險(xiǎn)、謹(jǐn)慎通行”的決策。

 

image.png 

▲公交車(chē)動(dòng)態(tài)盲區(qū)遮擋

 

異形障礙物識(shí)別:駕駛“百事通”


VLA模型是一個(gè)超級(jí)學(xué)霸,它通過(guò)互聯(lián)網(wǎng)迅速獲取知識(shí)并轉(zhuǎn)換成自己的經(jīng)驗(yàn),有自己的駕駛“知識(shí)庫(kù)”,對(duì)駕駛過(guò)程中出現(xiàn)的各類(lèi)障礙物了如指掌,準(zhǔn)確判斷潛在危險(xiǎn)因素,行駛更安全。例如,VLA模型能夠識(shí)別“變形”的超載小貨車(chē),結(jié)合實(shí)際路況,執(zhí)行減速繞行或靠邊駕駛。

 

image.png 

▲異形障礙物識(shí)別

 

文字引導(dǎo)牌理解:駕駛“翻譯官”


搭載VLA模型的AI 汽車(chē)不僅能 “看見(jiàn)” 道路標(biāo)識(shí),更能 “讀懂” 文字背后的通行規(guī)則,解析復(fù)雜路況里蘊(yùn)含的路況信息,讓復(fù)雜路況決策如 “開(kāi)卷考試” 般從容。面對(duì)左轉(zhuǎn)待行區(qū)、可變車(chē)道、潮汐車(chē)道等 “動(dòng)態(tài)規(guī)則路段”,VLA模型能夠讀懂字符與圖標(biāo)的含義,高效匹配實(shí)時(shí)路況。在多車(chē)道復(fù)雜路口選道直行的場(chǎng)景中,能夠準(zhǔn)確識(shí)別車(chē)輛前方的文字及圖案標(biāo)識(shí)牌,從左轉(zhuǎn)右轉(zhuǎn)混雜的路口準(zhǔn)確找到左轉(zhuǎn)車(chē)道,并執(zhí)行操作。

 

image.png 

特殊路標(biāo)識(shí)別

 

語(yǔ)音交互控車(chē):駕駛“應(yīng)答靈”


通過(guò)VLA模型,AI汽車(chē)可以與用戶(hù)高效交流,根據(jù)語(yǔ)音指令做出對(duì)應(yīng)的駕駛決策,隨叫隨應(yīng),交互更擬人,體驗(yàn)更舒適。并且當(dāng)用戶(hù)意愿與導(dǎo)航信息相沖突時(shí),VLA模型會(huì)優(yōu)先采納用戶(hù)意愿。

 

image.png 

▲語(yǔ)音控車(chē)指令

 

目前,元戎啟行已完成VLA模型的真實(shí)道路測(cè)試,預(yù)計(jì)今年將有超5款搭載元戎啟行VLA模型的AI汽車(chē)陸續(xù)推入市場(chǎng)。其中,VLA模型支持激光雷達(dá)方案與純視覺(jué)方案,將率先搭載在NVIDIA Drive Thor芯片上,后續(xù)元戎啟行還將通過(guò)技術(shù)優(yōu)化,讓VLA模型可以適配更多芯片平臺(tái)。

 

火山引擎汽車(chē)總經(jīng)理、智慧出行和具身研究院院長(zhǎng)楊立偉表示:“元戎啟行作為業(yè)內(nèi)率先推出VLA模型的企業(yè)之一,對(duì)人工智能的理解極為深刻。火山引擎作為行業(yè)領(lǐng)先的云服務(wù)提供商,在云計(jì)算領(lǐng)域擁有深厚的技術(shù)實(shí)力和豐富的經(jīng)驗(yàn)。我們非常期待與元戎啟行攜手合作,共同推動(dòng)基于豆包大模型的物理世界Agent的落地應(yīng)用,助力智慧出行領(lǐng)域的創(chuàng)新發(fā)展?!?/p>

 

周光強(qiáng)調(diào):“VLA模型作為當(dāng)下最先進(jìn)的AI技術(shù),可以連接視覺(jué)、語(yǔ)言、動(dòng)作等多種模態(tài),打通物理世界與數(shù)字世界的壁壘,具有完善的任務(wù)規(guī)劃和執(zhí)行能力,是實(shí)現(xiàn)物理世界 agent 的關(guān)鍵技術(shù)。元戎啟行很高興能夠與火山引擎達(dá)成合作,基于VLA模型共同打造物理世界的Agent,讓雙方的先進(jìn)技術(shù)在物理世界的各個(gè)領(lǐng)域落地,推動(dòng)生產(chǎn)力進(jìn)階?!?/p>

x

收藏 1
打賞
相關(guān)標(biāo)簽:
電話(huà):010-65030507
郵箱:editor@autor.com.cn
地址:北京市朝陽(yáng)區(qū)朝外大街乙6號(hào)朝外SOHO D座5097室
北京智駕時(shí)代傳媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版權(quán)所有 AutoR智駕 智能汽車(chē)網(wǎng)
京ICP備14027737號(hào)-1      京公網(wǎng)安備 11010502038466號(hào)
電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證:京B-20211307
關(guān)注官方微信