2025-06-16 12:41
對(duì)話地瓜機(jī)器人:復(fù)刻地平線的成功,做機(jī)器人時(shí)代的Wintel
分享
地瓜機(jī)器人發(fā)布的新款算控一體開發(fā)平臺(tái)RDK S100與英偉達(dá)的產(chǎn)品算力相同,價(jià)格卻只有一半。地瓜機(jī)器人要做的事,一定程度上可以看作地平線在具身智能機(jī)器人領(lǐng)域復(fù)刻其成功路徑。
今時(shí)今日,人形機(jī)器人領(lǐng)域的競(jìng)爭(zhēng),正從被過度聚焦的千姿百態(tài)的機(jī)器人形象本體擴(kuò)展到構(gòu)建具身智能產(chǎn)業(yè)的基礎(chǔ)設(shè)施。

不久前,摩根史坦利在一份針對(duì)中國(guó)具身智能產(chǎn)業(yè)的報(bào)告中指出,除了「大腦」(即芯片)部分仍依賴于國(guó)外高端 AI 芯片,人形機(jī)器人幾乎所有的身體部件都可以在中國(guó)國(guó)內(nèi)生產(chǎn)。

具身智能市場(chǎng)期待著中國(guó)團(tuán)隊(duì)在AI芯片領(lǐng)域迎來破局。

作為從中國(guó)明星智駕芯片公司地平線孵化出的機(jī)器人團(tuán)隊(duì),地瓜機(jī)器人在6月11日正式對(duì)外發(fā)布了新款算控一體開發(fā)平臺(tái)RDK S100。以2499元限時(shí)定價(jià)提供百TOPS級(jí)異構(gòu)算力(集成CPU/BPU/MCU),并搭載開箱即用的全套開發(fā)工具鏈。

只需10分鐘就能體驗(yàn)到所有核心AI功能。地瓜機(jī)器人開發(fā)者生態(tài)副總裁胡春旭表示。

圖片

RDK S100其技術(shù)核心在于創(chuàng)新的大小腦異構(gòu)架構(gòu)——通過單顆SoC集成三類計(jì)算單元并實(shí)現(xiàn)功能協(xié)同:

大腦系統(tǒng)采用6核CPU處理復(fù)雜邏輯調(diào)度,搭配新一代自研"納什"架構(gòu)BPU(專為CNN/Transformer優(yōu)化),提供80TOPS(S100)或128TOPS(S100P)AI推理算力;

小腦系統(tǒng)則由4枚Cortex-R52+核心構(gòu)成獨(dú)立MCU,以鎖步模式(Lock-Step)運(yùn)行確保高實(shí)時(shí)運(yùn)動(dòng)控制與功能安全。

圖片

地瓜機(jī)器人表示,經(jīng)算法-芯片聯(lián)合調(diào)優(yōu),該架構(gòu)展現(xiàn)出顯著性能突破:運(yùn)動(dòng)控制算法經(jīng)BPU加速后,推理效率較純CPU方案提升超百倍;前沿操作策略模型(如Diffusion Policy優(yōu)化版)在同等硬件環(huán)境下亦實(shí)現(xiàn)10倍以上效能躍升。

圖片

同時(shí),2499元的這一價(jià)格幾乎只有英偉達(dá)同等算力水平方案的一半。

而能做到這一點(diǎn)的原因,離不開地平線內(nèi)部資源的復(fù)用,以及成熟的產(chǎn)業(yè)鏈經(jīng)驗(yàn),使其可有效控制SoC成本。

據(jù)介紹,這款新發(fā)布的RDK S100在正式亮相前,已經(jīng)與超過20家具身智能領(lǐng)域頭部客戶建立了合作,并獲得了超過50家合作伙伴展開測(cè)評(píng)。

此前,地瓜機(jī)器人已經(jīng)發(fā)布過兩款機(jī)器人芯片,算力接近10TOPS,主要服務(wù)于使用中低算力的掃地機(jī)器人、割草機(jī)等機(jī)器人。

此次發(fā)布的 RDK S100意味著第一次將算力提高到上百TOPS級(jí)別,可以滿足更高階具身智能機(jī)器人的使用。

在現(xiàn)場(chǎng)演示環(huán)節(jié),地瓜機(jī)器人使用 RDK S100 連接了宇樹機(jī)器人,用 RDK S100 的算力實(shí)現(xiàn)了機(jī)器人跳舞;在求之科技AIRBOT機(jī)械臂上,一個(gè)機(jī)器人用RDK S100 的算力則實(shí)現(xiàn)了對(duì)桌上物品的識(shí)別和抓取。

圖片

地瓜機(jī)器人剛剛完成1億美元A輪融資,但其目標(biāo)并不是加入具身智能產(chǎn)品的競(jìng)爭(zhēng)中去,其定位與地平線在智能汽車行業(yè)的定位相似,成為機(jī)器人時(shí)代的Wintel,打造機(jī)器人時(shí)代的CUDA。

圖片

生態(tài)是科技公司的護(hù)城河,地平線已經(jīng)在自動(dòng)駕駛領(lǐng)域證明過這一點(diǎn)。

現(xiàn)在,地瓜機(jī)器人要做的事,一定程度上可以看作地平線在具身智能機(jī)器人領(lǐng)域復(fù)刻其成功路徑。

圖片

在這場(chǎng)發(fā)布會(huì)上,《深度AI》與地瓜機(jī)器人開發(fā)者、生態(tài)副總裁胡春旭進(jìn)行了對(duì)話:

01.

做類似英偉達(dá) CUDA的機(jī)器人生態(tài)

Q:地瓜的定位為什么聚焦在機(jī)器人套件和計(jì)算中心,而非直接制造機(jī)器人本體?

胡春旭:我們團(tuán)隊(duì)的核心背景來自自動(dòng)駕駛領(lǐng)域?;仡欁詣?dòng)駕駛的發(fā)展歷程,以及更早的計(jì)算機(jī)和手機(jī)時(shí)代,一個(gè)清晰的規(guī)律是:當(dāng)一個(gè)行業(yè)(如汽車智能化)即將迎來爆發(fā)性增長(zhǎng)時(shí),其底層支撐技術(shù)必然走向標(biāo)準(zhǔn)化平臺(tái)化。Wintel聯(lián)盟(Windows + Intel)之于PC,ARM+Android之于手機(jī),都是經(jīng)典例證。底層標(biāo)準(zhǔn)化是支撐上層應(yīng)用繁榮和行業(yè)規(guī)模擴(kuò)張的關(guān)鍵基礎(chǔ)設(shè)施。

在地平線的時(shí)候,我們就致力于構(gòu)建生態(tài)和平臺(tái)。進(jìn)入機(jī)器人領(lǐng)域后,我們延續(xù)了這一核心思想——堅(jiān)持做底層的、支撐性的平臺(tái)。這就是為什么我們選擇聚焦于套件和計(jì)算中心,而非直接下場(chǎng)做本體。

Q:您提到機(jī)器人行業(yè)還在初期,那地瓜選擇現(xiàn)在這個(gè)時(shí)機(jī)切入底層平臺(tái)建設(shè),是基于什么判斷?

胡春旭:機(jī)器人行業(yè)目前仍處于早期階段,但放眼未來10年、20年,它必將迎來爆炸式增長(zhǎng)。伴隨這種增長(zhǎng),行業(yè)內(nèi)部一定會(huì)分化出類似Wintel這樣的角色,提供標(biāo)準(zhǔn)化的核心平臺(tái)(包括硬件套件和計(jì)算中心)。

Q:地瓜提機(jī)器人母生態(tài)目標(biāo),而英偉達(dá)通過CUDA構(gòu)建AI生態(tài)并側(cè)重云端(如Omniverse),地瓜則聚焦端側(cè)落地。如何將端側(cè)差異化轉(zhuǎn)化為生態(tài)護(hù)城河?是否擔(dān)心英偉達(dá)Omniverse+邊緣芯片的組合擠壓空間?

胡春旭:現(xiàn)階段我們與英偉達(dá)更多是互補(bǔ)協(xié)作而非直接競(jìng)爭(zhēng)。英偉達(dá)的核心優(yōu)勢(shì)在云端算力(如Omniverse訓(xùn)練仿真),而地瓜專注解決未來海量機(jī)器人終端的本地化智能需求與高效端側(cè)算力平臺(tái)。我們主動(dòng)融入現(xiàn)有生態(tài)——利用Omniverse進(jìn)行模型訓(xùn)練,同時(shí)通過自研工具鏈實(shí)現(xiàn)模型到地瓜端側(cè)平臺(tái)的無縫、高效遷移,以大幅降低開發(fā)者成本。

02.

大小腦是機(jī)器人走向具身智能的更可行方案

Q:汽車智駕當(dāng)下最新的技術(shù)方案是世界模型,機(jī)器人領(lǐng)域是什么?如何看待世界模型技術(shù)在機(jī)器人領(lǐng)域的應(yīng)用?

胡春旭:地瓜機(jī)器人是從地平線孵化出來的團(tuán)隊(duì),所以繼承了很多汽車上的技術(shù)和Know-how。這些經(jīng)驗(yàn)放在機(jī)器人行業(yè)看,我覺得都是有效的。具身機(jī)器人的技術(shù)演變邏輯與智駕之間有很多相似之處,但區(qū)別在于汽車的驗(yàn)證進(jìn)度要比機(jī)器人要快。原因主要是汽車場(chǎng)景的數(shù)據(jù)獲取成本比機(jī)器人低得多。

機(jī)器人未來的演進(jìn)路徑,可能也會(huì)類似汽車智駕L1-L5等級(jí)。目前汽車大概是在L2-L3之間,機(jī)器人可能相對(duì)滯后一點(diǎn)。假設(shè)機(jī)器人L5是真正的AGI,那L5的機(jī)器人會(huì)替代其他機(jī)器人嗎?我們覺得不會(huì),L2-L5機(jī)器人之間應(yīng)該是并存的關(guān)系??赡軈^(qū)別是機(jī)器人的L4-L5是端到端、世界模型的方式驅(qū)動(dòng)智能,L2-L3還是分段式。

回到RDK S100上來,我們的定位肯定不是一步到位。畢竟100TOPS級(jí)的算力,做不到端到端大模型的算力支持。我們現(xiàn)在的定位,更多是為了解決機(jī)器人L2-L3分段式模型的技術(shù)路徑。

Q:參考汽車智駕分類體系,機(jī)器人不同等級(jí)應(yīng)該有什么樣的能力,分別對(duì)應(yīng)多少算力配置?

胡春旭:我個(gè)人判斷的話,類比汽車L2+需要400TOPS、L3需要1000TOPS算力,機(jī)器人需要的算力分級(jí)可能會(huì)比汽車的需求高50%-100%。類比汽車L2+,機(jī)器人可能需要600-800TOPS算力。這是因?yàn)闄C(jī)器人AI面臨的任務(wù)復(fù)雜度比汽車高得多。但算力也不是越大越好,因?yàn)樗惴ê湍P偷男室蚕喈?dāng)重要。所以并不能完全說800TOPS算力支持的模型效率就比400TOPS高一倍。整體看來,我認(rèn)為機(jī)器人L1-L5之間對(duì)應(yīng)的算力大概會(huì)有一個(gè)相對(duì)值,但具體是多少,現(xiàn)在其實(shí)沒有形成共識(shí)。

Q:當(dāng)前機(jī)器人行業(yè)熱議「大小腦融合,是否所有機(jī)器人都需要該方案?哪類場(chǎng)景會(huì)率先落地?

胡春旭:我們認(rèn)為大小腦的方式一定不是所有機(jī)器人都會(huì)有的,如果對(duì)應(yīng)到G1到G5階段,我們認(rèn)為從G2到G3,在G3整個(gè)Level里都是大小腦協(xié)同的方式。但是到G4和G5,是以端到端的方式,那輸入就是各種多模態(tài)視覺的信號(hào),輸出直接到明確帶時(shí)間戳的關(guān)節(jié)信息,直接產(chǎn)生運(yùn)動(dòng)了,這才能叫端到端。所以目前整個(gè)兩種技術(shù)流派中,在短期內(nèi)能夠有落地快速可能性的是大小腦模型。

具象化到我們的場(chǎng)景來看,100T算力對(duì)應(yīng)到的幾個(gè)場(chǎng)景,一個(gè)是商業(yè)化清潔,一個(gè)是低速物流的車,有可能是在園區(qū)跑的,有可能是在室外跑的,類似于配送這種場(chǎng)景;也有可能是四足類的機(jī)器人,做一些巡檢的工作。這種場(chǎng)景既滿足場(chǎng)景相對(duì)可控,是一個(gè)比較結(jié)構(gòu)化的場(chǎng)景,又滿足算力要求相對(duì)沒有特別大。所以從成本、功耗到功能,他能夠在短期內(nèi)最容易達(dá)到一個(gè)相對(duì)均衡產(chǎn)品化規(guī)模的可能性,所以我們認(rèn)為這種場(chǎng)景會(huì)更合適,所以這也是反推我們先推出RDK S100 SoC的原因。

Q:數(shù)據(jù)和算法是機(jī)器人開發(fā)的兩大難題,地瓜如何幫助開發(fā)者,尤其是小團(tuán)隊(duì)解決這些問題?

胡春旭 大家都在面臨數(shù)據(jù)的問題,大概的解決辦法有兩大類。

第一大類是沒有數(shù)據(jù),就去產(chǎn)生數(shù)據(jù)。我們內(nèi)部會(huì)做一個(gè)云平臺(tái),核心功能就是去產(chǎn)生數(shù)據(jù)。比如一個(gè)國(guó)內(nèi)公司做海外業(yè)務(wù),沒有海外的數(shù)據(jù),沒問題,我們通過云平臺(tái),基于大模型輸入一些prompt,就可以產(chǎn)生一千張、一萬張甚至更多的數(shù)據(jù)來支持他做訓(xùn)練。我們也會(huì)有大模型的方式來做自動(dòng)化標(biāo)注。整個(gè)過程提供一套完整的工具鏈。

第二種方式,是通過盡量小的數(shù)據(jù)讓模型泛化程度更高。比如抓取,市面上主流的方式叫GraspNet,我們算法團(tuán)隊(duì)會(huì)對(duì)這個(gè)模型做充分的優(yōu)化、改造,做完之后能夠跑到非常高的效率,同時(shí)我們把結(jié)果通過開源的方式分享出去。這樣開發(fā)者就不用再從頭做訓(xùn)練、數(shù)據(jù)采集了,只需要基于我們的模型,把它當(dāng)成一個(gè)Foundation Model,結(jié)合他的業(yè)務(wù)場(chǎng)景做一些調(diào)優(yōu)。我們?cè)?span id="acj4n4f" class="">ModelZoo里面現(xiàn)在提供了100多種類似這樣的模型。

03.

答案不在舊地圖上

Q:地瓜機(jī)器人現(xiàn)在與地平線如何合作推進(jìn)具身智能?雙方是獨(dú)立運(yùn)營(yíng)還是存在更緊密的協(xié)同?

胡春旭:兩家公司在技術(shù)淵源上緊密關(guān)聯(lián)。地平線機(jī)器人實(shí)驗(yàn)室專注前沿研究(如四足/人形機(jī)器人),地瓜則與其開展深度算法合作——例如本次展示的人形舞蹈算法即由雙方聯(lián)合開發(fā):地平線提供通用框架,地瓜貢獻(xiàn)行業(yè)know-how與部署經(jīng)驗(yàn),共同推動(dòng)技術(shù)落地。

Q:從智能駕駛到機(jī)器人,既有掃地機(jī)等消費(fèi)場(chǎng)景的降維,也面臨具身智能(如人形機(jī)器人復(fù)雜任務(wù))的升維挑戰(zhàn)。這些升維挑戰(zhàn)如何破解?

胡春旭:現(xiàn)在升維這部分最大的挑戰(zhàn)是數(shù)據(jù),因?yàn)檐噲?chǎng)景里數(shù)據(jù)的獲取成本相對(duì)較低,有大量車在跑了,他有不斷的數(shù)據(jù)可以進(jìn)來,但機(jī)器人數(shù)據(jù)很少,這是一個(gè)核心卡點(diǎn),所以我們會(huì)通過很多種方式來解決數(shù)據(jù)的問題。

我們認(rèn)為目前機(jī)器人在某些點(diǎn)還沒有單點(diǎn)突破的一個(gè)很重要原因是,他沒有把需求真正提煉出來,這時(shí)候地瓜機(jī)器人的角色很特別,我們是在布局整個(gè)生態(tài),所以我們會(huì)看到各種各樣的開發(fā)者、需求,以及國(guó)內(nèi)和海外不同化場(chǎng)景,因此我們會(huì)將提煉后的行業(yè)判斷輸出給生態(tài)伙伴,針對(duì)性解決其落地痛點(diǎn),例如優(yōu)先攻克封閉場(chǎng)景中運(yùn)動(dòng)規(guī)劃、多模態(tài)感知等關(guān)鍵模塊。


x

收藏 0
打賞
相關(guān)標(biāo)簽:
電話:010-65030507
郵箱:editor@autor.com.cn
地址:北京市朝陽區(qū)朝外大街乙6號(hào)朝外SOHO D座5097室
北京智駕時(shí)代傳媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版權(quán)所有 AutoR智駕 智能汽車網(wǎng)
京ICP備14027737號(hào)-1      京公網(wǎng)安備 11010502038466號(hào)
電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證:京B-20211307
關(guān)注官方微信