
在2025年年初CES的開(kāi)幕演講中,黃仁勛認(rèn)為:「機(jī)器人技術(shù)的ChatGPT時(shí)刻即將到來(lái)?!顾皇滞崎_(kāi)了物理AI的大門,并表示機(jī)器人和智駕是物理AI的兩大應(yīng)用場(chǎng)景。
時(shí)隔三個(gè)月之后,英偉達(dá)GTC2025大會(huì)在圣何塞開(kāi)幕。
這三個(gè)月間,來(lái)自中國(guó)的DeepSeek引發(fā)了一輪算力泡沫爭(zhēng)議。英偉達(dá)在這期間迎來(lái)了多年來(lái)鮮有的一輪股價(jià)大跌。
黃仁勛在GTC2025大會(huì)上回應(yīng)了這一爭(zhēng)議,他強(qiáng)調(diào):「AI推理階段的算力需求將呈現(xiàn)百倍級(jí)增長(zhǎng),'Scaling Law'法則的應(yīng)用重心正從模型預(yù)訓(xùn)練向后訓(xùn)練環(huán)節(jié)遷移?!?/p>
他說(shuō),「由于具身智能和推理的出現(xiàn),我們現(xiàn)在需要的計(jì)算量,比去年這個(gè)時(shí)候認(rèn)為的至少要多100倍?!?br/>
在這場(chǎng)被稱為AI超級(jí)碗的發(fā)布會(huì)上,黃仁勛發(fā)布了劃時(shí)代的NVIDIA Blackwell Ultra GPU架構(gòu)。
相比于年初黃仁勛在CES開(kāi)幕演講中宣稱物理AI時(shí)代已經(jīng)來(lái)臨,在GTC大會(huì)上,黃仁勛強(qiáng)調(diào),當(dāng)下生成式AI正向具備自主決策能力的代理式AI演進(jìn),行業(yè)正面臨復(fù)雜任務(wù)分解與實(shí)時(shí)決策的雙重挑戰(zhàn)。
黃仁勛將人工智能發(fā)展總結(jié)為四波浪潮:感知式AI——生成式AI——代理式AI——物理式AI。
代理AI類似于AI助理,它可以感知和理解環(huán)境的上下文,最核心的能力是它具備推理能力——它可以理解多模態(tài)信息,推理如何回答或解決問(wèn)題,它可以使用工具,訪問(wèn)網(wǎng)站并查看網(wǎng)站的格式、文字和視頻,甚至可以播放視頻,從網(wǎng)站學(xué)習(xí),理解它,利用新獲得的知識(shí)來(lái)執(zhí)行任務(wù)。
推理能力需要逐步分解問(wèn)題,進(jìn)行一致性檢查,導(dǎo)致token數(shù)量大大增加,也需要更快的計(jì)算速度。
具備推理能力的AI,在實(shí)現(xiàn)對(duì)物理世界的理解,能夠理解摩擦和慣性,因果關(guān)系和物體永久性等概念的AI即是物理AI,這種理解物理世界,三維世界的能力,將推動(dòng)機(jī)器人技術(shù)的發(fā)展。
但是什么驅(qū)動(dòng)了AI的每一次浪潮,如何在代理AI之后,推動(dòng)物理AI新浪潮的到來(lái)?黃仁勛說(shuō)這涉及三個(gè)基本問(wèn)題:
第一,如何解決數(shù)據(jù)問(wèn)題?在哪里創(chuàng)建訓(xùn)練AI所需的數(shù)據(jù)?
第二、 如何在沒(méi)有人類參與的情況下解決訓(xùn)練問(wèn)題?
第三、如何創(chuàng)建或找到一種算法,使得你提供的資源越多,AI就越智能?
這三個(gè)問(wèn)題涉及AI的本質(zhì),即它是如何發(fā)生的。
AI作為一種數(shù)據(jù)驅(qū)動(dòng)的計(jì)算機(jī)科學(xué)方法,它需要大量的數(shù)據(jù)來(lái)學(xué)習(xí)?,F(xiàn)在人類有大量的方法生成數(shù)據(jù),歷史知識(shí)、網(wǎng)絡(luò),以及各種感知物理世界的傳感器,難的是訓(xùn)練數(shù)據(jù)和算法。
也就是如何建設(shè)一種訓(xùn)練模型來(lái)訓(xùn)練數(shù)據(jù),即模型架構(gòu)是什么?需要達(dá)到什么樣的規(guī)模,并保證訓(xùn)練效率。
黃仁勛表示,由于具身智能和推理的出現(xiàn),現(xiàn)在需要的計(jì)算量,比去年同期至少要多100 倍。
相比生成式AI,推理 AI的根本在于逐步分解問(wèn)題,它不再只是生成一個(gè)接一個(gè)的token或單詞,而是生成一系列代表推理步驟的單詞。因此產(chǎn)生的 token 數(shù)量大大增加,而為了保證交互效率,10倍的 token 數(shù)量需要提升10倍的算力,其綜合算力需求很容易達(dá)到 100 倍以上。
構(gòu)建推理 AI,當(dāng)下已明確的方式是使用一種名為「思維鏈」的技術(shù),包括「最佳結(jié)果」技術(shù)、一致性檢查和各種路徑規(guī)劃策略。
推理的過(guò)程就像一個(gè)工廠在生成token。
黃仁勛將這種速度更快,生成token能力更強(qiáng)的的計(jì)算中心稱之為AI工廠。它從基于檢索的計(jì)算過(guò)渡到基于生成的計(jì)算,從舊的數(shù)據(jù)中心建設(shè)方式過(guò)渡到一種新的基礎(chǔ)設(shè)施建設(shè)方式:
AI 工廠,只有一項(xiàng)工作,就是生成眾多令人難以置信的 token,然后將這些 token 重組為音樂(lè)、文字、視頻、研究、化學(xué)物質(zhì)或蛋白質(zhì)。
黃仁勛預(yù)言,未來(lái),每個(gè)行業(yè)、每個(gè)擁有工廠的公司都將擁有兩個(gè)工廠:一個(gè)用于制造產(chǎn)品,另一個(gè)用于數(shù)學(xué)計(jì)算,也就是用于人工智能(AI):未來(lái)會(huì)有汽車工廠和汽車AI工廠。
他甚至表示,對(duì)于高算力芯片,五年后每一塊掩膜、每一次光刻都可以在英偉達(dá)的平臺(tái)上進(jìn)行處理。
這個(gè)AI工廠是一個(gè)數(shù)據(jù)怪獸,它擁有130萬(wàn)億個(gè)晶體管,其中20萬(wàn)億個(gè)用于計(jì)算,按照當(dāng)下人類的能力,這這不是一個(gè)可以短期內(nèi)合理制造的產(chǎn)品。
黃仁勛表示,將如此規(guī)模的算力需求,分解成NVIDIA Grace Blackwell NVLink72機(jī)架實(shí)現(xiàn)縱向擴(kuò)展。
它實(shí)現(xiàn)了極端計(jì)算中的終極挑戰(zhàn):推理。
同時(shí)英偉達(dá)推出了一整套的AI工廠的軟件工具:
1、一個(gè)開(kāi)源推理軟件NVIDIA Dynamo;
2、一個(gè)完全開(kāi)源的推理模型R1;
3、一個(gè)物理AI的操作系統(tǒng)NVIDIA Omniverse;
黃仁勛展示了推理模型R1與一個(gè)非推理模型Llama 3的對(duì)比,在反應(yīng)速度、回答的準(zhǔn)確性上,顯然,R1更智能。
R1可以下載并在任何地方運(yùn)行,比如DGX Spark、DGX Station,或者OEM廠商制造的任何服務(wù)器。也可以在云端運(yùn)行,將其集成到任何Agentic AI框架中。
這里我們重點(diǎn)說(shuō)一下物理AI的操作系統(tǒng)Omniverse。
Omniverse推出的時(shí)間已有數(shù)年之久,原來(lái)是為構(gòu)建數(shù)字孿生世界建模的工具,為什么一躍成為物理AI的操作系統(tǒng)?
黃仁勛解釋說(shuō),英偉達(dá)在其中添加了兩項(xiàng)技術(shù),其中一項(xiàng)就是在今年CES上發(fā)布的NVIDIA Cosmos? 世界基礎(chǔ)模型平臺(tái)。
使用Omniverse來(lái)調(diào)節(jié)Cosmos,并使用Cosmos來(lái)生成無(wú)限數(shù)量的環(huán)境,因而可以創(chuàng)建具有基礎(chǔ)性、受人類控制,同時(shí)又在系統(tǒng)上無(wú)限的數(shù)據(jù)。
NVIDIA Cosmos? 是一個(gè)幫助開(kāi)發(fā)者為物理 AI 系統(tǒng)大規(guī)模構(gòu)建定制世界模型的平臺(tái)。從數(shù)據(jù)整理、訓(xùn)練到定制,它為每個(gè)開(kāi)發(fā)階段提供了開(kāi)放世界基礎(chǔ)模型和工具。Cosmos的主要能力是創(chuàng)建仿真的虛擬環(huán)境幫助人形機(jī)器人和自動(dòng)駕駛應(yīng)用進(jìn)行訓(xùn)練。
另一項(xiàng)技術(shù)是強(qiáng)化學(xué)習(xí)和可驗(yàn)證的回報(bào)。
所謂可驗(yàn)證的回報(bào)就是如何讓機(jī)器人的運(yùn)動(dòng)符合物理定律,也就是可驗(yàn)證的物理回報(bào)。
英偉達(dá)引入了一個(gè)令人難以置信的物理引擎Newton。
沒(méi)錯(cuò),名字就是那個(gè)大名鼎鼎的物理學(xué)家牛頓。
這是一個(gè)專門為精細(xì)的剛性和軟體而設(shè)計(jì)的物理引擎,可以有效地訓(xùn)練觸覺(jué)反饋、精細(xì)運(yùn)動(dòng)技能和執(zhí)行器控制。英偉達(dá)通過(guò)為其進(jìn)行GPU加速,以便這些虛擬世界能夠以超線性時(shí)間、以超實(shí)時(shí)的方式運(yùn)行,以達(dá)到以極快的速度訓(xùn)練這些AI模型。
這一物理引擎是由DeepMind、迪士尼研究院和NVIDIA聯(lián)合開(kāi)發(fā)的,它目前已經(jīng)和諧地集成到機(jī)器人專家在世界各地使用的框架Mujoco中。
這兩項(xiàng)技術(shù)的引入,讓Omniverse不再是一個(gè)單純地構(gòu)建數(shù)字孿生世界的工具,而是一套為具身智能打造的操作系統(tǒng)。
英偉達(dá)由此成為一家推動(dòng)推理AI誕生并推動(dòng)其向物理AI跨越的AI基礎(chǔ)設(shè)施供應(yīng)商。
黃仁勛在GTC2025大會(huì)上的演講,構(gòu)建了一套AI進(jìn)行的哲學(xué)方法論,它通過(guò)分析「技術(shù)演進(jìn)—架構(gòu)創(chuàng)新—產(chǎn)業(yè)落地」的現(xiàn)實(shí)需求,推動(dòng)AI從生成式到代理式的進(jìn)化,并敏銳地捕捉到,AI的發(fā)展重心已從數(shù)據(jù)規(guī)模驅(qū)動(dòng)轉(zhuǎn)向系統(tǒng)能力的競(jìng)爭(zhēng),這種轉(zhuǎn)變無(wú)疑將深刻地重塑AI產(chǎn)業(yè)鏈的價(jià)值格局。
而英偉達(dá)無(wú)疑站在了這條產(chǎn)業(yè)鏈的頂端。

x
-
體驗(yàn)大陸集團(tuán)UWB數(shù)字鑰匙:智能終端之間,人類數(shù)字身份認(rèn)證的最優(yōu)解 2025-04-29 23:06
-
出事故車企負(fù)全責(zé),廣汽埃安與滴滴發(fā)布全球首輛前裝量產(chǎn)L4,2027年面向個(gè)人用戶 2025-04-28 21:39
-
又來(lái)一款電動(dòng)越野方盒子,深藍(lán)G318無(wú)憂穿越版15.29萬(wàn)元起售 2025-04-19 10:35
-
出事故車企負(fù)全責(zé),廣汽埃安與滴滴發(fā)布全球首輛前裝量產(chǎn)L4,2027年面向個(gè)人用戶 2025-04-28 21:39
-
全球首張且唯一ISO 8800證書(shū),地平線獲通向全球市場(chǎng)的"安全信任護(hù)照" 2025-04-27 11:17
-