123,123,123

智駕網(wǎng) 2025-04-10 16:20

黃仁勛：AI的推理能力是如何產(chǎn)生的，它如何打開(kāi)物理AI的大門(mén)

黃仁勛是一位在AI領(lǐng)域具有工程師思維的哲學(xué)家，他對(duì)技術(shù)的演進(jìn)方向，時(shí)間節(jié)點(diǎn)、工程能力有著超出常人的判斷，黃仁勛在GTC2025大會(huì)上的演講描述了一幅從推理AI到物理AI進(jìn)化的清晰路線圖。

在2025年年初CES的開(kāi)幕演講中，黃仁勛認(rèn)為：「機(jī)器人技術(shù)的ChatGPT時(shí)刻即將到來(lái)?！顾皇滞崎_(kāi)了物理AI的大門(mén)，并表示機(jī)器人和智駕是物理AI的兩大應(yīng)用場(chǎng)景。

時(shí)隔三個(gè)月之后，英偉達(dá)GTC2025大會(huì)在圣何塞開(kāi)幕。

這三個(gè)月間，來(lái)自中國(guó)的DeepSeek引發(fā)了一輪算力泡沫爭(zhēng)議。英偉達(dá)在這期間迎來(lái)了多年來(lái)鮮有的一輪股價(jià)大跌。

黃仁勛在GTC2025大會(huì)上回應(yīng)了這一爭(zhēng)議，他強(qiáng)調(diào)：「AI推理階段的算力需求將呈現(xiàn)百倍級(jí)增長(zhǎng)，'Scaling Law'法則的應(yīng)用重心正從模型預(yù)訓(xùn)練向后訓(xùn)練環(huán)節(jié)遷移?！?/p>

他說(shuō)，「由于具身智能和推理的出現(xiàn)，我們現(xiàn)在需要的計(jì)算量，比去年這個(gè)時(shí)候認(rèn)為的至少要多100倍。」

在這場(chǎng)被稱(chēng)為AI超級(jí)碗的發(fā)布會(huì)上，黃仁勛發(fā)布了劃時(shí)代的NVIDIA Blackwell Ultra GPU架構(gòu)。

相比于年初黃仁勛在CES開(kāi)幕演講中宣稱(chēng)物理AI時(shí)代已經(jīng)來(lái)臨，在GTC大會(huì)上，黃仁勛強(qiáng)調(diào)，當(dāng)下生成式AI正向具備自主決策能力的代理式AI演進(jìn)，行業(yè)正面臨復(fù)雜任務(wù)分解與實(shí)時(shí)決策的雙重挑戰(zhàn)。

黃仁勛將人工智能發(fā)展總結(jié)為四波浪潮：感知式AI——生成式AI——代理式AI——物理式AI。

代理AI類(lèi)似于AI助理，它可以感知和理解環(huán)境的上下文，最核心的能力是它具備推理能力——它可以理解多模態(tài)信息，推理如何回答或解決問(wèn)題，它可以使用工具，訪問(wèn)網(wǎng)站并查看網(wǎng)站的格式、文字和視頻，甚至可以播放視頻，從網(wǎng)站學(xué)習(xí)，理解它，利用新獲得的知識(shí)來(lái)執(zhí)行任務(wù)。

推理能力需要逐步分解問(wèn)題，進(jìn)行一致性檢查，導(dǎo)致token數(shù)量大大增加，也需要更快的計(jì)算速度。

具備推理能力的AI，在實(shí)現(xiàn)對(duì)物理世界的理解，能夠理解摩擦和慣性，因果關(guān)系和物體永久性等概念的AI即是物理AI，這種理解物理世界，三維世界的能力，將推動(dòng)機(jī)器人技術(shù)的發(fā)展。

但是什么驅(qū)動(dòng)了AI的每一次浪潮，如何在代理AI之后，推動(dòng)物理AI新浪潮的到來(lái)？黃仁勛說(shuō)這涉及三個(gè)基本問(wèn)題：

第一，如何解決數(shù)據(jù)問(wèn)題？在哪里創(chuàng)建訓(xùn)練AI所需的數(shù)據(jù)？

第二、如何在沒(méi)有人類(lèi)參與的情況下解決訓(xùn)練問(wèn)題？

第三、如何創(chuàng)建或找到一種算法，使得你提供的資源越多，AI就越智能？

這三個(gè)問(wèn)題涉及AI的本質(zhì)，即它是如何發(fā)生的。

AI作為一種數(shù)據(jù)驅(qū)動(dòng)的計(jì)算機(jī)科學(xué)方法，它需要大量的數(shù)據(jù)來(lái)學(xué)習(xí)?，F(xiàn)在人類(lèi)有大量的方法生成數(shù)據(jù)，歷史知識(shí)、網(wǎng)絡(luò)，以及各種感知物理世界的傳感器，難的是訓(xùn)練數(shù)據(jù)和算法。

也就是如何建設(shè)一種訓(xùn)練模型來(lái)訓(xùn)練數(shù)據(jù)，即模型架構(gòu)是什么？需要達(dá)到什么樣的規(guī)模，并保證訓(xùn)練效率。

黃仁勛表示，由于具身智能和推理的出現(xiàn)，現(xiàn)在需要的計(jì)算量，比去年同期至少要多100 倍。

相比生成式AI，推理 AI的根本在于逐步分解問(wèn)題，它不再只是生成一個(gè)接一個(gè)的token或單詞，而是生成一系列代表推理步驟的單詞。因此產(chǎn)生的 token 數(shù)量大大增加，而為了保證交互效率，10倍的 token 數(shù)量需要提升10倍的算力，其綜合算力需求很容易達(dá)到 100 倍以上。

構(gòu)建推理 AI，當(dāng)下已明確的方式是使用一種名為「思維鏈」的技術(shù)，包括「最佳結(jié)果」技術(shù)、一致性檢查和各種路徑規(guī)劃策略。

推理的過(guò)程就像一個(gè)工廠在生成token。

AI工廠.jpg

黃仁勛將這種速度更快，生成token能力更強(qiáng)的的計(jì)算中心稱(chēng)之為AI工廠。它從基于檢索的計(jì)算過(guò)渡到基于生成的計(jì)算，從舊的數(shù)據(jù)中心建設(shè)方式過(guò)渡到一種新的基礎(chǔ)設(shè)施建設(shè)方式：

AI 工廠，只有一項(xiàng)工作，就是生成眾多令人難以置信的 token，然后將這些 token 重組為音樂(lè)、文字、視頻、研究、化學(xué)物質(zhì)或蛋白質(zhì)。

黃仁勛預(yù)言，未來(lái)，每個(gè)行業(yè)、每個(gè)擁有工廠的公司都將擁有兩個(gè)工廠：一個(gè)用于制造產(chǎn)品，另一個(gè)用于數(shù)學(xué)計(jì)算，也就是用于人工智能（AI）：未來(lái)會(huì)有汽車(chē)工廠和汽車(chē)AI工廠。

他甚至表示，對(duì)于高算力芯片，五年后每一塊掩膜、每一次光刻都可以在英偉達(dá)的平臺(tái)上進(jìn)行處理。

這個(gè)AI工廠是一個(gè)數(shù)據(jù)怪獸，它擁有130萬(wàn)億個(gè)晶體管，其中20萬(wàn)億個(gè)用于計(jì)算，按照當(dāng)下人類(lèi)的能力，這這不是一個(gè)可以短期內(nèi)合理制造的產(chǎn)品。

黃仁勛表示，將如此規(guī)模的算力需求，分解成NVIDIA Grace Blackwell NVLink72機(jī)架實(shí)現(xiàn)縱向擴(kuò)展。

它實(shí)現(xiàn)了極端計(jì)算中的終極挑戰(zhàn)：推理。

同時(shí)英偉達(dá)推出了一整套的AI工廠的軟件工具：

1、一個(gè)開(kāi)源推理軟件NVIDIA Dynamo；

2、一個(gè)完全開(kāi)源的推理模型R1；

3、一個(gè)物理AI的操作系統(tǒng)NVIDIA Omniverse；

黃仁勛展示了推理模型R1與一個(gè)非推理模型Llama 3的對(duì)比，在反應(yīng)速度、回答的準(zhǔn)確性上，顯然，R1更智能。

開(kāi)源.jpg

R1可以下載并在任何地方運(yùn)行，比如DGX Spark、DGX Station，或者OEM廠商制造的任何服務(wù)器。也可以在云端運(yùn)行，將其集成到任何Agentic AI框架中。

這里我們重點(diǎn)說(shuō)一下物理AI的操作系統(tǒng)Omniverse。

nvidia-omniverse (1).jpg

Omniverse推出的時(shí)間已有數(shù)年之久，原來(lái)是為構(gòu)建數(shù)字孿生世界建模的工具，為什么一躍成為物理AI的操作系統(tǒng)？

黃仁勛解釋說(shuō)，英偉達(dá)在其中添加了兩項(xiàng)技術(shù)，其中一項(xiàng)就是在今年CES上發(fā)布的NVIDIA Cosmos? 世界基礎(chǔ)模型平臺(tái)。

使用Omniverse來(lái)調(diào)節(jié)Cosmos，并使用Cosmos來(lái)生成無(wú)限數(shù)量的環(huán)境，因而可以創(chuàng)建具有基礎(chǔ)性、受人類(lèi)控制，同時(shí)又在系統(tǒng)上無(wú)限的數(shù)據(jù)。

NVIDIA Cosmos? 是一個(gè)幫助開(kāi)發(fā)者為物理 AI 系統(tǒng)大規(guī)模構(gòu)建定制世界模型的平臺(tái)。從數(shù)據(jù)整理、訓(xùn)練到定制，它為每個(gè)開(kāi)發(fā)階段提供了開(kāi)放世界基礎(chǔ)模型和工具。Cosmos的主要能力是創(chuàng)建仿真的虛擬環(huán)境幫助人形機(jī)器人和自動(dòng)駕駛應(yīng)用進(jìn)行訓(xùn)練。

DT_Composition1-ezgif.com-optimize-1.gif

另一項(xiàng)技術(shù)是強(qiáng)化學(xué)習(xí)和可驗(yàn)證的回報(bào)。

所謂可驗(yàn)證的回報(bào)就是如何讓機(jī)器人的運(yùn)動(dòng)符合物理定律，也就是可驗(yàn)證的物理回報(bào)。

英偉達(dá)引入了一個(gè)令人難以置信的物理引擎Newton。

沒(méi)錯(cuò)，名字就是那個(gè)大名鼎鼎的物理學(xué)家牛頓。

這是一個(gè)專(zhuān)門(mén)為精細(xì)的剛性和軟體而設(shè)計(jì)的物理引擎，可以有效地訓(xùn)練觸覺(jué)反饋、精細(xì)運(yùn)動(dòng)技能和執(zhí)行器控制。英偉達(dá)通過(guò)為其進(jìn)行GPU加速，以便這些虛擬世界能夠以超線性時(shí)間、以超實(shí)時(shí)的方式運(yùn)行，以達(dá)到以極快的速度訓(xùn)練這些AI模型。

這一物理引擎是由DeepMind、迪士尼研究院和NVIDIA聯(lián)合開(kāi)發(fā)的，它目前已經(jīng)和諧地集成到機(jī)器人專(zhuān)家在世界各地使用的框架Mujoco中。

這兩項(xiàng)技術(shù)的引入，讓Omniverse不再是一個(gè)單純地構(gòu)建數(shù)字孿生世界的工具，而是一套為具身智能打造的操作系統(tǒng)。

英偉達(dá)由此成為一家推動(dòng)推理AI誕生并推動(dòng)其向物理AI跨越的AI基礎(chǔ)設(shè)施供應(yīng)商。

牛頓.jpg

黃仁勛在GTC2025大會(huì)上的演講，構(gòu)建了一套AI進(jìn)行的哲學(xué)方法論，它通過(guò)分析「技術(shù)演進(jìn)—架構(gòu)創(chuàng)新—產(chǎn)業(yè)落地」的現(xiàn)實(shí)需求，推動(dòng)AI從生成式到代理式的進(jìn)化，并敏銳地捕捉到，AI的發(fā)展重心已從數(shù)據(jù)規(guī)模驅(qū)動(dòng)轉(zhuǎn)向系統(tǒng)能力的競(jìng)爭(zhēng)，這種轉(zhuǎn)變無(wú)疑將深刻地重塑AI產(chǎn)業(yè)鏈的價(jià)值格局。

而英偉達(dá)無(wú)疑站在了這條產(chǎn)業(yè)鏈的頂端。

打賞

相關(guān)標(biāo)簽：

GTC大會(huì) 黃仁勛英偉達(dá)

智駕網(wǎng)編一號(hào)機(jī)

專(zhuān)欄作者|6788篇文章

相關(guān)文章全部

卓馭與車(chē)企聯(lián)合推出智駕險(xiǎn)，單次最高賠付20萬(wàn)元，每車(chē)每年最高賠付100萬(wàn)元 2025-06-10 19:30
五界聚首：華為改變了中國(guó)汽車(chē) 2025-06-09 18:31
余大嘴歸來(lái)：一個(gè)拳頭真的需要五個(gè)手指頭攥在一起才有力量 2025-06-02 22:38