狠狠躁日日躁夜夜躁A片无码,中文字幕在线亚洲二区,最近更新中文字幕在线,四虎影视国产精品亚洲精品,男人扒开添女人下部免费视频

訂閱
糾錯
加入自媒體

首發(fā)|黃仁勛巴黎GTC最新演講:一個由AI工廠驅(qū)動的全新工業(yè)革命已經(jīng)到來!

編輯 重點君

6月11日,英偉達創(chuàng)始人兼 CEO 黃仁勛出現(xiàn)在法國巴黎的 VivaTech 大會,帶來他標志性的 GTC 主題演講。演講全程近兩個小時,老黃用他特有的節(jié)奏,將 GPU、AI 工廠、代理智能、人形機器人等看似分散的議題,抽絲剝繭般串成一條線索:一個由AI工廠驅(qū)動的全新工業(yè)革命已經(jīng)到來。

這次演講依舊干貨滿滿,我們給您劃下重點:

1、GPU不再是一塊芯片,而是一個集群式的“思考機器”

英偉達從 GPU 圖形處理起家,但黃仁勛現(xiàn)在更關(guān)心的是“如何構(gòu)建一種能進行推理的計算平臺”。這個目標如今已經(jīng)具象化為 Grace Blackwell 架構(gòu)下的 GB200 超級芯片:“它不是一塊芯片,而是一個集群式的“思考機器” (Thinking Machine)。

這臺被譽為“大號 GeForce”的設(shè)備,擁有超 120 萬個零件、每秒 130 TB 的通信帶寬,重達兩噸,價格高達 300 萬美元——幾乎像是一臺現(xiàn)代的“人工智能蒸汽機”。

黃仁勛甚至不再把它稱作計算機,而是稱之為推理引擎,設(shè)計之初就是為了解決當下 AI 模型中“自我思考”的計算瓶頸。與過去追求速度不同,如今的大模型追求的是推理的深度、鏈式思維的廣度——模型要不斷反思、規(guī)劃、重試、對話,而這正是GB200 的設(shè)計目標。

2、AI 已進入Agent時代:不只是回答問題,而是自己“解決任務”。

黃仁勛認為,生成式 AI 之后,AI 正在進入下一個階段:Agent 智能體時代。如果說 ChatGPT 是智能的“百科全書”,那么 Agent 更像是可以動手干活的“數(shù)字員工”。它不僅能回答問題,還能理解語境、制定計劃、調(diào)用工具甚至與其他智能體協(xié)作,完成復雜任務。

NVIDIA 提供了 Agent 構(gòu)建的全套棧工具:從大型語言模型(NeMo、Nemotron)、多模態(tài)檢索(Retriever)、到部署管理平臺 Lepton。整個流程就像 DevOps、MLOps 一樣,被打包進可部署的 NIM 容器,能夠在本地、云端、私有環(huán)境一鍵運行。

一個簡單的演示中,黃仁勛向觀眾展示如何通過一條提示詞,指揮 Perplexity 智能體代理,完成一套巴黎開設(shè)餐車的計劃書,從市場調(diào)研到財務規(guī)劃、到網(wǎng)站搭建,全程自動完成。

3、人形機器人將在模擬世界中訓練,未來或成“最大的產(chǎn)業(yè)之一”。

但更令人驚喜的是,英偉達也將 AI 從屏幕世界帶入了現(xiàn)實世界。黃仁勛推出了一款人形機器人 Grek,并展示了其在虛擬環(huán)境中模擬學習的全過程:在 Omniverse 世界中模擬風、重力、摩擦、阻力,Grek 學會了行走、跳躍、推門等一系列技能,并將這些技能遷移到現(xiàn)實中。

在黃仁勛眼中,人形機器人將是下一個“十億級設(shè)備平臺”,遠超智能手機:它們將進入工廠、倉庫、手術(shù)室、甚至家庭;編程門檻將從代碼降低到“示范教學”;每一個機器人背后,都將是一臺基于 NVIDIA Thor 芯片的 AI 超級計算機。

4、Omniverse 不只是渲染引擎,而是機器人、數(shù)字孿生訓練的核心平臺。

Omniverse 正是這一切的核心訓練平臺。它不只是一個 3D 渲染引擎,而是一個真實世界的模擬器——構(gòu)建真實感、建立物理規(guī)則,幫助機器人像人一樣學習與世界互動。

機器人是現(xiàn)實中最具象的“具身智能”,而另一端,工業(yè)制造正全面進入 AI 化的進程。演講中展示了多個企業(yè)在 Omniverse 中構(gòu)建的數(shù)字孿生場景:寶馬在仿真工廠中規(guī)劃產(chǎn)線,奔馳用來優(yōu)化裝配流程,西門子實現(xiàn)工廠設(shè)計、運營、調(diào)度的自動化協(xié)同。

英偉達宣布與施耐德、西門子等合作,將工廠數(shù)字孿生、自動駕駛、工業(yè)控制全面 AI 化。還宣布在歐洲落地第一個“工業(yè) AI 云”,將風洞實驗、工廠模擬、機器人訓練一體化,提供實時高精度仿真支持。

總之,黃仁勛描繪一個由AI工廠驅(qū)動的新工業(yè)革命的藍圖,其中Grace Blackwell是核心計算引擎,Agentic AI和具身機器人是下一波AI浪潮,而數(shù)字孿生(Omniverse)連接物理世界與虛擬世界的橋梁,所有這些都由NVIDIA強大的加速計算平臺和廣泛的生態(tài)系統(tǒng)所支持。而歐洲,作為工業(yè)革命的起源地,正重新成為 AI 時代的實驗場。在這條新的產(chǎn)業(yè)鏈上,計算就是生產(chǎn)力,智能就是能源。

一個全新的時代,已經(jīng)到來。

   以下為黃仁勛演講完整實錄:

歡迎英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛登臺。

黃仁勛:你好,巴黎。大家好。

NVIDIA 在巴黎舉辦的首次 GTC 大會。這真是令人難以置信。感謝所有與我們同行的合作伙伴。多年來,我們合作過許多人。事實上,我們在歐洲已經(jīng)有很長時間的業(yè)務了。盡管如此,這是我第一次參加巴黎 GTC。我有很多話要告訴你。

英偉達,曾經(jīng),想要創(chuàng)造一個新的計算平臺,去做普通計算機無法完成的事情。我們加速了 CPU,創(chuàng)造了一種稱為加速計算的新型計算方式。我們的第一個應用之一是分子動力學。從那時起我們已經(jīng)走了很長的路。有這么多不同的庫。事實上,使加速計算特別的原因是:它不僅僅是一個你編譯軟件的新處理器。你必須重新構(gòu)建你的計算方式。你必須重新設(shè)計你的算法。

事實證明,人們很難將軟件和算法重新設(shè)計得高度并行化。因此,我們創(chuàng)建了庫來幫助各個市場。每個應用領(lǐng)域都得到了加速。每一個庫都為開發(fā)者開辟了新的機遇。這也為我們和我們的生態(tài)系統(tǒng)合作伙伴帶來了新的增長機會。

計算光刻,可能是當今半導體設(shè)計中最重要的應用之一,在臺積電的工廠中運行三星,大型半導體制造廠。芯片制造之前,它會通過逆物理算法運行計算光刻。直接稀疏求解器,代數(shù)多重網(wǎng)格求解器。我們剛剛開源了。令人難以置信的激動人心的應用庫。該庫加速決策過程,以優(yōu)化擁有數(shù)百萬變量和數(shù)百萬約束的問題,例如旅行推銷員問題。

Warp,一個用于表達幾何和物理求解器的 Python 框架。非常重要。cuDF、cuML、結(jié)構(gòu)化數(shù)據(jù)庫、數(shù)據(jù)框、經(jīng)典機器學習算法。cuDF 加速 Spark,無需修改代碼。cuML 加速 scikit-learn,無需修改代碼。Dynamo 和 cuDNN。cuDNN 可能是英偉達迄今為止創(chuàng)建的最重要的庫。它加速了深度神經(jīng)網(wǎng)絡(luò)的基本操作。而 Dynamo 是我們?nèi)碌膸欤沟谜{(diào)度成為可能:協(xié)調(diào)、分配極其復雜的推理工作負載,覆蓋整個 AI 工廠。

cuEquivariance 和 cuTensor,張量收縮算法。Equivariance 適用于遵循幾何法則的神經(jīng)網(wǎng)絡(luò)。例如蛋白質(zhì)、分子。Ariel 和 Shona,是實現(xiàn) AI 運行 6G 的非常重要的框架。Earth-2,是我們用于天氣和氣候基礎(chǔ)模型的仿真環(huán)境。平方公里級,分辨率極高。MONAI,我們的醫(yī)學影像框架,極受歡迎。Parabricks,我們的基因組分析解決方案,取得了巨大成功。cuQuantum,CUDA-Q,我稍后會談到,用于量子計算。還有 cuPineumeric,加速 NumPy 和 SciPy。

正如你所見,這些只是庫的幾個例子。還有另外 400 個。它們中的每一個都加速了一個應用領(lǐng)域。每一個都開辟了新的機遇。其中最令人興奮的之一是 CUDA-Q。CUDA-X 是一套庫,專為在 CUDA 基礎(chǔ)上加速應用和算法而設(shè)計的庫套件。我們現(xiàn)在有了 CUDA-Q。CUDA-Q 是為量子計算設(shè)計的,適用于經(jīng)典和量子基于 GPU 的量子經(jīng)典計算。

一、量子計算的拐點與CUDA-Q

我們已經(jīng)在 CUDA-Q 上工作了好幾年了。今天,我可以告訴你,量子計算正處于一個轉(zhuǎn)折點。正如你所知,近 30 年前首次展示了物理量子比特。1995 年發(fā)明了糾錯算法。2023 年,近 30 年后,谷歌展示了世界上第一個邏輯量子比特。從那以后,幾年過去了。邏輯量子比特的數(shù)量——由大量帶有糾錯的物理量子比特組成——也有所增加。邏輯量子比特的數(shù)量開始增長。

就像摩爾定律一樣,我完全可以預期每五年邏輯量子比特數(shù)量增加十倍。每十年邏輯量子比特數(shù)量增加一百倍。這些邏輯量子比特將具備更好的錯誤糾正能力:更加穩(wěn)健,性能更高,更具彈性,當然將繼續(xù)具備可擴展性。量子計算正達到一個拐點。

我們一直以多種方式與全球的量子計算公司合作,但在歐洲,這里有一個龐大的社區(qū)。我昨晚見到了帕斯卡爾,昨晚還見到了巴塞羅那超級計算中心,F(xiàn)在很明顯,我們已經(jīng)接近能夠應用量子計算的階段了:量子經(jīng)典計算將在未來幾年內(nèi)解決一些有趣的問題。這是一個非常激動人心的時刻。

因此,我們一直在與所有超級計算中心合作,F(xiàn)在非常清楚,在未來幾年內(nèi),或者至少在下一代超級計算機中,每一個都會分配一個量子處理單元(QPU),并且 QPU 會連接到 GPU。量子處理單元當然會執(zhí)行量子計算,而 GPU 則用于預處理:用于控制和糾錯,這將極其計算密集;后期處理等。

在這兩種架構(gòu)之間,就像我們加速了 CPU 一樣,現(xiàn)在有了 QPU 與 GPU 協(xié)同工作,推動下一代計算的發(fā)展。今天我們宣布,我們的整個量子算法堆,F(xiàn)已在 Grace Blackwell 200 上實現(xiàn)加速。加速效果令人難以置信。

我們以多種方式與計算、通信和量子計算行業(yè)合作。其中一種方式是使用 cuQuantum 來模擬量子比特,或模擬運行在這些量子計算機上的算法;旧鲜鞘褂媒(jīng)典計算機來模擬或仿真量子計算機。在另一個極端,極其重要的是 CUDA-Q:基本上是發(fā)明了一種新的 CUDA,將 CUDA 擴展到量子經(jīng)典領(lǐng)域。這樣,在量子計算機到來之前,基于 CUDA-Q 開發(fā)的應用可以以模擬方式運行,或者在量子計算機到來后以協(xié)作方式運行:一種量子經(jīng)典加速計算方法。

今天我們宣布 CUDA-Q 已可用于 Grace Blackwell。這里的生態(tài)系統(tǒng)極為豐富,當然歐洲在科學領(lǐng)域深厚,在超級計算專業(yè)知識方面深厚,在這一領(lǐng)域有著深厚的傳承。在這里看到量子計算的進展并不令人驚訝。在未來幾年,我們將看到一個真正精彩的轉(zhuǎn)折點。

無論如何,對于所有在量子計算機行業(yè)工作了三十年的同仁們,我祝賀你們?nèi)〉昧巳绱肆钊穗y以置信的成就和今天的里程碑。謝謝。

讓我們來談談人工智能。你可能會驚訝我會和你們談論人工智能。正是同一款 GPU 驅(qū)動并支持了我剛才提到的所有這些應用。同樣的支持 GPU 的人工智能技術(shù)將走向世界。

我們第一次接觸是在 2012 年,就在那之前。與開發(fā)者合作,研究一種稱為深度學習的新型算法。它促成了 AI 的 AlexNet 大爆炸:2012 年。在過去大約 15 年里,人工智能取得了令人難以置信的快速進展。

第一波人工智能是感知,讓計算機識別信息、理解信息。第二波,是我們大多數(shù)人都在討論的過去五年左右,是生成式人工智能。它是多模態(tài)的,意味著人工智能能夠同時學習圖像和語言。因此,你可以用語言提示它,它就能生成圖像。人工智能具備多模態(tài)能力以及翻譯和生成內(nèi)容的能力,推動了生成式人工智能的革命。生成式人工智能,即生成內(nèi)容的能力,對我們的生產(chǎn)力至關(guān)重要。

那么,我們有了一個新的……我們正在開啟新一波的人工智能浪潮。在過去的幾年里,我們見證了人工智能能力的巨大進步。從根本上說,智能就是理解、感知、推理和規(guī)劃任務:如何解決問題,然后執(zhí)行任務。感知、推理、規(guī)劃,智能的基本循環(huán)。它使我們能夠應用一些先前學到的規(guī)則來解決我們從未見過的問題。

這就是為什么聰明人被認為聰明,因為他們能夠?qū)⒁粋復雜的問題一步步拆解……推理如何解決問題,或許還會進行研究:也許去學習一些新知識,尋求幫助;使用工具,逐步解決問題。我剛才描述的這些話,基本上今天通過所謂的代理型人工智能是可能實現(xiàn)的。我馬上會給你展示更多內(nèi)容。

在其物理實現(xiàn)中,即該代理智能和運動的體現(xiàn)……現(xiàn)在,生成能力正在生成運動。不是生成視頻,也不是生成圖像或生成文本;這項人工智能生成了運動能力,即行走能力或者伸手抓取某物,使用工具。讓人工智能具備實體形態(tài)的能力,基本上就是機器人技術(shù)。這些能力,是實現(xiàn)智能體的基礎(chǔ)技術(shù)。它們基本上是信息機器人和具身人工智能:物理機器人,這兩項基本能力現(xiàn)在已經(jīng)到來。

人工智能的時代真是令人非常興奮。但這一切,都是從 GeForce 開始的。而 GeForce 帶來了計算機圖形技術(shù)。這是我們曾經(jīng)開發(fā)的第一個加速計算應用。計算機圖形技術(shù)的發(fā)展令人難以置信。GeForce 將 CUDA 推向世界,使火星機器學習研究人員和人工智能研究人員能夠推動深度學習的發(fā)展。隨后,深度學習徹底改變了計算機圖形技術(shù),使我們能夠?qū)⒂嬎銠C圖形提升到一個全新的高度。

我今天要展示的所有內(nèi)容,我今天要展示的所有內(nèi)容,我將為你預覽:我將展示的內(nèi)容,但我今天展示的所有內(nèi)容都是計算機模擬,不是動畫。是光子模擬、物理模擬、粒子模擬。一切本質(zhì)上都是模擬,不是動畫,也不是藝術(shù)。它看起來非常美麗,因為事實證明世界本身就是美麗的,而且數(shù)學也是美麗的。那么,讓我們來看看。

數(shù)字在行動,數(shù)字在行動。這基本上就是模擬的本質(zhì),看起來非常美妙。但正因為我們現(xiàn)在能夠以如此規(guī)模和速度模擬幾乎所有事物,我們可以將一切轉(zhuǎn)化為數(shù)字孿生。而且因為一切都可以成為數(shù)字孿生,它可以在投入物理世界之前,完全通過數(shù)字方式進行設(shè)計、規(guī)劃、優(yōu)化和操作。我們將一切都用軟件構(gòu)建的理念如今已成為現(xiàn)實。

所有實體物品都將以數(shù)字方式構(gòu)建。所有宏偉的建筑都將以數(shù)字方式構(gòu)建。所有在巨大規(guī)模上運行的事物,都會首先以數(shù)字形式構(gòu)建,并且會有數(shù)字孿生來操作它們。所以今天我們將重點討論數(shù)字孿生。這最初是作為一款 GeForce 顯卡開始的……這里有人知道 GeForce 是什么嗎?知道。

好了。好的。最初的 GeForce 現(xiàn)在看起來是這樣的。這是全新的 GeForce。重達兩噸,甚至兩噸半。由 120 萬個零件組成。大約 300 萬美元。120 千瓦。在 150 家工廠制造。200 家技術(shù)合作伙伴與我們共同努力實現(xiàn)這一目標?赡苁谴蠹s 400 億美元的研發(fā)預算,用于創(chuàng)造——什么是 GB200,現(xiàn)在正在向 GB300 邁進。它已經(jīng)完全投入生產(chǎn)。

這臺機器被設(shè)計成一臺思考機器。所謂思考機器,是指它能夠進行推理。它有計劃。它花很多時間自言自語,就像你一樣。我們大部分時間都在為自己的思維生成文字,在我們表達之前,為自己的思維生成圖像。因此,思考機器實際上就是 Grace Blackwell 設(shè)計的架構(gòu)目標。它被設(shè)計成一個巨大的 GPU。我之所以這樣比喻,是有充分理由的。GeForce 是一塊 GPU,GB200 也是。它是一個巨大的虛擬 GPU。

現(xiàn)在,我們必須將其拆分成許多組件。創(chuàng)建了一系列新的網(wǎng)絡(luò)技術(shù)和 SerDes 技術(shù)。極低功耗、高能效的互連技術(shù),將所有這些芯片和系統(tǒng)連接成一個虛擬 GPU。這是 Hopper 版本。這是世界著名的 Hopper 系統(tǒng)。這是八個通過 NVLINK 連接在一起的 GPU。這里沒有顯示的是一個 CPU 托盤:一個帶有雙 CPU 和系統(tǒng)內(nèi)存的 CPU 托盤,位于上方。這共同構(gòu)成了一個人工智能超級計算機的節(jié)點,大約五十萬美元。

這是霍普系統(tǒng)。這就是——真正讓我們在人工智能領(lǐng)域嶄露頭角的系統(tǒng)。它長期以來一直處于資源不足的狀態(tài)。因為市場發(fā)展得太快了。但這是著名的霍普系統(tǒng)。整個系統(tǒng),包括 CPU,都被這個 Grace Blackwell 節(jié)點所取代。這就是一個計算托盤,就在這里,將取代整個系統(tǒng)。它采用全液冷設(shè)計,CPU 直接集成與 GPU 相連,所以你可以看到或聽到兩個 CPU、四個 GPU。它的性能超過了整個系統(tǒng)。

但令人驚訝的是,我們想要將一大批這樣的系統(tǒng)連接在一起。如何將所有這些系統(tǒng)連接起來,對我們來說真的很難想象。所以我們將其拆分了。我們所做的是將整塊主板拆分成了這個和這個。這是革命性的 NVLINK 系統(tǒng)。擴展計算并不難。只需用以太網(wǎng)連接更多 CPU。橫向擴展并不難?v向擴展極其困難。

你只能建造出你能夠建造的最大規(guī)模的計算機。將大量技術(shù)和電子設(shè)備集成到一個內(nèi)存模型中是非常困難的。因此,我們決定創(chuàng)建一種新的互連技術(shù),稱為 NVLINK。NVLINK 是一種內(nèi)存語義互連。它是一個計算結(jié)構(gòu),不是網(wǎng)絡(luò)。它直接連接到所有這些不同 NVLINK 系統(tǒng)計算節(jié)點的 CPU。

這是交換機。這九個,這九個,站在最上面。九個部分位于底部。中間是 NVLINK 交換機,連接它們的是這個奇跡。這就是 NVLINK 主干。這是 100%純銅,同軸銅線。它將所有 NVLINK 芯片直接連接到所有 GPU。在整個主干線上直接連接,使每一個 144 個 Blackwell 芯片核都相連;蛘咴 72 個不同的封裝中,同時相互通信,且不會阻塞貫穿整個 NVLINK 骨干網(wǎng)絡(luò)。其帶寬約為每秒 130 太字節(jié)。132... 我-我知道。不,等等——等等看。等著瞧。130 太字節(jié)每秒。如果是以比特計,130 太字節(jié)每秒。它的數(shù)據(jù)傳輸速率超過了全球整個互聯(lián)網(wǎng)峰值流量的總和,就在這個背板上。而且——是的。這就是——這就是你如何將互聯(lián)網(wǎng)縮小到 60 磅的重量。NVLINK。

所以,我們做了所有這些,我們做了所有這些,因為計算機的工作方式被認為是你對計算機的看法將來會有根本性的不同。我會花更多時間講這個。但它的設(shè)計目的是讓 Blackwell 在性能上遠超 Hopper。請記住,摩爾定律,半導體物理每三到五年只能帶來大約兩倍的性能提升。我們?nèi)绾文茉谝淮a(chǎn)品中實現(xiàn) 30 到 40 倍的性能提升?而我們需要的是 30 到 40 倍的性能提升。因為推理模型在自言自語。

它不再是一次性完成的 ChatGPT,而是一個推理模型。當你自我思考時,它會生成更多的標記。你正在一步步地分解問題。你在推理,嘗試各種不同的路徑。也許是思維鏈,也許是思維樹。最好的結(jié)局。它正在反思自己的答案。你可能看到……看到,這些研究模型,反思答案時會說“這是個好答案嗎?你能做得更好嗎?”然后他們“哦,是的,我能做得更好。”然后回去再多想想。因此,那些思考模型、推理模型達到了驚人的性能,但這需要更多的計算能力。

而 NVLINK-72 Blackwell 架構(gòu)的最終成果則帶來了性能的巨大飛躍。閱讀方式是,X 軸表示思考的速度。Y 軸表示工廠在同一時間支持大量用戶的產(chǎn)出能力。因此,你希望工廠的吞吐量盡可能高,以支持盡可能多的人,從而使工廠的收入達到最大化。你希望這個軸盡可能大,因為人工智能很聰明:這里比這里更聰明。越多,它思考得越快,回答你的問題之前能思考得越多,這與 ASP 有關(guān)。Token的平均售價,這必須與工廠的吞吐量有關(guān)。這兩者結(jié)合在那個角落就是工廠的收入。基于 Blackwell 的這家工廠由于其架構(gòu),可以產(chǎn)生更多的收入。

我們所建造的東西真是令人難以置信。我們?yōu)槟阒谱髁艘徊侩娪埃荚谧屇愀惺艿酱蛟?nbsp;Grace Blackwell 所投入的巨大工程量。請看。

(輕柔的音樂響起)布萊克韋爾是一項工程奇跡。它始于一塊空白的硅片。(機械運轉(zhuǎn)聲)數(shù)百道芯片加工和紫外光刻工序,在一塊 12 英寸的硅片上,一層層構(gòu)建起 2000 億個晶體管。晶圓被劃分成單個 Blackwell 芯片經(jīng)過測試和分類,將良品芯片分離出來以便后續(xù)使用。芯片-晶圓-基板工藝將 32 個 Blackwell 芯片和 128 個 HBM 堆疊安裝在定制的硅中介層晶圓上。(機械運轉(zhuǎn)聲)金屬互連線路直接蝕刻其中,將 Blackwell GPU 和 HBM 堆棧連接到每個系統(tǒng)和封裝單元中,確保所有部件牢固固定。

然后進行組裝,經(jīng)過烘烤、成型和固化,打造出 Blackwell B200 超級芯片。每個 Blackwell 芯片都在 125 攝氏度的烤箱中進行壓力測試,并在極限條件下運行數(shù)小時。機器人全天候工作,將超過 10,000 個元件拾取并放置到 Grace Blackwell 的 PCB 上。與此同時,定制的液冷銅塊正在準備中,以保持芯片在最佳溫度。在另一處工廠,ConnectX-7 SUPERNIC 被制造出來,以實現(xiàn)擴展通信,BlueField-3 DPU 則用于卸載和加速網(wǎng)絡(luò)處理、存儲和安全任務。

所有這些部分最終被精心集成到 GB200 計算托盤中。NVLINK 是 NVIDIA 發(fā)明的突破性高速連接技術(shù),用于連接多個 GPU,實現(xiàn)大規(guī)模虛擬 GPU 的擴展。NVLINK 交換機托盤由 NVLINK 交換芯片構(gòu)成,提供每秒 14.4 太字節(jié)的全互聯(lián)帶寬。NVLINK 主干形成定制的盲插背板,使用 5000 根銅纜將全部 72 個 Blackwell 或 144 個 GPU 芯片連接成一個巨型 GPU,提供每秒 130 太字節(jié)的全互聯(lián)帶寬——超過全球互聯(lián)網(wǎng)的峰值流量。

來自世界各地的零部件被熟練的技術(shù)人員組裝成機架規(guī)模的人工智能超級計算機?偣 120 萬個組件,兩英里的銅線、130 萬億個晶體管,重近兩噸。Blackwell 不僅僅是一個技術(shù)奇跡。它是全球合作與創(chuàng)新力量的見證,推動著將塑造我們未來的發(fā)現(xiàn)和解決方案遍布各地。我們致力于幫助當代天才完成他們的畢生事業(yè),迫不及待想看到你們帶來的突破。

Grace Blackwell 系統(tǒng)全部投入生產(chǎn)。這真是一個奇跡。從技術(shù)角度來看,這簡直是個奇跡,但能夠組裝這些 GB200 系統(tǒng)的供應鏈也功不可沒。每臺重達兩噸,我們現(xiàn)在每周生產(chǎn)一千臺系統(tǒng)。以前從未有人在如此規(guī)模上批量生產(chǎn)超級計算機。每一個機架本質(zhì)上就是一臺完整的超級計算機。僅在 2018 年,最大的 Volta 系統(tǒng)……2018 年的 CRS 超級計算機性能還不如其中一個機架。而那個系統(tǒng)的功耗是 10 兆瓦。這是 100 千瓦。所以從 2018 年到現(xiàn)在,代際之間的差異:我們確實將超級計算、人工智能超級計算提升到了一個全新的水平,我們現(xiàn)在正在大規(guī)模生產(chǎn)這些機械。

這僅僅是個開始。事實上,你們看到的只是一個系統(tǒng):格蕾絲·布萊克韋爾。全世界都在談論這一個系統(tǒng),紛紛呼吁盡快部署它于此地:進入全球數(shù)據(jù)中心,用于訓練、推理和生成式人工智能。然而,并非所有人,也并非所有數(shù)據(jù)中心都能應對這些液冷系統(tǒng)。一些數(shù)據(jù)中心需要企業(yè)級堆棧,能夠運行 Linux Red Hat 或 Nutanix,或 VMware,以及來自 Dell EMC 的存儲系統(tǒng)。日立、NetApp、VAST、Weka,如此多種不同的存儲系統(tǒng)、如此多不同的 IT 系統(tǒng),而這些系統(tǒng)的管理必須與傳統(tǒng) IT 系統(tǒng)保持一致。

我們有這么多新計算機需要投入生產(chǎn)管理。我很高興地告訴大家,這些產(chǎn)品現(xiàn)在全部進入量產(chǎn)階段。你們還沒見過它們,它們正從貨架上迅速被搶購一空。它們正從生產(chǎn)線快速下線,開始投產(chǎn)。DGX Spark 讓您幾乎可以在桌面上擁有 Grace Blackwell 系統(tǒng)。對于 Spark 來說,是桌面;對于 DGX Station 來說,是桌邊。這樣你在開發(fā)軟件時就不必坐在超級計算機旁了,在開發(fā)你的人工智能時。但你希望架構(gòu)完全相同。從架構(gòu)角度來看,這些系統(tǒng)是完全相同的。從軟件開發(fā)者的角度來看,界面完全一樣。唯一的區(qū)別是規(guī)模和速度。

然后這邊是所有的 x86 系統(tǒng)。全球的 IT 組織仍然偏愛 x86,并且在能夠利用最先進的 AI 原生系統(tǒng)時,都會選擇 x86。他們確實如此。在他們無法做到且希望整合進企業(yè) IT 系統(tǒng)的地方,我們現(xiàn)在為他們提供了實現(xiàn)這一目標的能力。其中一個最重要的系統(tǒng),也是我們花費最長時間構(gòu)建的系統(tǒng),因為軟件和架構(gòu)非常復雜:如何將原生 AI 架構(gòu)引入并融合到傳統(tǒng)企業(yè) IT 系統(tǒng)中。

這是我們?nèi)碌?nbsp;RTX 專業(yè)服務器。這是一臺令人難以置信的系統(tǒng)。主板經(jīng)過全面重新設(shè)計。女士們,先生們,Janine Paul。這塊主板看起來非常簡單,但在這塊主板上有八個 SUPER-NIX 交換機,通過一顆每秒 200 吉比特的最先進網(wǎng)絡(luò)芯片連接八個 GPU,這些 GPU 是 Blackwell RTX Pro 6000。全新產(chǎn)品,剛剛進入生產(chǎn)階段。八個這樣的裝入一臺服務器。那么,它有什么特別之處?這臺服務器是世界上唯一一臺能夠運行世界上所有已寫內(nèi)容以及 NVIDIA 所有開發(fā)成果的服務器。它運行人工智能、Omniverse 和用于視頻游戲的 RTX;它運行 Windows,運行 Linux,運行 Kubernetes;它在 VMware 中運行 Kubernetes,基本上運行所有東西。

如果你想將 Windows 桌面從一臺電腦流式傳輸?shù)侥愕倪h程設(shè)備,沒問題。如果你想流式傳輸 Omniverse,也沒問題。如果你想運行你的機器人系統(tǒng),沒問題。只是這臺機器的質(zhì)量保證簡直瘋狂。它運行的應用基本上是通用的:世界上開發(fā)的所有東西都應該能在這里運行,包括,如果你是視頻游戲玩家,包括《孤島危機》。所以...如果你能運行《孤島危機》,你就能運行任何東西。好了,這是 RTX 專業(yè)服務器:全新的企業(yè)系統(tǒng)。

所以某些事情正在發(fā)生變化。我們知道人工智能是一項極其重要的技術(shù)。我們現(xiàn)在確鑿無疑地知道,人工智能是一種可能帶來革命性變革的軟件:改變每一個行業(yè)。它能做到這些驚人的事情。這是我們所知道的。我們也知道,處理人工智能的方式與我們過去處理手寫軟件的方式根本不同。機器學習軟件的開發(fā)方式不同,運行方式也不同。系統(tǒng)的架構(gòu),軟件的架構(gòu):完全不同。網(wǎng)絡(luò)的工作方式,完全不同。訪問存儲的方式,完全不同。

所以我們知道這項技術(shù)可以做不同的事情:令人難以置信的事情。它是智能的。我們也知道它的開發(fā)方式根本不同:它需要新的計算機。真正有趣的是,這對各國意味著什么?對企業(yè)、對社會又意味著什么?這是我們近十年前就注意到的一個現(xiàn)象,而現(xiàn)在每個人都開始意識到這一點了:事實上,這些人工智能數(shù)據(jù)中心根本就不是數(shù)據(jù)中心。它們不是傳統(tǒng)意義上的數(shù)據(jù)中心,用來存儲你可以檢索的文件。這些數(shù)據(jù)中心并不存儲我們的文件。它只有一個任務,且僅此一個任務:那就是生成智能標記,即人工智能的生成。

這些人工智能工廠,看起來像數(shù)據(jù)中心,因為里面有大量計算機。但這就是一切崩潰的地方。它的設(shè)計方式、制造規(guī);蛞(guī);涸O(shè)計和建造方式,以及它的使用、協(xié)調(diào)和配置方式;如何運營它,你如何看待它。例如,沒有人真正把他們的數(shù)據(jù)中心當作一個創(chuàng)收設(shè)施來考慮。我說了一句話,大家都說,“是的,我覺得你說得對。”沒人會把數(shù)據(jù)中心當作一個創(chuàng)收設(shè)施來考慮。但他們把自己的工廠,汽車工廠,看作是創(chuàng)收設(shè)施:他們迫不及待地想建另一座工廠,因為每當你建一座工廠,收入很快就會增長。你可以為更多人創(chuàng)造更多東西。

這些想法正是這些人工智能工廠中的想法。它們是創(chuàng)收設(shè)施,旨在制造Token。這些Token可以被重新構(gòu)造成多種行業(yè)的生產(chǎn)性智能,因此人工智能工廠現(xiàn)在已成為一個國家基礎(chǔ)設(shè)施的一部分。這就是為什么你看到我奔走于世界各地,與各國元首會談的原因:因為他們都希望擁有人工智能工廠。他們都希望人工智能成為他們基礎(chǔ)設(shè)施的一部分。他們希望人工智能成為他們的一個增長型制造業(yè)。這確實意義深遠,我認為我們正在討論的是:因此,催生了一場新的工業(yè)革命:因為每一個行業(yè)都受到了影響,同時也誕生了一個新興產(chǎn)業(yè)。

正如電力最初被描述和展示為一項技術(shù)時,后來發(fā)展成為一個新興產(chǎn)業(yè)一樣:它被理解為一項技術(shù),但后來我們意識到它也是一個龐大的產(chǎn)業(yè)。然后是信息產(chǎn)業(yè),我們現(xiàn)在稱之為互聯(lián)網(wǎng)。這兩者都影響了許多行業(yè),成為基礎(chǔ)設(shè)施的一部分。我們現(xiàn)在有了一個新的產(chǎn)業(yè)——人工智能產(chǎn)業(yè):它現(xiàn)在成為了被稱為智能基礎(chǔ)設(shè)施的新基礎(chǔ)設(shè)施的一部分。每個國家、每個社會、每家公司都將依賴它。

你可以看到它的規(guī)模。這是一個被廣泛討論的話題。這是星際之門。這看起來不像數(shù)據(jù)中心。更像是一座工廠。這是一個千兆瓦。它將容納大約 50 萬個 GPU 芯片,產(chǎn)生巨大的智能,供所有人使用。歐洲現(xiàn)在已經(jīng)意識到這些人工智能工廠的重要性。人工智能基礎(chǔ)設(shè)施的重要性,我非常高興看到這里有如此多的活動。

這是歐洲電信公司與 NVIDIA 合作建設(shè)人工智能基礎(chǔ)設(shè)施。這是歐洲云服務提供商與 NVIDIA 合作建設(shè)人工智能基礎(chǔ)設(shè)施。這就是歐洲超級計算中心正在與 NVIDIA 合作建設(shè)下一代人工智能超級計算機和基礎(chǔ)設(shè)施。這僅僅是個開始。這還不包括即將在公共云中推出的內(nèi)容。這還不包括公共云。所以這是由歐洲公司為歐洲市場本土打造的人工智能基礎(chǔ)設(shè)施。此外,還有 20 個正在規(guī)劃中的人工智能工廠,其中幾個是千兆瓦級的超級工廠?偣矁H用兩年時間,我們將在歐洲將人工智能計算能力提升 10 倍。因此,研究人員、初創(chuàng)企業(yè),你們的人工智能短缺、你們的 GPU 短缺很快就會得到解決。它正向你走來。

現(xiàn)在,我們正在與每個國家合作,發(fā)展他們的生態(tài)系統(tǒng)。因此,我們正在七個不同的國家建立人工智能技術(shù)中心。這些人工智能技術(shù)中心的目標是:第一,進行合作研究,與初創(chuàng)企業(yè)合作;同時構(gòu)建生態(tài)系統(tǒng)。讓我向你展示一個生態(tài)系統(tǒng)的樣子。我昨天剛剛在英國。這些生態(tài)系統(tǒng)都是建立在 NVIDIA 技術(shù)棧之上的。例如,正如你所知,每一臺 NVIDIA 設(shè)備:NVIDIA 是唯一在所有云平臺上可用的 AI 架構(gòu)。除了 x86 之外,它是唯一無處不在的計算架構(gòu)。

我們與所有云服務提供商合作。我們加速全球最重要軟件開發(fā)商的應用:包括歐洲的西門子、Cadence、紅帽、ServiceNow。我們重新定義了計算堆棧。正如你所知,計算不僅僅是計算機:而是計算、網(wǎng)絡(luò)和存儲的結(jié)合。每一層,每一個堆棧都被重新定義了。與思科的合作非常出色,他們昨天在會議上宣布了基于 NVIDIA 的全新型號。戴爾,出色的合作伙伴,NetApp,Nutanix,還有一大批優(yōu)秀的合作伙伴。

正如我之前提到的,軟件開發(fā)的方式已經(jīng)發(fā)生了根本性的變化,F(xiàn)在不再只是編寫 C 程序,編譯 C 程序、交付 C 程序……現(xiàn)在是 DevOps、MLOps、AIOps。整個生態(tài)系統(tǒng)正在被重新構(gòu)建,我們在各地都有生態(tài)合作伙伴。當然,還有解決方案集成商和提供商,他們可以幫助每家公司整合這些能力。

在英國,我們有一些特別的合作公司:從研究人員到開發(fā)者,再到合作伙伴,這些真正了不起的公司幫助我們提升本地經(jīng)濟和本地人才的技能;使用這些技術(shù)的企業(yè),當然還有云服務提供商。我們在英國有很棒的合作伙伴。我們在德國有很棒的合作伙伴,德國的合作關(guān)系非常非常出色。我們在意大利也有很好的合作關(guān)系,當然我們在法國這里也有令人驚嘆的合作伙伴。

沒錯,加油法國。馬克龍總統(tǒng)稍后會到場。我們將討論一些新的——一些新的公告,所以我們必須對人工智能表現(xiàn)出一些熱情,好嗎?是的。就是這樣。給他一些熱情。所以這里,在法國,有非常棒的合作伙伴關(guān)系。我想特別強調(diào)一個合作伙伴:我們與施耐德的合作。構(gòu)建...甚至建造這些人工智能工廠,我們現(xiàn)在都是數(shù)字化建造的。我們通過數(shù)字化設(shè)計它們,我們通過數(shù)字化制造它們;我們通過數(shù)字化操作或優(yōu)化它們,最終我們甚至會在數(shù)字孿生中完全數(shù)字化地優(yōu)化和操作它們。

這些人工智能工廠非常昂貴,有時高達 500 億美元,未來將達到 1000 億美元。如果該工廠的利用率未達到最大化,工廠所有者將面臨巨大的成本壓力。因此,我們需要在任何可能的地方實現(xiàn)數(shù)字化并使用人工智能:將一切都放入元宇宙,以便我們能夠獲得直接且持續(xù)的遙測數(shù)據(jù)。我們今天宣布了一項偉大的合作伙伴關(guān)系:一家年輕的公司,一位我非常喜歡的首席執(zhí)行官,他正試圖打造一家歐洲的人工智能公司。這家公司的名字叫 Mistral。

今天我們宣布,我們將在這里共同打造一個 AI 云平臺,用于部署他們的模型,以及為 AI 生態(tài)系統(tǒng)中的其他初創(chuàng)企業(yè)提供 AI 應用,使他們能夠使用 Mistral 模型或任何他們喜歡的模型。所以 Mistral 和我們將合作在這里建設(shè)一個非常龐大的人工智能云平臺。我們會講……今天稍后我們會和馬克龍總統(tǒng)詳細談論這件事。

人工智能技術(shù)正以光速發(fā)展。我這里展示的是左側(cè)的專有模型,正以光速前進。然而,開源模型也在以光速發(fā)展。僅落后幾個月。無論是 Mistral、LLaMA,還是即將推出的 DeepSeek R1、R2:第一季度,這些模型都非常出色。每一個都非常出色。因此,過去幾年里,我們致力于匯聚世界頂尖的人工智能研究人員,進一步提升這些人工智能模型的性能。我們稱之為 Nemotron。

基本上,我們所做的是采用開源模型(當然,這些模型無一例外都是基于 NVIDIA 構(gòu)建的),然后我們進行后期訓練。我們可能會進行神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索……我們可能會進行神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索,提供更優(yōu)質(zhì)的數(shù)據(jù)。使用強化學習技術(shù),增強這些模型,賦予其推理能力:擴展上下文,使其在與你互動之前能夠?qū)W習和閱讀更多內(nèi)容。大多數(shù)這些模型的上下文相對較短:我們希望它具備強大的上下文處理能力,因為我們想在企業(yè)應用中使用它,而我們希望進行的對話內(nèi)容并不在互聯(lián)網(wǎng)上。這些內(nèi)容存在于我們公司內(nèi)部,因此我們必須為它加載大量的上下文信息。

所有這些能力隨后被打包成一個可下載的 NIM。你可以訪問 NVIDIA 的網(wǎng)站,直接下載一個 API:一個最先進的 AI 模型,放置在你喜歡的任何地方,然后我們會大幅提升它的性能。這是 Nemotron 相較于 LLaMA 的改進示例。這是通過我們的后訓練能力改進的 LLaMA 8B、70B、405B 模型。推理能力的擴展,我們提供的所有數(shù)據(jù)極大地增強了它。我們將一代又一代地持續(xù)進行下去。

所以,對于所有使用 Nemotron 的人來說,你們將會知道未來還有一大批其他模型。而且它們本來就是開源的,所以如果你想從開源模型開始,那太棒了。如果你想從 Nemotron 模型開始,那太棒了。Nemotron 模型的性能非常出色。在一次又一次的基準測試中,Nemotron 的表現(xiàn)始終位居榜首。所以現(xiàn)在你知道,你可以使用一個依然開放的增強型開放模型。那是領(lǐng)導者榜單的頂端,你知道 NVIDIA 致力于此:所以我會一直做到生命的盡頭,好嗎?

這個策略太棒了,這個策略太棒了,以至于區(qū)域模型制造商——歐洲各地的模型構(gòu)建者們現(xiàn)在都認識到這個策略的美妙之處:我們正在合作,共同調(diào)整和提升每一個區(qū)域語言的模型。您的數(shù)據(jù)屬于您。您的數(shù)據(jù)屬于您。它是您民族的歷史,是您民族的知識。你們民族的文化。它屬于你們,對于許多公司來說:以 NVIDIA 為例,我們的大部分數(shù)據(jù)都存儲在內(nèi)部。33 年的數(shù)據(jù)。我今天早上在查資料,西門子:180 年的數(shù)據(jù),其中一些記錄在紙草上。Roland Busch 來了。我,我想捉弄一下 Roland Busch,我親愛的朋友。所以,你得先把它數(shù)字化,AI 才能學習。所以,是的,數(shù)據(jù)屬于你。你應該使用這些數(shù)據(jù),使用像 Limotron 這樣的開源模型和我們提供的所有工具套件,這樣你就可以為自己的用途進行增強。

我們還宣布,我們與 Perplexity 建立了良好的合作關(guān)系。Perplexity 是一款推理搜索引擎。是的。我使用的三個模型是 ChatGPT、Gemini Pro 和 Perplexity。這三個模型我交替使用,Perplexity 非常出色。我們今天宣布,Perplexity 將整合這些區(qū)域模型,直接接入 Perplexity,讓你能夠用你的語言提問并獲得答案:以你所在國家的文化和感知方式,明白了嗎?所以是 Perplexity 區(qū)域模型。

二、AI 已進入Agent時代

Agent智能體是一個非常重要的事情。正如你所知,起初,使用預訓練模型時,人們說,“但它會產(chǎn)生幻覺。它會編造內(nèi)容。”你說得完全正確。“它無法獲取最新的新聞和數(shù)據(jù)信息。”完全正確。“它在沒有推理分析問題的情況下就放棄了。”“就好像每一個答案都必須從過去記憶中獲得。”你說得完全正確。所有這些事情,你知道的,為什么它要試圖弄清楚如何加法或者計算計數(shù)數(shù)字并相加?為什么它不直接用計算器?你說得完全正確。

因此,所有與智能相關(guān)的能力——每個人都能提出批評,但這完全正確,因為大家大致了解智能是如何運作的。但這些技術(shù)正在全球范圍內(nèi)被開發(fā)建設(shè):它們?nèi)繀R聚在一起,從增強檢索生成到網(wǎng)絡(luò)搜索,再到多模態(tài)理解,這樣你就可以閱讀 PDF 文件、訪問網(wǎng)站,查看圖片和文字、聽視頻,觀看視頻,然后將所有這些理解融入你的語境中。你現(xiàn)在當然也可以理解幾乎任何事物的提示。你甚至可以說,“我要問你一個問題,但從這張圖片開始。”我可以說:“從這個開始,先從這段文字開始再回答”,回答問題或執(zhí)行我要求你做的事。”然后它會自行推理、計劃和自我評估。

所有這些能力現(xiàn)在都已整合,你可以看到它們在市場上隨處可見。具代理性的人工智能是真實存在的。自主智能是一次從一次性人工智能邁出的巨大飛躍。一次性人工智能是必要的基礎(chǔ),它讓我們能夠教會智能體如何成為智能體。你需要具備一定的知識基礎(chǔ)和推理能力,才能具備可教性。預訓練關(guān)乎人工智能的可教性。后訓練、強化學習、監(jiān)督學習、人類示范、上下文提供、生成式人工智能,所有這些正在融合,形成如今的智能代理人工智能。

讓我們來看一個例子。讓我給你展示點東西。它基于 Perplexity 構(gòu)建,非?帷

(伴奏音樂播放)人工智能代理是數(shù)字助理;谔崾,它們進行推理并將問題分解為多步驟計劃。它們使用合適的工具,與其他代理協(xié)作,并利用記憶中的上下文在 NVIDIA 加速系統(tǒng)上正確執(zhí)行任務。一切從一個簡單的提示開始。讓我們請 Perplexity 幫忙在巴黎開一家餐車。

首先,Perplexity 代理通過提示進行推理并制定計劃,然后調(diào)用其他代理使用多種工具幫助解決每個步驟。市場研究員閱讀評論和報告,以發(fā)現(xiàn)趨勢并分析競爭市場。基于這項研究,概念設(shè)計師探索當?shù)厥巢牟⑻岢霭瑴蕚鋾r間估算的菜單,并研究調(diào)色板,生成品牌識別。然后,財務規(guī)劃師使用蒙特卡洛模擬來預測盈利能力和增長軌跡。一名運營策劃人員制定了包含每個細節(jié)的發(fā)射時間表:從購買設(shè)備到獲取正確的許可。市場專員制定了包含社交媒體活動的發(fā)射計劃,甚至編寫了一個包含地圖的互動網(wǎng)站、菜單和在線訂購。

每個代理的工作匯集成最終的方案提案。一切都始于一個簡單的提示。一個提示,就像那樣的一個提示,在原始聊天機器人中,可能只會生成幾百個標記。但現(xiàn)在只需一個提示,交給代理去解決問題,它生成的標記數(shù)量必定多出一萬倍。這就是為什么需要 Grace-Blackwell 的原因:這就是為什么我們需要性能以及系統(tǒng)在代際之間有更大提升的原因。這就是 Perplexity 構(gòu)建他們的智能代理的方式。每家公司都必須構(gòu)建自己的智能代理。

這太棒了,你將會從 OpenAI、Gemini、微軟 Copilot、Perplexity、Mistral 等平臺招聘代理。也會有為你量身打造的代理。他們可能會幫助你規(guī)劃一次假期,或者你知道,去做一些研究,諸如此類。然而,如果你想創(chuàng)辦一家公司,你將需要專用的代理和專用的工具,以及使用專用的工具和專用的技能。那么問題是,你如何構(gòu)建這些代理?

因此,我們?yōu)槟銊?chuàng)建了一個平臺。我們創(chuàng)建了一個框架和一套工具供您使用,還有一大批合作伙伴幫助您實現(xiàn)目標。這一切從最底層開始,最底層:我之前提到的推理模型能力。NVIDIA 的 NeMo、NeMotron 推理大型語言模型是世界一流的。我們有 NeMo Retriever,這是一款多模態(tài)搜索引擎。語義搜索引擎。令人難以置信。我們構(gòu)建了一個藍圖,一個可運行的演示,基本上是一個通用智能體。我們稱之為 IQ,AI,AIQ。

最上層,我們有一套工具,允許你引入一個代理:一個通用代理,整理數(shù)據(jù)來教它;評估它,設(shè)定安全邊界,監(jiān)督訓練它,使用強化學習直到部署;保持安全,確保保障。這套工具包已經(jīng)集成,這些庫也已集成到 AIOps 生態(tài)系統(tǒng)中。你也可以直接從我們的網(wǎng)站下載。但它主要集成在 AIOps 生態(tài)系統(tǒng)中;诖耍憧梢詣(chuàng)建自己的專屬代理。

許多公司都在這樣做。這是思科,他們昨天宣布,“我們正在共同構(gòu)建用于安全的人工智能平臺。”現(xiàn)在,看看這個。人工智能代理,而不是一個模型完成所有這些驚人的任務:它是一個模型集合,一個系統(tǒng)。它是一個由大型人工智能語言模型組成的系統(tǒng)。其中一些經(jīng)過專門優(yōu)化,適用于某些特定類型的任務。檢索,正如我提到的,使用計算機執(zhí)行技能。你不想把所有這些東西捆綁成一個龐大的,你知道的,人工智能整體,而是將其拆分成小部分,然后可以隨著時間推移部署持續(xù)集成/持續(xù)交付。這是思科的一個例子。

現(xiàn)在的問題是,如何部署這個?因為正如我之前提到的,NVIDIA 的計算資源存在于公共云中。有區(qū)域云,我們稱之為 NCP。這里,比如說 Mistral。你可能因為安全需求和數(shù)據(jù)原因擁有私有云。數(shù)據(jù)隱私要求。你甚至可能會決定桌子上放些什么東西。那么問題是,你如何運行所有這些?有時它們位于不同的地方,因為這些都是微服務:這些是能夠相互交流的人工智能,它們顯然可以通過網(wǎng)絡(luò)相互通信。

那么,如何部署所有這些微服務呢?現(xiàn)在,我們有了一個很棒的系統(tǒng)。我很高興能為大家宣布這一消息。這就是我們的 DGX Lepton。DGX Lepton,你現(xiàn)在看到的是各種不同的云。這里是 Lambda 云,AWS 云,你知道的。這是你自己的開發(fā)者機器,你自己的系統(tǒng):可以是一臺 DGX 工作站。NeBS、Yotta、Nscale?赡苁 AWS,也可能是 GCP。NVIDIA 的架構(gòu)無處不在。

因此,您可以決定在哪里運行您的模型。你通過一個超級云來部署它,所以它是一個云中之云。一旦你讓它運行起來,一旦你將這些 NIMs 部署到 Lepton 中,它就會在你選擇的各種云上托管和運行。一種模型架構(gòu),一次部署,隨處運行。你甚至可以在這臺小小的機器上運行它。你知道,這個 DGX Spark,它是, 它是……這是,現(xiàn)在是咖啡時間嗎?看看這個。

這臺電梯有 2000 馬力。這是我最喜歡的小機器。DGX Spark。第一個……人工智能超級計算機,我們在 2016 年建造了一臺人工智能超級計算機。它被稱為 DGX-1。它是我剛才提到的所有技術(shù)的第一個版本。八個 Volta GPU 通過 NVLink 互聯(lián)。我們花費了數(shù)十億美元來建造它,而在我們宣布它的那一天:DGX-1,沒有客戶。沒有興趣,沒有掌聲。百分之百的困惑。為什么有人會造那樣的電腦?它能運行 Windows 嗎?不能。

所以我們還是造了它。謝天謝地,是一家年輕的公司,一家初創(chuàng)企業(yè):舊金山的一家非營利初創(chuàng)公司看到這臺電腦時非常高興,他們說:“我們能要一臺嗎?”我當時想:“天哪,我們賣出一臺了。”但后來我發(fā)現(xiàn)那是一家非營利組織。但是它……我把一臺電腦,呃——一臺 DGX-1 放進了我的車里,然后我開車把它帶到了舊金山。那家公司的名字叫 OpenAI。

所以我不知道這其中的生活教訓是什么。有很多非營利組織,你知道的。所以下次,下次……但是……也許教訓是:如果有開發(fā)者聯(lián)系你:“需要,需要一個 GPU,”答案是肯定的。所以,所以……沒錯。

想象一下你擁有 Lepton。它就在你的瀏覽器中,你擁有,你擁有,這個,這個 Helm Chart。你開發(fā)了一個人工智能代理,想在這里運行它:其中一部分你想在 AWS 上運行,還有一部分你想在其他地方運行,知道嗎?在某個區(qū)域云中。你使用 Lepton,部署你的 Helm Chart,它就神奇地出現(xiàn)在這里。好嗎?如果你想在這里運行它,直到完成并準備好部署到云端:太好了。但美妙之處在于,這一架構(gòu)基于 Grace Blackwell。GB10 對比 GB200 對比 GB300,以及所有這些不同版本的... 但這一架構(gòu)正是 Grace Blackwell。這真是令人驚嘆。

所以我們正在為 Lepton 做這件事,但接下來:Hugging Face 和 NVIDIA 已經(jīng)將 Lepton 連接在一起。因此,每當你在 Hugging Face 上訓練模型時,如果你想將其部署到 Lepton:并直接部署到 Spark,也沒問題。只需輕輕一擊。無論你是在訓練還是推理,我們現(xiàn)在都已接入 Hugging Face,Lepton 將幫助你決定部署位置。讓我們來看看。開發(fā)者需要輕松且可靠地訪問計算資源,以跟上他們的工作節(jié)奏:無論他們身處何地,無論他們在構(gòu)建什么。

DGX Cloud Lepton 提供按需訪問跨云的全球 GPU 網(wǎng)絡(luò):地區(qū)和合作伙伴,如 YOTA 和 Nebious。多云 GPU 集群通過單一統(tǒng)一界面進行管理。資源配置速度快。開發(fā)者可以快速擴展節(jié)點數(shù)量,無需復雜設(shè)置,使用預集成工具和訓練就緒的基礎(chǔ)設(shè)施立即開始訓練。進度實時監(jiān)控。GPU 性能、收斂性和吞吐量盡在掌握。您可以直接在控制臺內(nèi)測試您的微調(diào)模型。

DGX Cloud Lepton 可以在多個云或區(qū)域部署 NIM 端點或您的模型,實現(xiàn)快速分布式推理。就像網(wǎng)約車應用連接乘客和司機一樣,DGX Cloud Lepton 連接開發(fā)者與 GPU 計算能力:驅(qū)動虛擬全球 AI 工廠。DGX Cloud Lepton。

好了,這就是思科。這是 SAP 的做法,他們正在 NVIDIA 上構(gòu)建一個人工智能平臺。Sana 正在 NVIDIA 上構(gòu)建一個人工智能業(yè)務應用自動化系統(tǒng)。DeepL 正在基于 NVIDIA AI 構(gòu)建他們的語言框架和平臺。Photoroom,一款視頻編輯和人工智能編輯平臺:他們的平臺基于 NVIDIA 構(gòu)建。這是 KODO,我記得以前是,應該是 Codium,基于 NVIDIA 構(gòu)建的令人難以置信的編碼代理。這是 Iola,一個基于 NVIDIA 構(gòu)建的語音平臺。這個是一個,臨床試驗平臺:全球最大的基于 NVIDIA 的臨床試驗自動化平臺。

所以所有這些,基本上都是建立在同一個理念之上:NIMS,將其封裝并打包在一個虛擬容器中,您可以在任何地方部署。Nemotron 大型語言模型,或其他大型語言模型:比如 Mistral 或其他。我們隨后整合了涵蓋 AI 整個生命周期的庫:一個人工智能代理。你對待人工智能代理的方式有點像對待數(shù)字員工。所以你的 IT 部門需要對他們進行入職培訓:微調(diào)它們,訓練它們,評估它們,保持它們的安全防護;你知道,保持它們的安全,并不斷改進它們。整個框架平臺就叫做 Nemo,所有這些現(xiàn)在都被整合到全球一個又一個的應用框架中。這只是其中幾個的例子。

現(xiàn)在我們讓您能夠在任何地方部署它們。如果你想在云端部署它:你在云端有 GB2 00s。如果你想在本地部署,因為你有VMware 或 Red Hat Linux 或者Nutanix,如果你想在本地的虛擬機上部署它:你可以這么做。如果你想把它部署成私有云:你可以做到這一點。你可以將它全部部署在你的 DGX Spark 或 DGX Station 上。沒問題。所以 Lepton 會幫助你完成所有這些。

三、AI工業(yè)革命與數(shù)字孿生

讓我們來談談工業(yè)人工智能。這是我最喜歡的時刻之一。這是羅蘭·布施。他剛剛,這真是一個非常有趣的時刻。他想提醒我,神經(jīng)計算機:神經(jīng)網(wǎng)絡(luò)計算機是在歐洲發(fā)明的。這就是整張幻燈片的內(nèi)容。Le- 我只是,真的是一個非常棒的時刻。這是 Synapse I。這真是太不可思議了,大家。Synapse I。這是 1992 年的 Synapse I,它運行神經(jīng)網(wǎng)絡(luò)的速度比當時的 CPU 快 8000 倍。這難道不可思議嗎?這就是世界上最強的人工智能計算機。

而且,Roland 只是想,想說:“永遠不要忘記這一點,Jensen。”永遠,永遠不要忘記這一點。”我說,“好的,我會記住的。”好吧。我會告訴的,甚至會告訴所有人。西門子 1992 年。西門子 1992 年。我們與西門子有著良好的合作關(guān)系——西門子,還有,羅蘭·布什,首席執(zhí)行官:就是,給公司注入超級動力,使他們能夠?qū)崿F(xiàn)飛躍:完全跨越上一輪信息技術(shù)產(chǎn)業(yè)革命,融合歐洲的工業(yè)能力:將西門子的工業(yè)能力和實力與人工智能結(jié)合起來,并創(chuàng)造所謂的工業(yè)人工智能革命。

我們在許多不同領(lǐng)域與西門子合作:從設(shè)計、仿真、工廠數(shù)字孿生到工廠中人工智能的運營,涵蓋方方面面。從頭到尾的一切。這讓我想起,也讓我自己想起:歐洲的工業(yè)能力是多么令人難以置信;這對你來說是一個非凡的機會。多么非凡的機會,因為人工智能不同于傳統(tǒng)軟件。人工智能實際上是非常非常智能的軟件。這款智能軟件終于能夠做一些可能徹底改變您所服務行業(yè)的事情。

所以我們制作了一段情書視頻,如果你愿意這么說的話。讓我們開始吧。

視頻:一切始于此地。第一次工業(yè)革命。瓦特的蒸汽機和機械織機引入了自動化和工廠的出現(xiàn):工業(yè)由此誕生。

電氣時代。安培揭示了電磁學的奧秘。法拉第制造了第一臺電動發(fā)電機,麥克斯韋奠定了現(xiàn)代電氣工程的基礎(chǔ)。西門子和惠斯通的發(fā)電機,電力的引擎:讓機器、火車、工廠和城市煥發(fā)生機,為地球通電,點燃現(xiàn)代制造業(yè)。

而今天,源自計算與信息時代:第四次工業(yè)革命,人工智能時代:重新構(gòu)想工業(yè)的每一個環(huán)節(jié)。

在整個大陸,工業(yè)人工智能正在迅速普及。從設(shè)計到工程,您正在開辟通往理解與創(chuàng)新的新路徑。您將物理世界引入虛擬空間,以規(guī)劃和優(yōu)化全球現(xiàn)代工廠。

您正在構(gòu)建下一個前沿,那里所有移動的事物都是機器人。每輛汽車都是一個智能的自主代理,同時也是一支新的協(xié)作勞動力,助力彌合全球勞動力短缺的缺口。

整個大陸的開發(fā)者們正在打造各種類型的機器人:在數(shù)字孿生世界和機器人管道中教它們學習新技能;讓他們準備好與我們一起在工廠工作:倉庫、手術(shù)室以及家中。

第四次工業(yè)革命就在這里,正是在第一次工業(yè)革命的發(fā)源地。

黃仁勛:你怎么看?我喜歡那個視頻。是你做的。太棒了。你成功了。我們正在與一家又一家公司合作,致力于工業(yè)人工智能的開發(fā)。這是寶馬在元宇宙中建設(shè)他們的下一代工廠。這個,我不知道該怎么說。有人能教我嗎?Buges?聽起來不錯。嗯……完全正確。完全正確。干得好。干得好。完全正確。他們,他們當然是在建他們的工廠。Omniverse 中的數(shù)字孿生。這是他們的一個關(guān)鍵,呃:他們用于倉庫物流的數(shù)字孿生。

這是梅賽德斯-奔馳及其在 Omniverse 中構(gòu)建的工廠數(shù)字孿生。這是舍弗勒及其在 Omniverse 中構(gòu)建的倉庫數(shù)字孿生。這是你們在法國的火車站:在 Omniverse 中構(gòu)建他們火車站的數(shù)字孿生。這是豐田在 Omniverse 中構(gòu)建他們倉庫的數(shù)字孿生。當你在 Omniverse 中構(gòu)建這些倉庫和工廠時,那么你可以,你可以設(shè)計...你可以設(shè)計...你可以設(shè)計它,你可以規(guī)劃它,你可以改變它。在綠地環(huán)境中它很棒,在棕地環(huán)境中也很棒。你可以在實際搬動和調(diào)整之前模擬其效果,避免發(fā)現(xiàn)它并非最優(yōu)。

因此,在數(shù)字孿生中實現(xiàn)一切數(shù)字化的能力是令人難以置信的。但問題是,為什么數(shù)字孿生必須看起來像照片一樣真實?為什么它必須遵守物理定律?原因是我們最終希望成為一個數(shù)字孿生體,讓機器人能夠?qū)W習如何作為機器人操作。而機器人依賴光子來實現(xiàn)其感知系統(tǒng)。這些光子是通過 Omniverse 生成的。機器人需要與物理世界互動,這樣它才能知道自己是否在做正確的事情,并且能夠……學會如何正確地去做,因此這些數(shù)字孿生必須看起來真實,行為也要逼真。明白了嗎?這就是構(gòu)建 Omniverse 的原因。

這,太棒了。這是一個聚變反應堆的數(shù)字孿生。這是一件極其復雜的儀器,正如你所知:沒有人工智能,下一代聚變反應堆是不可能實現(xiàn)的。我們正在……我們今天宣布,我們將在歐洲這里建設(shè)世界上第一個工業(yè)人工智能云。我要宣布——是的。

這些工業(yè)人工智能云,確實是大量的計算資源……云端有大量的計算機。然而,它在性能和安全性方面的要求根本不同。所以我將在周五向大家詳細介紹。今天我只是先賣個關(guān)子。但這個工業(yè)云將用于設(shè)計和仿真。虛擬風洞,你只需走進去:虛擬風洞,你只需把車開進去,就能看到它的表現(xiàn)。開門、開窗、改變設(shè)計,所有操作完全實時進行。實時設(shè)計,數(shù)字風洞中模擬:風洞的數(shù)字孿生,實時呈現(xiàn):在數(shù)字工廠中建造它。實時數(shù)字孿生。

所有這些,以及機器人如何學習成為優(yōu)秀的機器人并打造我們未來的機器人。自動駕駛汽車等。我們這里已經(jīng)擁有了龐大的生態(tài)系統(tǒng)。正如你所知,我們已經(jīng)在這里待了很長時間。NVIDIA 已有 33 年歷史。我們第一次來到歐洲,是在工作站和產(chǎn)品數(shù)字化興起的時候。CAD,CAD 革命開始的時候。我們經(jīng)歷了 CAE 革命,現(xiàn)在正處于數(shù)字孿生革命時期。這里在歐洲有大約兩萬億美元的生態(tài)系統(tǒng),我們與之合作……并且有幸為其提供支持。

由此產(chǎn)生的是一場正在發(fā)生的新革命。正如你所知,所有會動的東西都將是機器人。所有會動的東西都將由人工智能驅(qū)動。而汽車是最明顯的下一個領(lǐng)域。英偉達打造用于訓練模型的人工智能超級計算機:用于 Omniverse 數(shù)字孿生的人工智能超級計算機。我們還為機器人本身打造人工智能超級計算機。無論是在云端:用于 Omniverse,還是在汽車中,我們都提供完整的技術(shù)棧:包括計算機本身,以及運行在這臺計算機上的操作系統(tǒng):每一種情況都不同。

這臺計算機高速且傳感器豐富,必須具備功能安全性。在任何情況下都絕不能完全失效。因此,安全要求極高,F(xiàn)在我們有了一個令人難以置信的模型,運行在其之上。這個運行在其之上的模型是一個變換器模型。它是一個推理模型,能夠接收傳感器輸入:你告訴它你想做什么,它就會帶你去那里。接收像素輸入并生成路徑規(guī)劃輸出。所以它是一個基于變換器的生成式人工智能模型。令人難以置信的技術(shù)。英偉達的人工智能團隊,AV 團隊,令人難以置信。這是我所知道的唯一一支連續(xù)兩年在 CVPR 端到端自動駕駛汽車挑戰(zhàn)賽中獲勝的團隊:所以他們今年再次獲勝。讓我們來看一下視頻。是的,謝謝。

(器樂音樂)像任何司機一樣,自動駕駛車輛在一個充滿不可預測且可能危及安全的場景中運行。NVIDIA DRIVE,基于 HALO 安全系統(tǒng)構(gòu)建:讓開發(fā)者使用多樣的軟件堆棧、傳感器和冗余計算機構(gòu)建安全的自動駕駛車輛。

一切始于訓練。安全的自動駕駛車輛需要大量多樣化的數(shù)據(jù),以應對各種邊緣情況。但現(xiàn)實世界的數(shù)據(jù)有限。開發(fā)者使用 NVIDIA Omniverse 和 Cosmos 重建現(xiàn)實世界,生成逼真的合成訓練數(shù)據(jù),為自動駕駛模型帶來多樣性。該模型能夠感知并推理其環(huán)境。預測未來結(jié)果,并生成運動計劃....以及用于決策多樣性。一個獨立的經(jīng)典堆棧并行運行。安全護欄監(jiān)控安全性能,在出現(xiàn)異常時會調(diào)用仲裁器進行緊急停止。傳感器和計算架構(gòu)中還內(nèi)置了更多的多樣性和冗余。每個傳感器都連接到冗余計算機,因此即使傳感器或計算機發(fā)生故障,車輛仍然保持安全并正常運行。在發(fā)生關(guān)鍵故障的情況下,系統(tǒng)可以執(zhí)行最低風險的操作,比如靠邊停車。安全是自動駕駛的基礎(chǔ)。NVIDIA DRIVE 讓全球開發(fā)者能夠?qū)?HALOS 集成到他們自己的產(chǎn)品中,打造下一代安全的自動駕駛汽車。

十億輛汽車上路,平均每年行駛一萬英里,一萬億英里。自動駕駛的未來顯然是巨大的,它將由人工智能驅(qū)動和支持。這是下一個巨大的機遇,我們正在與全球眾多大型且卓越的公司合作,使這一切成為可能。在我們所有與自動駕駛相關(guān)的工作中,安全始終是核心。我們對我們的 HALOS 系統(tǒng)感到非常自豪。它始于芯片的架構(gòu),然后是芯片設(shè)計和系統(tǒng)設(shè)計,操作系統(tǒng)、人工智能模型以及軟件開發(fā)的方法論,我們測試的方式,從訓練模型的方法到為模型提供的數(shù)據(jù),再到評估模型的方式。NVIDIA 的 HALOS 系統(tǒng)以及我們的自動駕駛安全團隊和能力在全球享有盛譽。這臺計算機是第一臺軟件定義的計算機。全球首個完全 100%軟件定義的、由人工智能驅(qū)動的軟件,面向自動駕駛汽車的增強現(xiàn)實人工智能驅(qū)動堆棧。我們已經(jīng)從事這項工作將近十年了,這一能力享譽全球,我對此感到非常自豪。

汽車行業(yè)正在發(fā)生的變化,同樣也正在一個新興產(chǎn)業(yè)中上演。正如我之前提到的,如果你能根據(jù)提示生成視頻,如果人工智能能夠感知,它就能推理,還能生成視頻、文字和圖像,剛才提到的汽車、路徑、方向盤路徑,為什么它不能同時產(chǎn)生局部運動能力和關(guān)節(jié)活動能力?因此,人工智能徹底改變機器人領(lǐng)域最難問題之一的基本能力即將到來。類人機器人將成為現(xiàn)實。我們現(xiàn)在知道如何構(gòu)建這些東西,訓練這些東西,以及操作這些東西。人形機器人可能將成為有史以來最大的產(chǎn)業(yè)之一,這需要那些懂得制造東西的公司,制造具有非凡能力的東西。這指的是歐洲國家。世界上許多產(chǎn)業(yè)都基于這里。我認為這將是一個巨大的機遇。好吧,假設(shè)全球有十億臺機器人。擁有十億機器人是一個非常合理的想法。那么,為什么這還沒有發(fā)生呢?原因很簡單。如今的機器人編程太復雜。只有最大的公司才能負擔得起安裝機器人。讓機器人學習,編程使其執(zhí)行完全正確的操作。保持足夠的包圍以確保安全。這就是為什么世界上最大的汽車公司都配備了機器人。它們體積足夠大,工作足夠重復。確實,行業(yè)已經(jīng)達到足夠的規(guī)模,可以在這些工廠部署機器人。幾乎所有中小型企業(yè)都是如此,無論是夫妻店、餐館、商店還是倉庫。直到現(xiàn)在,實現(xiàn)那種編程能力是不可能的。我們將為你提供本質(zhì)上可以教導的機器人。它們會向你學習。

正當我們在討論自主智能時,我們現(xiàn)在擁有能夠通過教學學習的人形智能,使用的工具包與 Nemo 工具包非常——非常一致,我——我剛才提到了。NVIDIA HERE 同樣是建立在三層堆棧之上。我們打造了這臺計算機,名為 Thor,Thor 計算機。開發(fā)套件看起來大致是這樣的。這是一臺完全自給自足的機器人電腦。開發(fā)套件放在你的桌面上。這些都是傳感器,內(nèi)部是一顆小型超級計算機 Thor 芯片。真是非常,非常令人難以置信。這些——……是的。我可以,我可以想象把這個插進去,就像那樣。好的。謝謝你,珍妮。(清嗓子)這就是 Thor 處理器。上面是為機器人設(shè)計的操作系統(tǒng)。此外,變換器模型接收傳感器數(shù)據(jù)和指令并進行轉(zhuǎn)換,生成飛行路徑或軌跡,以及手臂關(guān)節(jié)的運動控制,手指關(guān)節(jié)的運動控制,當然還有你的腿部關(guān)節(jié)運動控制。

現(xiàn)在,人形機器人面臨的最大挑戰(zhàn)是訓練所需的數(shù)據(jù)量非常、非常難以獲取。那么問題是你如何做到這一點?解決這個問題的方法是回到 Omniverse,一個遵循物理定律的數(shù)字孿生世界。這是我們正在做的一項令人難以置信的工作。別做。別……(詭異音樂響起)哦,天哪,是我的錯。好的,這些是機器人。我們有……我們開發(fā)了計算機來模擬,來訓練它們。計算機來模擬它們,以及裝在它們內(nèi)部的計算機。全球正在建立大量的人形機器人公司。他們都看到了徹底變革這一新領(lǐng)域的巨大機遇?梢哉f是一種新設(shè)備,進展非常迅速。它們學習的方式是在一個虛擬世界中學習,而這個虛擬世界必須遵守物理定律。最近,我們宣布了與迪士尼研究院和 DeepMind 的一項重大合作,我們將共同努力,打造世界上最復雜的物理模擬。

此刻,我只是在努力弄清楚如何切換到那張幻燈片。教我。誰和我一起?(詭異的音樂響起)這就是只排練一次的后果。好吧,這個,這個令人難以置信的系統(tǒng),就是一個人工智能學習如何成為人工智能的地方。讓我給你展示一下。

(歡快的音樂播放)(鳥鳴)(嗶嗶聲)(口哨聲)(水花聲)(雷聲)(吱吱聲)(口哨聲)我們有一位特別嘉賓。你的名字是格雷克。你是,你是……你是小男孩還是小女孩?好的。他是……格瑞克是一個小女孩,F(xiàn)在,看這個。Grek 學會了在 Omniverse 中行走,遵守物理定律。而在 Omniverse 中,我們創(chuàng)建了成千上萬個場景。最后,當 Grek 學會了如何在那些環(huán)境中操作、行走和操控時,在沙地上,在礫石上,在滑溜的地板上,在混凝土上,在地毯上,那么當涉及到當 Grek 進入物理世界時,物理世界只是世界的第 100,001 個版本。所以你學會了在虛擬世界中行走,看看你現(xiàn)在的樣子。你能……你能跳嗎?哇。你會跳舞嗎?(嗶嗶聲)(電子薩克斯演奏)我覺得……我覺得,嗯……我只是想讓你知道,我是主旨演講者。所以我需要你……我需要你表現(xiàn)得規(guī)規(guī)矩矩。我需要你乖一會兒。我需要你乖一會兒,S-...你能坐下嗎?坐下。(電子音樂播放)嘿,你知道我們應該做什么嗎?我們來給大家拍張照片。(相機快門聲)是的。砰,砰。你愿意跟我回家嗎?你想跟我回家嗎?我有點—(嗶)是的,我知道。是的,我有寵物。他們想把你當作寵物。不想嗎?(esqmas 音樂播放)哦,哦。不。你真聰明。你真聰明。太不可思議了,對吧?你是世界上最棒的機器人,總有一天我們都會擁有一個像你這樣的。他們會跟著我們到處走。但如果我需要……如果我需要一杯威士忌,你得去告訴別人幫我拿杯威士忌,因為你沒有手臂。(電子音樂播放)哦,哦。是的。你真可愛。好了,小姑娘,你在這里等一會兒。我們收尾吧。

(清嗓子)好了。這非常清楚。非常清楚,一場工業(yè)革命已經(jīng)開始。下一波人工智能浪潮已經(jīng)開始。Grek 是機器人技術(shù)現(xiàn)階段可能實現(xiàn)的完美范例。教機器人操作所需的技術(shù),進行模擬,當然,一個令人難以置信的機器人現(xiàn)在就展現(xiàn)在我們面前。我們有實體機器人,也有信息機器人。我們稱它們?yōu)榇怼O乱徊ㄈ斯ぶ悄芤呀?jīng)開始。這將需要……推理工作負載的爆炸式增長。它基本上將呈指數(shù)增長。使用推理的人數(shù)已經(jīng)從八百萬增加到八億。僅僅幾年時間就增長了一百倍。令牌生成的提示數(shù)量和數(shù)量,正如我之前提到的,從幾百個標記到幾千個標記,當然,我們現(xiàn)在比以往任何時候都更多地使用人工智能。比以往任何時候都更多。所以我們需要一臺專門為思考設(shè)計的計算機,專為推理設(shè)計,這就是 Blackwell,一臺思考機器。

這些 Blackwells 將被用于新型數(shù)據(jù)中心,本質(zhì)上是人工智能工廠,專為一件事而設(shè)計,這些人工智能工廠將生成Token,這些Token將成為你的食物,小格雷克。是的,我知道。我知道。

真正令人難以置信的是,我很高興看到歐洲正在全力投入人工智能。這里建設(shè)的人工智能基礎(chǔ)設(shè)施將在未來幾年內(nèi)增加一個數(shù)量級。我要感謝大家的合作伙伴關(guān)系。祝你們在 VivaTech 活動中度過愉快時光。(鼓掌)謝謝。說再見。說再見。拍一堆照片。拍一堆照片。拍一堆照片。是嗎?

       原文標題 : 首發(fā)|黃仁勛巴黎GTC最新演講:一個由AI工廠驅(qū)動的全新工業(yè)革命已經(jīng)到來。ǜ絻扇f字實錄)

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號