Nvidia執行長在高盛訪問的問與答
3.現場的許多投資者非常關注數據中心市場,能否分享一下你對中長期機會的看法?顯然,你的行業推動了你所稱的「下一次工業革命」。你如何看待數據中心市場的現狀以及未來的挑戰?
黃仁勳:有兩件事同時在發生,這兩件事常常被混為一談,但分開討論有助於理解。首先,我們假設在沒有AI的情況下。在沒有AI的世界裡,通用計算已經停滯不前。大家都知道,半導體物理學中的一些原理,比如摩爾定律、Denard縮放等,已經結束了。我們不再看到CPU的性能每年翻倍。我們已經很幸運能在十年內看到性能翻倍。摩爾定律曾經意味著五年內性能提升十倍,十年內提升一百倍。然而,現在這些已經結束了,所以我們必須加速一切能加速的東西。如果你在做SQL處理,加速它;如果你在進行任何數據處理,加速它;如果你在創建一個網路公司並擁有推薦系統,必須加速它。如今最大的推薦系統引擎已經全部加速了。幾年前這些還在CPU上運行,而現在已經全部加速。因此,第一個動態是,全世界價值數萬億美元的通用數據中心將會現代化,轉變為加速計算的數據中心。這是不可避免的。此外,因為Nvidia的加速計算帶來了如此巨大的成本降低,過去十年中,計算能力不是以100倍,而是以100萬倍的速度增長。那麼問題來了,如果你的飛機能快一百萬倍,你會做什麼不同的事情呢?因此,人們突然意識到:「為什麼我們不讓電腦來編寫軟體,而不是我們自己去想像這些功能,或者我們自己去設計算法呢?」我們只需要把所有的數據、所有的預測性數據交給電腦,讓它去找出算法——這就是機器學習,生成式AI。因此,我們在許多不同的數據領域大規模應用了它,電腦不僅知道如何處理數據,還理解數據的含義。因為它同時理解多種數據模式,它可以進行數據翻譯。因此,我們可以從英文轉換為圖像,從圖像轉換為英文,從英文轉換為蛋白質,從蛋白質轉換為化學物質。因為它理解了所有的數據,因此可以進行所有這些翻譯過程,我們稱之為生成式AI。它可以將大量的文字轉換為少量的文字,或者將少量的文字擴展為大量的文字,等等。我們現在正處於這個電腦革命的時代。而現在令人驚歎的是,第一批價值數萬億美元的數據中心將被加速,並且我們還發明了這種新型的軟體,稱為生成式AI。生成式AI不僅僅是一種工具,它是一種技能。正是因為這個原因,新的行業正在被創造出來。這是為什麼?如果你看看直到現在的整個IT行業,我們一直在製造人們使用的工具和儀器。而第一次,我們正在創造出能夠增強人類能力的技能。因此,人們認為AI將超越價值數萬億美元的數據中心和IT行業,進入技能的世界。那麼,什麼是技能呢?比如數位貨幣是一種技能,自動駕駛汽車是一種技能,數位化的裝配線工人、機器人、數位化的客戶服務、聊天機器人,數位化的員工為Nvidia規劃供應鏈。這可以是一個SAP的數位代理。我們公司大量使用ServiceNow,我們現在擁有了數位員工服務。因此,我們現在擁有了這些數位化的人類,這就是我們現在正處的AI浪潮。
4.金融市場中存在一個持續的辯論,即隨著我們繼續建設AI基礎設施,投資回報是否足夠?你如何評估客戶在這個週期中獲得的投資回報率?如果你回顧歷史,回顧PC和雲計算,它們在類似的採用週期中,回報率如何?與現在相比有什麼不同?
黃仁勳:這是個非常好的問題。讓我們來看看。在雲計算之前,最大的趨勢是虛擬化,如果大家還記得的話。虛擬化基本上意味著我們將數據中心中的所有硬體虛擬化為虛擬數據中心,然後我們可以跨數據中心移動工作負載,而不必直接與特定的電腦相關聯。結果是,數據中心的利用率提高了,我們看到了數據中心成本減少了兩倍到兩倍半,幾乎是在一夜之間完成的。接著,我們將這些虛擬電腦放到雲中,結果是,不僅僅是一家公司,很多公司都可以共享相同的資源,成本再次下降,利用率再次提高。這些年的所有進步,掩蓋了底層的根本變化,那就是摩爾定律的終結。我們從利用率提升中獲得了兩倍、甚至更多的成本降低,然而這也碰到了晶體管和CPU性能的極限。接著,所有的這些利用率的提升已經達到極限,這也是為什麼我們現在看到數據中心和計算通脹的原因。因此,第一件正在發生的事情就是加速計算。因此,當你在處理數據時,比如使用Spark——這是當今世界上使用最廣泛的數據處理引擎之一——如果你使用Spark並透過Nvidia加速器加速它,你可以看到20倍的加速。這意味著你會節省10倍的成本。當然,你的計算成本會上升一點,因為你需要支付Nvidia GPU的費用,計算成本可能會增加一倍,但你將減少計算時間20倍。因此,你最終節省了10倍的成本。而這樣的投資回報率對於加速計算來說並不罕見。因此,我建議你們加速一切可以加速的工作,然後使用GPU進行加速,這樣可以立即獲得投資回報。除此之外,生成式AI的討論是當前AI的第一波浪潮,基礎設施玩家(比如我們自己和所有雲服務提供商)將基礎設施放在雲上,供開發人員使用這些機器來訓練模型、微調模型、為模型提供保護等等。由於需求如此之大,每花費1美元在我們這裡,雲服務提供商可以獲得5美元的租金回報,這種情況正在全球範圍內發生,一切都供不應求。因此,對這種需求的需求非常巨大。我們已經看到的一些應用,當然包括一些知名的應用,比如OpenAI的ChatGPT、GitHub的Copilot,或者我們公司內部使用的共同生成器,生產力提升是不可思議的。我們公司裡的每一個軟體工程師現在都使用共同生成器,不管是我們自己為CUDA創建的生成器,還是用於USD(我們公司使用的另一種語言),或者Verilog、C和C++的生成器。因此,我認為每一行代碼都由軟體工程師編寫的日子已經徹底結束了。未來,每一個軟體工程師都將有一個數位工程師伴隨在身邊,24/7隨時協助工作。這就是未來。因此,我看Nvidia,我們有32000名員工,但這些員工周圍將有更多的數位工程師,可能會多100倍的數位工程師。
5. 很多行業都在接受這些變化。哪些用例、行業是你最興奮的?
黃仁勳:在我們公司,我們在計算機圖形學方面使用AI。如果沒有人工智慧,我們無法再進行計算機圖形學。我們只計算一個像素,然後推測其餘的32個像素。也就是說,我們在某種程度上「幻想」出其餘的32個像素,它們在視覺上是穩定的,看起來是照片級真實的,圖像質量和性能都非常出色。計算一個像素需要大量的能量,而推測其他32個像素的能量需求則非常少,而且可以非常快速地完成。因此,AI並不僅僅是訓練模型,這只是第一步。更重要的是如何使用模型。當你使用模型時,你會節省大量的能量和時間。如果沒有AI,我們無法為自動駕駛汽車行業提供服務。如果沒有AI,我們在機器人技術和數位生物學領域的工作也是不可能的。現在幾乎每一個科技生物公司都以Nvidia為中心,他們正在使用我們的數據處理工具來生成新蛋白質,小分子生成、虛擬篩選等領域也將因為人工智慧而被徹底重塑。
6. 談談競爭和你們的競爭壁壘吧。目前有很多公私公司希望能打破你們的領導地位。你如何看待你們的競爭壁壘?
黃仁勳:首先,我認為有幾件事讓我們與眾不同。第一點要記住,AI並不僅僅是關於晶片的。AI是關於整個基礎設施的。如今的電腦不是製造一塊晶片然後人們購買它並放入電腦中。那種模式屬於上世紀90年代。如今的電腦是以超級計算集群、基礎設施或超級計算機為名開發的,這不是一塊晶片,也不完全是電腦。所以,我們實際上是在構建整個數據中心。如果你去看一下我們其中一個超級計算集群,你會發現管理這個系統所需的軟體是非常複雜的。並沒有一個「Microsoft Windows」可以直接用於這些系統。這種定製化的軟體是我們為這些超級集群所開發的,所以設計晶片的公司、構建超級計算機的公司以及開發這些複雜軟體的公司,理所當然的是同一家公司,這樣可以確保優化、性能和效率。其次,AI本質上是一種算法。我們非常擅長理解算法的運作機制,並且了解計算堆疊如何分佈計算,以及如何在數百萬個處理器上運行數天,保持計算機的穩定性、能源效率以及快速完成任務的能力。我們在這方面非常擅長。最後,AI計算的關鍵是安裝基礎。擁有跨所有雲計算平台和內部部署的統一架構非常重要。無論你是在雲中構建超級計算集群,還是在某台設備上運行AI模型,都應該有相同的架構以運行所有相同的軟體。這就是所謂的安裝基礎。而這種自1993年以來的架構一致性是我們能夠取得今天成就的關鍵原因之一。因此,今天如果你要創辦一家AI公司,最明顯的選擇就是使用Nvidia的架構,因為我們已經遍佈所有的雲平台,不論你選擇哪台設備,只要它有Nvidia的標識,你就可以直接運行相同的軟體。
7.Blackwell在訓練上快了4倍,推理速度比它的前代產品Hopper快了30倍。你們的創新速度如此之快,你們能否保持這樣的節奏?你們的合作夥伴能否跟上你們的創新步伐?
黃仁勳:我們的基本創新方法是確保我們不斷推動架構創新。每個晶片的創新週期大約是兩年,在最好的情況下是兩年。我們每年還會對它們進行中期升級,但整體架構的革新大約是每兩年一次,這已經非常快了。我們有七個不同的晶片,這些晶片共同作用於整個系統。我們可以每年推出新的AI超級計算集群,並且比上一代更強大。這是因為我們擁有多個可以進行優化的部分。因此我們可以非常快速地交付更高的性能,並且這些性能的提升直接轉化為總擁有成本(TCO)的下降。Blackwell在性能上的提升意味著,對於擁有1千兆瓦電力的客戶,他們可以獲得3倍的收入。性能直接轉化為吞吐量,吞吐量則轉化為收入。如果你有1千兆瓦的電力可用,你可以獲得3倍的收入。因此,這種性能提升的回報是無與倫比的,也無法通過晶片成本的降低來彌補這3倍的收入差距。
8. 如何看待對亞洲供應鏈的依賴?
黃仁勳:亞洲的供應鏈非常複雜並且高度互聯。Nvidia的GPU不僅僅是一塊晶片,它是由成千上萬個組件組成的複雜系統,類似於一輛電動車的構造。因此,亞洲的供應鏈網絡非常廣泛且複雜。我們力求在每一個環節上設計出多樣性和冗餘性,確保即使出現問題,我們也能夠迅速將生產轉移到其他地方進行製造。總的來說,即使供應鏈出現中斷,我們也有能力進行調整,以確保供應的連續性。我們目前在台積電進行製造,因為它是世界上最好的,不僅僅是好一點點,而是好得多。我們與他們有著長期的合作歷史,他們的靈活性和規模能力都令人印象深刻。去年,我們的收入出現了大幅增長,這離不開供應鏈的快速反應。台積電的敏捷性以及它們滿足我們需求的能力是非常了不起的。在不到一年的時間裡,我們大幅提升了產能,並且我們明年將繼續擴大,後年還要進一步擴大。因此,他們的敏捷性和能力都很出色。不過,如果有需要,我們當然也可以轉向其他供應商。
9. 貴公司處於非常有利的市場位置。我們已經討論了很多非常好的話題。你最擔心的是什麼?
黃仁勳:我們的公司目前與全球每一家AI公司都有合作,也與每一家數據中心有合作。我不知道有哪家雲服務提供商或電腦製造商我們沒有合作的。因此,隨著這樣的規模擴展,我們肩負著巨大的責任。我們的客戶非常情緒化,因為我們的產品直接影響他們的收入和競爭力。需求太大,滿足這些需求的壓力也很大。我們目前正全面生產Blackwell,並計劃在第四季度開始發貨並進一步擴展。需求如此之大,每個人都希望能夠儘早拿到產品,獲取最多的份額。這種緊張和激烈的氛圍實在是前所未有。雖然在創造下一代電腦技術時非常令人興奮,也令人驚歎地看到各種應用的創新,但我們肩負著巨大的責任,感到壓力很大。但我們盡力去做好工作。我們已經適應了這種強度,並將繼續努力。
個人股市研究觀察記錄文章目錄