GPU芯片,鉅變前夜

曾經,GPU在AI領域炙手可熱,但步入2025年,它迅速遭遇了多重嚴峻考驗。

在過去半個月的時間裡,GPU領域遭遇了兩大主要挑戰。首先,美國政府出臺了新的禁令措施,對GPU的發展構成了直接限制。其次,ASIC等定製芯片的迅速崛起,給GPU市場帶來了顯著的衝擊與競爭壓力。

接下來,半導體產業縱橫將深入探討這兩大因素如何具體影響着GPU市場。

挑戰一:美國進一步收緊AI芯片出口

首先來看GPU面臨的第一個挑戰。

1月13日晚,拜登政府正式宣佈加碼對AI芯片及相關關鍵技術的出口管制,限制中國等競爭對手獲取先進GPU的能力。

根據已公佈的信息,新規按照受管制程度高低,將世界各國和地區劃分爲三大類別。日本、英國、韓國和荷蘭、加拿大等18個美國親密盟友和合作夥伴得到豁免,可以自由採購先進AI芯片;新加坡、以色列、沙特阿拉伯、印度、巴西和波蘭等120多個國家和地區,將被施加AI芯片出口的配額限制;中國、俄羅斯、伊朗和朝鮮等,則被完全禁止獲取高端AI芯片和先進的封閉權重模型(Closed-weight models)。

管制新規進一步明確,小批量訂單不受配額影響:如果芯片訂單的總算力未超過大約1700個先進GPU,那麼就不需要獲取美國的許可,並且不會計入特定國家或地區進口芯片的限額,以使得來自大學、醫療機構和研究組織的AI芯片訂單可以繼續進行。

另據美國商務部工業與安全局 (BIS) 官網披露,美國企業的海外數據中心建設亦將受到限制。新規要求像亞馬遜、微軟、谷歌這樣的雲服務提供商,必須在美國境內部署一半的受管制AI芯片;部署在美國親密盟友和合作夥伴之外的受管制芯片規模,則不得超過25%;而且,在美國親密盟友和合作夥伴以外的任何單一國家和地區部署的受管制芯片規模,不得超過7%。

美國商務部長雷蒙多稱:“美國當前在AI開發和AI芯片設計領域處於世界領先地位,維持這種局面至關重要。”她還稱,管制新規無意切斷世界與AI創新的聯繫,而是專門限制海外最先進AI技術的發展。

這份AI出口管制新規設置了120天的意見徵詢期,並且內容可以修改,意味着後續將由特朗普政府最終決定先進AI芯片的出口規則。

衆所周知,美國已多輪出擊,對中國大陸獲取 GPU 芯片實施管制。這一做法,一方面拖累了中國大陸 AI 能力的發展進程,另一方面,也悄然改寫着 GPU 的市場格局。

受此影響,GPU 市場呈現兩大變化。

GPU市場的兩大變化

第一點,中國大陸本土 GPU 製造能力增強。

近年來,中國國內的許多GPU企業開始嶄露頭角。通過持續的投入和努力,國產GPU在性能、功能和應用領域等方面都有了提升,逐漸贏得了市場的認可和用戶的信任。國產GPU不僅在傳統圖形處理領域取得了進展,也能夠在人工智能、高性能計算等新興領域展現出一定的競爭力。

主要廠商包括景嘉微、寒武紀、海光信息、天數智芯等。

雖然國產GPU芯片在技術上取得了顯著進步,但與國際巨頭如英偉達相比,仍存在性能差距。

未來隨着計算需求的不斷增長和算法的不斷優化,國產GPU芯片需要不斷提升其性能以滿足更廣泛的應用場景。通過加大研發投入,引入更先進的製造工藝和設計理念,國產GPU芯片有望在未來實現技術突破。

第二點,英偉達等 GPU 行業龍頭的出貨能力受到拖累。

早在2022年10月、2023年10月,美國商務部工業和安全局(BIS)兩次更新對中國的先進半導體和計算設備的出口管制,英偉達中國特供版GPU產品A800、H800芯片均已受到管制。與此同時,AMD發佈的性能最強的MI300X、MI300A、MI250X、MI250等多款 AI 芯片也不再能出口到中國了。

美國的出口管制政策使得英偉達無法向中國市場提供最先進、性能最強的 GPU 產品,這限制了其在華業務的拓展,特別是在人工智能、雲計算等對高性能 GPU 需求旺盛的領域。中國作爲全球最大的半導體市場之一,失去了這部分市場份額,對英偉達的營收增長帶來了一定壓力。

儘管英偉達之後試圖通過推出一些替代產品來維持在中國市場的份額,如 HGX H20 GPU,但整體出貨能力仍受到較大影響。

同時,這也可能引發全球 GPU 市場格局的調整,其他國際競爭對手可能會趁機搶佔英偉達和 AMD 在中國市場留下的空白,進一步加劇全球 GPU 市場的競爭態勢。

AI芯片出口管制新規的發佈也引發了英偉達的批評。

英偉達政府事務副總裁Ned Finkle在1月13日一篇博文中指出,基於美國的技術,AI得以在世界各地廣泛應用,推動了國內外各行各業的進步與發展。但拜登政府試圖推行的“人工智能擴散”(AI Diffusion)規則,是前所未有和具有誤導性的,這可能會破壞全球創新和經濟增長。

Ned Finkle批評稱,管制新規不會緩解任何威脅,只會削弱美國的全球競爭力,動搖那種使美國保持領先的創新能力。

挑戰二:定製芯片ASIC的興起,衝擊GPU

年初,一股ASIC熱席捲全球。

ASIC熱潮興起的原因主要有三點:

其一,GPU已成爲AI芯片領域競爭的核心焦點。目前,英偉達所產出的GPU主要被各大科技巨頭所壟斷。

第二點,GPU價格的飆升使得這些科技巨頭在採購芯片時需要支付更高的成本。

第三點,從另一角度來看,即便科技巨頭暫且將成本因素置於次要地位,英偉達本身的供應不足狀況仍使這些科技巨頭憂心不已。

彼時尋找價格更爲親民、供應更具穩定性且能滿足自身 AI 運算需求的芯片,成爲了衆多科技巨頭的當務之急,而 ASIC 芯片的出現,恰到好處地契合了這些需求。

ASIC 熱潮突如其來,追根溯源,去年 12 月是關鍵轉折點。彼時,作爲 ASIC 領域極爲重要的概念股,博通的股價強勢上揚,從 180 美元一路飆升至 250 美元,市值一舉突破萬億美元大關。與之形成鮮明對比的是,英偉達風光不再,股價一路下行,甚至跌破 130 美元。

Google 公司大名鼎鼎的TPU(Tensor Processing Unit,張量處理單元),還有前幾年很火的比特幣礦機,英特爾的 Gaudi 2 ASIC 芯片,IBM 的 AIU,AWS 的 Trainium,都屬於 ASIC 芯片。此外,這幾年非常火的 DPU(Data Processing Unit,數據處理單元)和 NPU(Neural Processing Unit,神經網絡處理單元),也是 ASIC 芯片。

倘若一定要知道兩者各自有哪些優勢,本文將在這裡將ASIC與GPU做一個詳細對比。

ASIC 專爲特定 AI 算法定製,在執行特定任務時性能卓越,像 Google 的 TPU 針對深度學習矩陣運算優化,計算效率極高。它能效比出色,能降低能耗成本,且大規模處理數據時吞吐量高、延遲低。大規模使用時,其單位算力成本遠低於 GPU,如谷歌的 TPUv5、亞馬遜的 Trainium2 單位算力成本僅爲英偉達 H100 的 70% 和 60%。不過,ASIC 靈活性差,功能固定,算法改變就需重新設計,開發難度大,軟件生態單一。

GPU 通用性強,能應對多種計算任務,在科學計算、遊戲渲染等領域廣泛應用。其並行計算能力強大,適合處理複雜神經網絡模型。而且,它擁有成熟豐富的軟件生態,藉助 CUDA 等,開發者易於上手。然而,GPU 在特定任務上效率遜於 ASIC,功耗較高,會增加能耗成本。高端 GPU 價格高昂,如英偉達 H100 售價 2.5 萬至 3 萬美元,獲取難度大,且存在時延較高的問題。

GPU,會迎來淘汰嗎?

那麼有了ASIC,會很快就淘汰GPU嗎?

筆者認爲,非也。

綜合多家第三方機構的統計可見,在GPU市場,英偉達目前佔據了大約90%份額,AMD雖然也在積極發佈GPU產品,但因爲在軟件生態建設方面不夠完善,到目前爲止僅個位數百分比市場份額。

憑藉性能、生態、集成能力等方面的優勢,英偉達的 GPU 仍然會是中短期內的 AI 芯片首選。英偉達的軟硬件網絡整套方案都很成熟,技術和資金實力太強,GPU 的存量和出貨量依然很大,市場地位難以撼動。

ASIC 的崛起速度雖然很快,但仍需要一定的時間走向成熟。AI ASIC 芯片的研發,也具有很高的風險。即使研發成功,也需要時間被用戶所接受。

這就意味着,在很長的一段時間內,GPU 和 ASIC 都將處於共存狀態。基於不同的場景,用戶會選擇最適合自己的芯片。發展自研 ASIC,更多是有利於廠商們和英偉達進行談判砍價。

AMD首席執行官蘇姿豐也曾對這一問題發表過觀點,蘇姿豐表示:“目前,GPU是大語言模型的首選架構,因爲GPU在並行處理方面非常高效,但在可編程性方面有所欠缺。五年多後它還會是首選架構嗎?我認爲情況會發生變化。”

蘇姿豐預計,五年或七年時間內GPU還不會失勢,但會出現GPU以外的新勢力。

如此來看ASIC或許會是最優選之一。在未來一段時間內,ASIC芯片將處於快速發展階段,摩根士丹利預計,AI ASIC市場規模將從2024年的120億美元增長至2027年的300億美元,年複合增長率達到34%。

當然,除了 ASIC 之外,像 FPGA 等其他類型的 AI 芯片也可能嶄露頭角,共同改變未來 AI 芯片的市場格局。GPU 雖然當前在 AI 領域佔據重要地位,但隨着技術的不斷革新,其面臨的挑戰日益嚴峻,未來的 AI 芯片架構領域將充滿更多變數與可能性。