英偉達強化生態圍牆 中國廠商生態之戰提速
本報記者 李玉洋 上海報道
近期,AI芯片巨頭英偉達CUDA(Compute Unified Device Architecture,計算統一設備架構)的一條新增條款,引發了國內科技圈的矚目。據瞭解,CUDA是英偉達於2006 年所開發的一種異構編程語言,它爲通用程序提供了調用GPU的接口。
今年2月,一名德國工程師在安裝CUDA 11.6時發現,英偉達在最終用戶許可協議 (EULA) 的限制類目中新增了條款:“不得對使用SDK元素生成的任何輸出部分進行逆向工程、反編譯或拆解,以將此類輸出工件轉換爲非NVIDIA平臺”。
而後,國外科技自媒體猜測並分析英偉達CUDA的新增條款的原因,認爲該舉措是爲了針對英特爾和AMD都有參與的ZLUDA計劃,也可能是指向某些通過翻譯層利用CUDA代碼的中國GPU廠商。
經過層層“加碼”,這些消息傳到國內以後已經變形,於是“英偉達出手封殺,禁止使用翻譯工具將CUDA運行在其他硬件平臺上”演變成英偉達的“封殺”還要卡住國產GPU/AI芯片的脖子。
《中國經營報》記者注意到,面對以上的傳言,國內GPU廠商摩爾線程快速站出來迴應稱:“摩爾線程MUSA/MUSIFY不涉及英偉達EULA相關條款,開發者可放心使用。”另一家國產AI芯片公司壁仞科技也表示:“對我們沒影響,我們用的是自己開發的軟件系統。”
“我們走的是對標英偉達的全功能GPU路線,CUDA兼容一直是我們的一個優勢。”摩爾線程方面告訴記者,該公司有自己的MUSA生態,一方面可以獨立自主發展,另一方面也可以兼容CUDA,兩者不衝突,且兼容CUDA的方式不在英偉達所禁止的範圍內。
此外,在知識含量很高的問答平臺知乎上一些程序員也表示,英偉達CUDA的最終用戶許可協議新條款對於國產GPU廠商沒有影響,有的只是外行的猜想。“雖然不清楚條款具體情況,也沒去追溯看舊版和新版的對比,不過基本沒有影響。其他的GPU廠商如果想要儘快佔領市場的話,一個最重要的方法就是兼容CUDA生態。這些廠商去兼容,實際上不違反任何規則,英偉達也不會去阻止這樣的行爲。”資深產業分析師黃燁鋒表示。
與非網資深行業分析師張慧娟則表示,這對一些初創公司(試圖通過兼容CUDA入局的企業)有一定影響,但是對於技術成熟度較高、注重自有生態建設的企業來說,影響有限。“英偉達此舉其實也反映AI芯片市場不斷走向成熟,競爭越來越激烈,未來生態對企業意味着一切,會看到更多巨頭在生態間的佈局和競爭。”她說。
新規是對自身生態的一種保護
事實上,從2021年開始,英偉達就禁止其他硬件平臺使用模擬層運行CUDA軟件,但只是在在線最終用戶許可協議中提出了警告。如今,從CUDA 11.6版本開始,安裝的時候就會在最終用戶許可協議中看到相關警告條款。2024年2月,英偉達CUDA 11.6及更高版本安裝則出現新規。
據瞭解,CUDA作爲英偉達所開發的一種異構編程語言,爲通用程序提供了調用GPU的接口,也爲英偉達擴張自己的芯片應用生態提供了便利。在AI 2.0時代,大模型進行訓練或推理,開啓GPU加速,實質就是利用CUDA 進行加速。
“CUDA的強大,在於英偉達構建的人工智能軟件系統和開發者生態,入門的開發者都會習慣性地使用它,因爲生態比較全,模型、軟件集成,應有盡有。”研究機構Omdia AI行業首席分析師蘇廉節表示。
而把英偉達的CUDA作爲標杆,是不少國內AI芯片廠商的共同做法,典型代表是華爲昇騰的編程語言Ascend C、寒武紀的智能編程語言BANG C。這是國內GPU廠商爲了培育自己的芯片應用生態所做的努力之一。
爲了儘快打開市場,不少AI芯片的後入局者會採用兼容CUDA的方式,比如摩爾線程把CUDA兼容作爲自身的優勢。“一些公司在做開發的時候,首先會將兼容CUDA作爲一個賣點,這也側面反映了英偉達CUDA生態的成功和軟件的重要性。”張慧娟說。
根據知乎藍V認證清華大學博主“埃米博士”的說法,當前主要有兩種兼容CUDA的方法:一是重新編譯底層二進制代碼,二是API接口兼容或編譯。
重新編譯底層二進制代碼,如ZLUDA通過簡單替換,爲ZLUDA庫實現CUDA兼容。據悉,ZLUDA是由個人開發者Andrzej Janik所開發的項目,於2020年首次出現,可使CUDA 應用無須修改源代碼即可在英特爾和AMD的GPU上運行。
“ZLUDA庫對CUDA API進行轉換,未經修改的CUDA二進制文件能夠直接在(AMD)ROCm和Radeon GPU上運行。”埃米博士表示,雖然該方法擁有轉換簡單、技術開源等優點,但計算效率低,芯片無法發揮最優性能,且直接觸犯了英偉達新規。
而埃米博士認爲:“在API接口協議和編譯器層面與CUDA對應一致。”這種方法不涉及對CUDA SDK輸出元素的修改,是合法可行的。他指出,英特爾、AMD、瀚博、登臨、壁仞、沐曦、摩爾線程、天數智芯等都採取了這種兼容方式。
摩爾線程的公告也側面證實了這點。“MUSIFY是摩爾線程面向廣大MUSA開發者提供的開發工具……可以讓開發者將自己的C++源代碼,轉換成MUSA C++源代碼,再通過MUSA編譯器MCC編譯生成基於MUSA指令集的二進制代碼,最終運行在摩爾線程全功能GPU上。”摩爾線程在聲明中指出。
如今,爲什麼英偉達要在EULA中推出新規定?對此,蘇廉節表示:“在其他硬件上運行CUDA會嚴重影響英偉達的利益。英偉達提供CUDA的初衷不是爲了支援其他硬件,單純是爲了方便開發者和玩家利用GPU做軟件開發。”
張慧娟也表示,英偉達在使用條款裡明確了CUDA的兼容條款,從企業經營角度看是必然,是對自己生態的一種保護。“英偉達此舉其實也反映AI芯片市場不斷走向成熟,競爭越來越激烈,未來生態對企業意味着一切,會看到更多巨頭在生態間的佈局和競爭。”她說。
國內廠商也需建立自己的生態
雖然此次新增的CUDA規則對國內AI芯片兼容未有很大影響,但長期來看,構建自主的軟件生態體系,也是國內AI芯片公司的必走之路。
“CUDA生態做得非常好,因爲它在很多領域都有佈局,比如計算化學,而要用GPU加速,那就必須買英偉達的顯卡。”黃燁鋒指出,英偉達此前針對生物製藥、化學、氣候預測、量子計算等領域也發佈過一些中間件和軟件庫。
蘇廉節表示,除英偉達之外的廠商由於起步太晚,因此軟件生態裡的很多東西都跟不上前者步伐。他指出,國內AI芯片公司想要構建起自己的軟件生態,可以向英偉達學習。
“首先要支持所有主流的開源大模型,推出各類訓練推理和模型優化軟件,降低開發者門檻。”蘇廉節表示,還要和開發者社羣緊密合作,積極聽取他們的反饋,及時提供更新;如果可以跟高校合作是最好的,率先搶佔入門開發者。“總之,就是依靠合作和支援開發者。沒有開發者使用你的平臺,有再強的軟件都沒有用。”他說。
所幸的是,國內AI芯片公司已經在重視軟件生態的建設。在“2022世界人工智能大會”(WAIC)上,記者在看到壁仞科技、燧原科技、瀚博等這些公司的芯片產品之外,也瞭解到他們在大力強調系統和軟件生態的重要性。
“作爲英偉達CUDA的主要挑戰者,華爲的軟件生態是除英偉達以外最受開發者歡迎的。”蘇廉節表示。據瞭解,華爲已推出AI異構計算架構CANN、開源自研AI框架MindSpore,並於2023年5月發佈了昇騰Ascend C編程語言,針對GPU的Kernel級源碼遷移工具,可將算子遷移時間從“周級”降到“天級”。
從公司運作角度來看,對標英偉達的國內公司,想要做出和CUDA那樣強大的生態,當前需要在哪些方面發力?對此,摩爾線程方面表示:“首先要具備和CUDA GPU能力全面對標的技術研發能力,能夠充分吸收現有的CUDA生態,並在此基礎上發展自主可控的基於統一系統架構的新生態,鼓勵開發者平滑遷移至新生態。”
摩爾線程方面還表示,目前打造了從GPU架構功能角度全面對標CUDA的MUSA生態,能完美支持人工智能、科學計算、圖形渲染和視頻編解碼等混合計算能力,有500多家生態合作伙伴,當前重點在於持續打磨MUSA生態開發體驗,將生態遷移成本降低至零。
舉報/反饋