DeepSeek震撼美國AI科技圈 神秘老闆樑文鋒新聞聯播低調亮相

樑文鋒(前左)最近在大陸《央視》新聞聯播上亮相時說,中國發展AI,必然需要有人站到技術的前沿。(圖/快科技)

最近一週,中國的神秘AI公司、被稱爲「AI界拼多多」的人工智慧初創企業深度求索(DeepSeek)刷屏全球各大主流媒體和社交網站,尤其讓美國AI科技圈極爲震撼。該公司創辦人樑文鋒首次在大陸《央視》新聞聯播亮相時表示,DeepSeek之所以震撼美國,是因爲它來自中國公司,中國AI要發展,必然需要有人站到技術的前沿。

據《快科技》報導,DeepSeek最新發布的R1模型不僅在性能上比肩甚至超越了OpenAI的o1,並完全開源,更以極低的成本實現了這一突破。一向極爲低調的DeepSeek老闆樑文鋒日前首次亮相新聞聯播時表示,「在美國每天發生的大量創新裡,這是非常普通的一個。他們之所以驚訝,是因爲這是一箇中國公司,在以創新貢獻者的身份,加入到他們遊戲裡去。畢竟大部分中國公司習慣 follow,而不是創新。」

目前AI科技界有些人認爲,DeepSeek可能會顛覆輝達(NVIDIA)在AI硬體領域的主導地位。在國外大模型排名Arena上,DeepSeek-R1基準測試已經升至全類別大模型第3,其中在風格控制類模型(StyleCtrl)分類中與OpenAI o1並列第1。

Arena放榜之後,全球關於DeepSeek的討論再次升級。輝達的高級研究科學家範麟熙(Jim Fan)評價道:「我們生活在這樣一個時代:一家非美國公司正在讓OpenAI的初衷得以延續──真正開放、爲所有人賦能的前沿研究。」

美國私募基金Noah's Arc Capital Management認爲,DeepSeek-V3模型的突破顯著降低了AI培訓成本,使AMD GPU成爲比NVIDIA更具有成本效益的替代品,增強了AMD的市場地位。

報導指出,DeepSeek-R1讓美國乃至全球的AI圈有如此大的反應,主要因爲它突破了由美國和OpenAI建立起的規則。以往由OpenAI引領的AI路線是以規模製勝,但這種發展模式也將AI發展帶入了一個怪圈,爲追求更高的性能,大模型的體積只能不斷膨脹,參數數量呈現指數級增長,同時帶來了驚人的能源消耗和訓練成本。而一家公司想發展AI,就必須投入高昂的成本向輝達買GPU晶片訓練,絕大多數公司根本難以爲繼。

而DeepSeek的誕生,讓低成本、高性能的AI成爲可能。大模型對算力投入的需求可能會從訓練側向推理側傾斜,即未來對推理算力的需求將成爲主要驅動力。而輝達等硬體商的傳統優勢更多集中在訓練側,這可能會對其市場地位和戰略佈局產生影響。

美股大V「THE SHORT BEAR」在社交媒體上表示,DeepSeek創造了一個AI巨頭們的痛苦時刻,美國AI公司每年必須產生約6000億美元收入來支付其AI硬體費用,現在這種冒險行爲變得越來越無利可圖,也因此造成輝達股價大跌。

樑文鋒說,中國AI不可能永遠處在跟隨的位置,經常有人說中國AI和美國有1、2年差距,但真實的落差是原創和模仿之差。如果這個不改變,中國永遠只能是追隨者,所以有些探索也是逃不掉的。輝達的領先,不只是一個公司的努力,而是整個西方技術社區和產業共同努力的結果。他們能看到下一代的技術趨勢,手裡有路線圖。中國AI的發展,同樣需要這樣的生態,所以中國必然需要有人站到技術的前沿。