DeepSeek,激盪AI行業的“一股清流”

◎本報記者 張佳欣

近期,外媒紛紛將聚光燈投向中國初創企業深度求索公司,其自主研發的人工智能(AI)大語言模型“深度求索”(DeepSeek)憑藉“好用、開源、免費”三大特點,在全球範圍內引發熱烈反響。這一創新成果不僅在中國本土大放異彩,更是在大洋彼岸的美國乃至全球科技界激起了廣泛討論並受到高度評價,被視爲挑戰現有AI巨頭壟斷地位的“一股清流”。

多家外媒接連不斷的報道,讓DeepSeek這一出人意料的、高效而強大的AI模型席捲了科技行業,這種“改變遊戲規則”的大型語言模型,有望快速重塑AI格局。

低成本兼具高性能

西班牙《國家報》、澳大利亞《對話》雜誌、美國《紐約時報》等多家外媒均關注到,DeepSeek的技術具有強大創新力,是因爲它能在降低計算成本的同時實現尖端性能。

AI公司通常使用裝有1.6萬枚或更多專用芯片的超級計算機來訓練聊天機器人,但深度求索公司表示,他們只用了大約2000枚芯片。同時,他們僅花了不到600萬美元就訓練了新模型,成功在兩方面把構建AI的價格“打了下來”。

首先,DeepSeek模型使用數據蒸餾技術生成高質量數據,提升了訓練效率;其次,DeepSeek採用了一種稱爲“混合專家”的方法。當用戶提出一個問題時,模型會決定是否激活其醫療專家、翻譯、律師或物理學家。傳統模型會同時激活所有專家,這會浪費能源和計算能力。而DeepSeek則將這些小型“專家”系統與一個“通才”系統相結合,實現了相同的功能。通才系統對每個主題都有相當的瞭解,可幫助協調專家之間的互動。

開源策略打破技術壟斷

Deepseek的獨特之處還在於,其採取了開源策略。這猶如在美國及少數幾個長期主導AI技術領域的巨頭中投了一枚震撼彈,打破了既有格局。

如今,這項技術已向全世界敞開大門。鑑於DeepSeek模型免費可得,其他公司或將不得不調整價格策略,以保持市場地位。當能夠以零成本獲得類似技術時,沒有人願意支付額外費用。

《對話》雜誌報道稱,與專有AI模型占主導地位的美國不同,中國AI新創企業擁抱開源生態系統,以更快地擴大創新規模,並融入全球AI合作。

得益於人才培養與政策支持

在近日的法國人工智能峰會上,多名國際科技界高管均認爲,DeepSeek 的出現表明,在AI領域,中國企業的進步不容小覷。

《自然》雜誌報道,2017年,中國政府宣佈,計劃到2030年將中國打造成爲全球AI領域的領頭羊。政府要求相關行業在2025年前實現AI領域的重大突破,“使相關技術和應用達到世界領先水平”。

據美國喬治城大學安全與新興技術中心的一份報告,截至2022年,中國教育部已批准440所大學開設AI專業本科學位。美國智庫MacroPolo數據顯示,同年,在全球頂尖AI研究人員中,華人幾乎佔據了“半壁江山”,而美國人僅佔18%。

澳大利亞悉尼科技大學科技政策研究員馬麗娜·張專注於中國的創新研究。她表示,DeepSeek公司的成功得益於政府對AI教育和人才培養的投資,這些投資包括衆多獎學金、研究經費以及學術界與產業界的合作。

創新重塑全球AI格局

美國趣味工程網AI專欄作家塞賈爾·夏爾馬發表評論稱,如此強大的模型出自中國,讓美國感到“坐立不安”。英國廣播公司則直接在標題中稱,“中國的DeepSeek AI震撼行業,削弱美國霸權”。

美國總統特朗普當地時間1月27日在佛羅里達州邁阿密發表講話時,稱DeepSeek的出現“給美國科技產業敲響了警鐘”。

美國《麻省理工技術評論》網站在報道中表示,考慮到中國AI企業面臨美國對尖端芯片出口管制日益收緊的制約,DeepSeek的成功“更顯非凡”。種種跡象表明,美國的制裁並未削弱中國的AI實力,反而似乎正驅使深度求索等初創企業以效率、資源整合和協作爲優先方向進行創新。《國家報》報道也認爲,美國製裁加速了中國AI創新。

美國消費者新聞與商業頻道網站援引專家觀點表示,美國自認爲處於世界科技領袖的地位已不再被普遍接受。

中國人工智能發展的破局與擔當

【國際科技論壇】

◎張佳欣

今年春節前後,中國人工智能公司深度求索推出了AI模型DeepSeek。自其誕生之日起,便勢如破竹,連續多日穩居蘋果App Store與谷歌Play Store全球下載榜首。其引發的巨大波瀾絕非偶然,這背後是技術創新、開源策略以及全球視野共同作用的必然結果。

長久以來,世界各地對AI的構建似乎形成了一些固有觀念,認爲唯有那些擁有鉅額投資和全球大規模應用前景的企業,才能涉足這個領域。但是,DeepSeek卻以一種前所未有的姿態,打破了這些固有認知。

工欲善其事,必先利其器。在外部技術封鎖與市場壓力的雙重夾擊下,DeepSeek團隊憑藉卓越的技術實力與創新能力,成功使用2048塊英偉達H800 GPU芯片,在短短兩個月內訓練出了擁有6710億參數的開源大模型,且成本僅爲558萬美元。要知道,在美國限制科技公司芯片出口中國的大背景下,H800是英偉達專門爲中國市場設計的“閹割版”。這一效率與性價比的奇蹟,是中國科技企業自立自強、勇攀科技高峰的生動寫照,也是對那些試圖通過技術封鎖遏制中國科技發展的有力迴應。

謀定而後動,篤行而致遠。事實上,中國政府早期對AI領域的戰略佈局爲Deepseek等創新企業的崛起奠定了堅實基礎。中國政府高度重視AI發展,2017年更是明確了我國新一代AI發展的戰略目標,爲企業提供了創新的沃土。如今,中國憑藉強大的科研實力、豐富的應用場景和活躍的創新生態,吸引着全球目光。

開源通四海,技術達八荒。DeepSeek採取的開源策略,是其迅速走紅全球的另一大關鍵。在美國的技術“圍剿”、封閉源代碼成爲常態背景下,DeepSeek在封鎖線上“鑿開”了突破口,毅然選擇開源,打破了AI領域的閉源模式,推動了開放生態的拓展。此舉不僅吸引了大量開發者圍繞DeepSeek構建應用生態,還提升了行業透明度和創新性,展現了中國AI科技企業的開放態度和責任擔當。

DeepSeek的成功,是中國AI人才培養、技術創新、產業生態等方面全面崛起的縮影。這匹“黑馬”以實力證明,中國科技企業有能力在全球舞臺上與頂尖玩家同臺競技。AI行業正經歷着去中心化的深刻變革,在誰有權開發和控制AI的問題上,“東方”與“西方”的傳統界限正逐漸模糊。未來,科技的浪潮奔騰不息,而中國科技企業必將在其中書寫濃墨重彩的一筆。

來源:科技日報