陸DeepSeek爆紅 重挫輝達股價
DeepSeek V3以及DeepSeek R1等大型語言模型(LLM),迅速在美國走紅,27日更一舉超越ChatGpt登上美國區蘋果App Store免費榜上首位。(中新社)
大陸人工智慧(AI)新創日前發佈DeepSeek V3以及DeepSeek R1等大型語言模型(LLM),迅速在美國走紅,27日更一舉超越ChatGPT登上美國區蘋果App Store免費榜上首位。而由於其成本低,效能更媲美Open AI ChatGPT o1,宛如一隻「黑天鵝」,撼動美國矽谷科技界,美股開盤,輝達(Nvidia)下跌約12%,其他AI相關科技股,如美光和臺積電ADR下跌8%至9%。
人工智慧熱的最大受益者之一、晶片設計公司輝達(Nvidia)的股票,在美股27日盤前股價下跌14%,臺積電ADR盤前股價下跌逾9%,荷蘭晶片公司艾司摩爾(ASML),在歐股市場下跌10%。
僅24小時 力壓ChatGPT
而亞洲盤27日,日本晶片相關股普遍下跌,日股收盤輝達的半導體測試設備供應商愛德萬測試股價下跌8.61%,而軟銀則下跌8.32%、東京威力科創(Tokyo Electron)下跌4.9%。
DeepSeek堪稱「一夕爆紅」。事實上,就在26日時DeepSeek都還未能擠進美國區蘋果App Store免費榜前五,然而僅僅24小時後,DeepSeek在美國卻上演力壓ChatGPT的歷史性戲碼。
據瞭解,DeepSeek僅用2048片H800的晶片、歷經兩個月,就訓練出一個6710億參數的DeepSeek V3。對比Meta訓練參數量4050億的Llama 3,運用16384片更強的H100晶片,花了54天。DeepSeek訓練效率顯然提升11倍。
成本僅GPT-4 Turbo 1.4%
DeepSeek震撼美國科技界後,其背後研發團隊也成爲外界焦點。綜合陸媒、香港01報導,DeepSeek的創始人是樑文鋒,他是浙江大學資訊與通信工程專業的碩士,年紀不到40歲。
樑文鋒於2015年創立幻方量化,2018年幻方正式確立以AI爲核心的發展戰略。樑文鋒曾公開表明,幻方量化進入AI領域並非爲複製另一個ChatGPT,而是希望解開AGI更多未知之謎,打算從LLM入手,致力於打造真正人類級別的AI。
DeekSeek去年5月宣佈,其DeepSeek V2的推理成本被降到每百萬token僅1塊錢,約等於GPT-4 Turbo的七十分之一,經此一役,DeepSeek就以「AI界的拼多多」打響名號。
85後創辦人 撼動矽谷
值得一提得是,DeepSeek V2關鍵開發者之一就是AI「天才少女」羅福莉,2024年底小米創辦人雷軍傳出以千萬人民幣薪水招募羅福莉,擔任AI實驗室的大模型團隊負責人。8年級生的羅福莉是在2022年跳槽到DeepSeek參與研發DeepSeek V2。
而大陸總理李強今年1月20日主持召開專家、企業家和教科文衛體等領域代表座談會,期間樑文鋒在會上發言,而大陸央視《新聞聯播》播出該畫面,也讓不少人第一次見識到樑文鋒。