“神秘的東方力量”DeepSeek一夜爆火,讓對手恐慌!超越ChatGPT 登頂蘋果美國區免費APP下載排行榜,多隻概念股漲停
上週末,由國產大模型公司杭州深度求索開發的Deepseek在中美科技圈受到廣泛關注。1月27日,該應用更是登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。此前AMD還宣佈了,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型旨在與SGLang一起實現最佳性能。
或受上述消息影響,1月27日早間,Deepseek概念股高開,每日互動、航錦科技、南威軟件、美格智能競價漲停,飛利信、卓創資訊、思特奇高開超10%。此外,AI概念股也同步走強,萬國數據漲10%,第四範式漲近6%,金山雲漲5%,百度集團漲近3%,商湯漲2%。
公開資料顯示,Deepseek來自國產大模型公司深度求索,系量化巨頭幻方量化旗下大模型公司。1月20日,該公司正式發佈推理大模型DeepSeek-R1。一經推出,DeepSeek-R1便憑藉其“物美價廉”的特性在海外開發者社區中引發了轟動。
作爲一款開源模型,R1在數學、代碼、自然語言推理等任務上的性能能夠比肩OpenAI o1模型正式版,並採用MIT許可協議,支持免費商用、任意修改和衍生開發等。
值得一提的是,在2024年12月,DeepSeek-V3發佈後,AI數據服務公司Scale AI創始人Alexander Wang就曾發貼稱,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。“當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上。”
今年1月24號,一條發佈在匿名平臺teamblind上的帖子瘋傳,讓Deepseek的討論度進一步提升。據報道,一名Meta員工稱,現在Meta內部因爲DeepSeek的模型,已經進入恐慌。其寫道,“一切源於DeepSeek-V3的出現,它在基準測試中已經讓Llama 4相形見絀。更讓人難堪的是,一家‘僅用550萬美元訓練預算的中國公司’就做到了這一點。”
1月26日,有網友反映稱,在使用DeepSeek時出現了短時閃崩的現象。對此,DeepSeek迴應稱,當天下午確實出現了局部服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由於新模型發佈後,用戶訪問量激增,服務器一時無法滿足大量用戶的併發需求。
就在1月26日晚間,遊戲科學創始人、黑神話悟空製作人馮驥甚至在社交媒體上發文力推DeepSeek大模型,其表示DeepSeekV3大模型已經用了一個月,DeepSeekR1大模型用了5天,DeepSeek在推理能力、訓練開銷與使用費用、開源、免費、聯網、本土化都等六方面全部實現突破。
馮驥寫到,希望DeepSeek R1會讓你對當前最先進的AI祛魅,讓AI逐漸變成你生活中的水和電。“太幸運了!太開心了!這樣震撼的突破,來自一個純粹的中國公司。知識與信息平權,至此又往前邁出了堅實的一步”,馮驥表示。
本文源自:金融界
作者:AI君