綜述|小企業大模型——法國人工智能初創公司的“開源”之道

新華社北京9月8日電 綜述|小企業大模型——法國人工智能初創公司的“開源”之道

新華社記者崔可欣

如果說2023年的人工智能(AI)敘事始於ChatGPT引爆網絡,那麼2024年法國科技初創企業米斯特拉爾人工智能公司(Mistral AI)則以不俗表現引人注目。

米斯特拉爾人工智能公司2023年4月誕生於巴黎,創始人是三名曾在硅谷工作的“90後”。首席執行官兼創始人阿瑟·門施曾是谷歌旗下“深層思維”公司的研究員,主要研究語言模型。另兩名創始人——紀堯姆·朗普勒和蒂莫泰·拉克魯瓦此前任職於臉書母公司“元”的AI團隊。三人曾是大學同窗。

米斯特拉爾人工智能公司主要開發基於自然語言處理、機器視覺和深度學習的生成式AI技術。成立僅一年多,60人左右的團隊已推出數款AI語言模型。目前,該公司正在加速發展自然語言處理技術,尤其關注多語種能力,以反映歐洲語言的多樣性。據英國《金融時報》6月報道,該公司在新一輪融資中獲得6億歐元投資,公司估值接近60億歐元。法國總統馬克龍曾多次公開表達對米斯特拉爾人工智能公司的讚許和支持,相信它有潛力成爲歐洲AI領域的領軍者。

米斯特拉爾人工智能公司自成立以來始終堅持開源策略,目標是創建與競品性能相匹敵的AI模型,但以更低成本提供給客戶,同時以更開放的姿態實現技術共享。目前,該公司已推出的模型有Mistral 7B、Mistral 8x7B,以及性能接近GPT-4、成本卻低很多的Mistral Large等。

在大語言模型領域,選擇開源還是閉源一直都是頗具爭議的話題。開源軟件是指源代碼在公共領域供所有人使用、修改和分發,任何人都可以審覈和驗證模型的安全性;而閉源模型則主要由一些大型科技公司開發和維護,擁有充足的資金和專業團隊,能夠提供高質量穩定的服務,同時在數據隱私控制方面更爲嚴格。

門施認爲,開源模式不僅可以加速科技發展,也更有利於這項技術的廣泛應用和安全使用。“這(開源模式)就好比一種基礎設施可以轉化爲任何類型的應用。我相信用戶需要創造差異化,也需要深入掌握這項技術。而想要做到這一點,唯一途徑就是擁有完全透明的訪問權限。”

然而,在參與全球大語言模型領域商業競爭的壓力下,米斯特拉爾人工智能公司能否將開源進行到底,遭到業界質疑。開發者們發現,該公司最新推出的Mistral Large 2並不是傳統意義上的開源模型,商用應用仍需付費。

爲迴應質疑,門施今年3月接受法國《世界報》採訪時表示,團隊將繼續“雙管齊下”,一方面堅持開源策略,另一方面通過商業行爲來資助高成本的研發投入和人才招募。

他今年5月接受美國《時代》週刊訪談時也提到,團隊會始終堅持在開源領域保持領先的模型,同時提供一些付費服務,“我們的初衷未曾改變”。(完)