成立9個月估值超20億美元,法國AI創企發大模型,獲微軟入股
2月28日消息,當地時間週一,法國人工智能初創公司Mistral AI推出其最新的大語言模型“MistralLarge”及其聊天機器人“LeChat”。
此外,微軟已宣佈與之建立長期多年的合作伙伴關係。據報道,此次合作包括微軟對該公司進行少量股權投資,估值高達20億歐元(約合21億美元)。值得注意的是,僅僅一年前,微軟向OpenAI投資超過100億美元。
僅成立9個月的MistralAI正尋求通過更高效的方式構建和部署人工智能系統,挑戰硅谷的技術巨頭。
(本站編輯注:"Mistral"一詞在法語和英語中是指吹過法國南部和地中海西北部的一種強烈、冷且乾燥的西北風,這種風通常被認爲具有清潔空氣和帶來晴朗天氣的特性。)
以下爲翻譯內容:
去年的這個時候,阿瑟·門施(ArthurMensch)還在谷歌巴黎分部工作,那時人工智能剛開始走進公衆視野,擺脫了科幻小說的桎梏。自那以來,生成式人工智能——這種能夠像人類一樣進行對話,甚至可能進行類似人類的推理的技術——已成爲幾十年來最引人注目的技術進步之一。目前,門施離開谷歌創立的初創企業Mistral AI,已經走過了九個月的歷程,估值超過了20億美元。
這種飛速的變化突顯了圍繞構建和商業化先進人工智能系統的狂熱與焦慮。Mistral AI正打破常規,挑戰美國科技行業巨頭的主導地位。門施聯同兩位工程學校的朋友共同創建了Mistral AI,他們堅信巨大的規模不是關鍵,美國也不是必然的領導者。
現年31歲的門施在Mistral AI的巴黎辦公室中表示:“我一直遺憾歐洲缺乏大型科技公司,而我認爲這正是我們躋身之中的絕佳機遇。”
門施的公司從包括硅谷風險投資公司Andreessen Horowitz在內的投資者那裡籌集了超過5億美元資金,儘管與行業巨頭相比,這家公司的規模仍然較小。微軟支持的OpenAI和谷歌正在投入數十億美元訓練最新的人工智能系統,利用他們掌握的專業計算機芯片以及雄厚的財力來支持這些系統的運行。而Mistral的成立,部分源自對大量資金浪費的擔憂。
門施是一位學術界出身的科技先鋒,他至今仍在探索如何提高人工智能和機器學習系統的效率。去年年初,他與32歲的蒂莫西·拉克魯瓦(Timothée Lacroix)和33歲的紀堯姆·蘭普(Guillaume Lample)一起創業,後兩者之前在Meta位於巴黎的人工智能實驗室工作。
他們三人共同創立了Mistral AI,希望以更高效的方式構建和部署人工智能系統,從而挑戰硅谷的科技巨頭。門施表示:“我們致力於成爲人工智能領域資本效率最高的公司,這是我們存在的根本原因。”爲了實現這一目標,他們決定將許多人工智能系統作爲開源軟件提供給公衆。
當地時間週一,Mistral AI推出了新型人工智能模型Mistral Large。門施表示,該模型在執行某些推理任務時,其性能不亞於OpenAI的GPT-4和谷歌的Gemini Ultra等先進模型。然而,MistralLarge的訓練成本卻相對較低,僅爲2000萬歐元(約合2200萬美元)。相比之下,OpenAI首席執行官薩姆·奧特曼(Sam Altman)去年在GPT-4發佈後表示,訓練該公司最大的模型的成本“遠遠超過了”5000萬至1億美元。
Mistral AI在人工智能領域的成本優勢引起了廣泛關注。作爲MistralAI的客戶和投資者之一,微軟對Mistral Large模型表現出了極大的興趣。微軟計劃將這一新模型集成到其Azure雲服務中,爲開發人員提供更多選擇。同時,作爲這項多年協議的一部分,微軟將獲得該公司的一小部分股權。
除此之外,Mistral AI還與其他公司建立了合作關係,包括企業軟件巨頭Salesforce和GPU製造商英偉達。
Brave軟件公司的聯合創始人兼首席技術官布賴恩·邦迪(Brian Bondy)對Mistral AI的開源模型予以高度評價。他表示,該公司已經將Mistral的開源模型作爲其網絡瀏覽器中聊天機器人的默認模型。邦迪認爲,這一模型在質量上與專有模型相媲美,而且開源的模式賦予了Brave更大的靈活性和本地控制能力。
微軟人工智能平臺副總裁埃裡克·博伊德(Eric Boyd)對Mistral AI給予了高度評價,他說:“Mistral是一次有趣的嘗試,旨在探索智能工程能將人工智能系統推進到何種程度。這家新興公司的發展潛力引人注目,我們非常期待看到他們將走向何方。”
門施身材高大,擁有一頭濃密的黑髮,他的外表和行爲都不符合典型科技極客的形象。他的朋友和同事都讚賞他在聚會時能夠講出讓人捧腹大笑的笑話。他還是一名運動員,在2018年完成博士論文前的幾個月內,他曾以不到3.5小時的成績完成了巴黎馬拉松賽。
門施在巴黎的西部郊區長大,母親是一名物理教師,而父親經營着一家小型科技公司。在求學期間,門施展現出了對數學和機器學習的濃厚興趣。他的導師稱讚他,即使在缺乏相關背景的情況下,也會迅速投入項目,併成爲其領導者。門施自己也表示:“我確實熱愛新的挑戰,但很快就會感到厭倦。”
在攻讀博士學位期間,門施的研究方向是如何擴展分析三維大腦圖像的軟件,使其能夠處理來自功能性磁共振成像(fMRI)系統的數百萬張大腦圖像映射網絡。這項研究對於理解大腦如何處理數學問題和識別面部等功能具有重要意義。
2020年底,門施加入了谷歌的人工智能部門DeepMind,在那裡他參與了構建大語言模型的工作,這些模型後來爲ChatGPT提供了支持。2022年,門施成爲了一篇“新型人工智能模型Chinchilla” 研究論文的主要作者之一。這篇論文改變了人們對人工智能模型的大小、所需數據量和性能之間關係的理解,即人工智能的縮放定律。
風險投資公司Conviction的早期投資者莎拉·郭(Sarah Guo)對門施給予了極高評價:“有誰能比定義了縮放定律的人更加有資格挑戰世界對這一定律的理解呢!”
隨着2022年人工智能領域的競爭日益加劇,門施感到失望的是,大型私人人工智能實驗室發表的關於大語言模型的研究論文數量開始減少,與更廣泛研究界的分享也日益稀少。
此外,ChatGPT的推出在谷歌內部引發了激烈的競爭。面對這一挑戰,門施所在的團隊迅速擴張,從最初的10人增至30人,最終達到70人。儘管如此,門施對於在大型科技公司內部工作感到不滿。他坦言:“我認爲我是在公司變得過於官僚化之前離開的。我不想在一個內部開發不透明技術的大型科技公司工作。”
去年春天,門施在向投資者提交的推介文件中批評了那些主要銷售專有模型的美國公司,認爲“正在形成的寡頭壟斷”是不利的。
除了專注於技術創新和行業發展,門施還積極參與政策討論。他曾向法國的政策制定者,包括總統馬克龍(Emmanuel Macron),遊說反對歐盟新的人工智能法案中的某些條款。他認爲,這些法規可能會阻礙公司發展速度,並對提高人工智能的安全性不利。在布魯塞爾對法案文本進行修改後,他認爲這對Mistral將是一個可控的負擔。儘管如此,他依然堅持認爲法律應該更關注人工智能的應用方式,而不是對底層技術進行過度監管。
對於門施及其聯合創始人而言,將最初的人工智能系統以開源軟件的形式發佈是一項重要原則,使得任何人都能免費使用或修改。這種開放策略旨在吸引大量開發者和潛在客戶,因爲他們渴望對所使用的AI擁有更多控制權。然而,Mistral的最先進模型並未開源。
門施表示:“很明顯,我們需要在建立商業模式和堅持開源價值觀之間找到一個微妙的平衡。我們希望發明新事物,新架構,同時也希望有些東西能夠賣給我們的客戶。”(小小)