法國初創公司米斯特拉爾發佈多模態 AI 模型

法國 人工智能 初創公司 米斯特拉爾 發佈了 其首個多模態模型,即 Pixtral 12B,能夠處理圖像和文本。

這個擁有 120 億參數的模型是在米斯特拉爾現有的基於文本的模型 Nemo 12B 的基礎上構建的,主要用於給圖像添加標題、識別對象以及回答與圖像相關的查詢等這類任務。

其大小爲 24GB,該模型在 Apache 2.0 許可證下可免費獲取,這意味着任何人都可以不受限制地使用、修改或將其商業化。開發人員可以從 GitHub 和 Hugging Face 下載它,但功能性的網絡演示目前還未推出。

據米斯特拉爾開發者關係負責人表示,Pixtral 12B 很快會被整合進該公司的聊天機器人 Le Chat 以及 API 平臺 La Platforme 當中。

像 Pixtral 12B 這類多模態模型或許會成爲生成式人工智能的下一個前沿陣地,緊跟OpenAI 的 GPT-4和 Anthropic 的 Claude 這類工具的步伐。然而,用於訓練這些模型的數據源存在一些疑問。正如 Tech Crunch 所指出的,和許多人工智能公司類似,Mistral 或許使用了大量公開可用的網絡數據來訓練 Pixtral 12B——這種做法引發了版權所有者提起訴訟,他們對科技公司常提出的‘合理使用’這一論點表示質疑。

此次發佈之前,Mistral 籌集了 6.45 億美元資金,將其估值推高至 60 億美元。有微軟等投資方支持,Mistral 正將自己定位爲歐洲對 OpenAI 的迴應。