☰

法國初創公司米斯特拉爾發佈多模態 AI 模型

法國人工智能初創公司米斯特拉爾發佈了其首個多模態模型，即 Pixtral 12B，能夠處理圖像和文本。

這個擁有 120 億參數的模型是在米斯特拉爾現有的基於文本的模型 Nemo 12B 的基礎上構建的，主要用於給圖像添加標題、識別對象以及回答與圖像相關的查詢等這類任務。

其大小爲 24GB，該模型在 Apache 2.0 許可證下可免費獲取，這意味着任何人都可以不受限制地使用、修改或將其商業化。開發人員可以從 GitHub 和 Hugging Face 下載它，但功能性的網絡演示目前還未推出。

據米斯特拉爾開發者關係負責人表示，Pixtral 12B 很快會被整合進該公司的聊天機器人 Le Chat 以及 API 平臺 La Platforme 當中。

像 Pixtral 12B 這類多模態模型或許會成爲生成式人工智能的下一個前沿陣地，緊跟OpenAI 的 GPT-4和 Anthropic 的 Claude 這類工具的步伐。然而，用於訓練這些模型的數據源存在一些疑問。正如 Tech Crunch 所指出的，和許多人工智能公司類似，Mistral 或許使用了大量公開可用的網絡數據來訓練 Pixtral 12B——這種做法引發了版權所有者提起訴訟，他們對科技公司常提出的‘合理使用’這一論點表示質疑。

此次發佈之前，Mistral 籌集了 6.45 億美元資金，將其估值推高至 60 億美元。有微軟等投資方支持，Mistral 正將自己定位爲歐洲對 OpenAI 的迴應。

法國初創公司米斯特拉爾發佈多模態 AI 模型

相關資訊