頂尖高校支持的初創公司致力於打造完全開放的 AI 開發平臺
由全球頂尖大學研究人員合作建立的人工智能實驗室 Oumi PBC,今天宣佈推出其所描述的全球首個"無條件開放的 AI 平臺"。
該計劃旨在通過提供開放訪問基礎模型、數據集和開發工具,打造一個協作式的 AI 研究和開發生態系統。
Oumi 表示,迄今爲止,基礎 AI 模型的開發主要由限制模型訪問的大型科技公司主導。即使被標記爲"開源"的模型往往也缺乏完全的透明度,它們提供開放權重(即訓練模型的數值參數),但不提供用於訓練它們的代碼或數據。Oumi 表示,它試圖通過提供一個確保 AI 模型和研究完全可訪問、可複製且可由任何人修改的平臺來改變這種現狀。
"AI 需要它的 Linux 時刻,"Oumi 的聯合創始人兼首席執行官 Manos Koukoumidis (如圖右) 說道,他此前曾領導 Google Cloud 的 AI 計劃。"要讓開源取得成功,你必須提供每個人需要的工具。"
盈利與使命並重 Oumi 作爲一家公益企業運營,這意味着它是一家營利性公司,但在法律上有義務在財務目標與既定的社會或環境使命之間保持平衡。該公司已獲得由 Venrock Management LLC 和風險投資公司 Obvious Management Services LLC 領投的 1000 萬美元種子輪融資,Plug and Play Platform Spain SL 和 Ascend Venture Capital GP LLC 也參與其中。
Oumi 平臺具有可擴展性,允許研究人員使用自己的工具和工作流程,確保與各種 AI 開發方法的兼容性。它還優先考慮可復現性,這是科學研究中的關鍵因素。Koukoumidis 說:"我們希望確保生產和推進研究的完整流程是完全可記錄和可復現的。"
Oumi 最初以 Apache 2.0 許可證下的開源存儲庫形式啓動。開發者可將其用於研究和商業用途。雖然 Oumi 目前不提供平臺的託管版本,但公司對未來推出託管服務持開放態度。
靈活且可擴展 Oumi 平臺設計爲在單一統一系統中支持所有主要基礎模型工作流程。主要功能包括能夠使用監督式微調、低秩適應、量化低秩適應和直接性能優化等高級技術來訓練和微調從 1000 萬到 4050 億參數不等的模型。它可以處理文本和多模態模型,包括 Llama、Qwen 和 Phi。
該工具包支持使用大語言模型評判器合成和整理訓練數據,並能夠通過流行的推理引擎(如 vLLM 和 SGLang)部署模型。開發者可以根據既定的 AI 基準評估模型,並在從個人筆記本電腦到超大規模雲平臺的各種環境中工作。該平臺與開放模型以及 OpenAI LLC、Anthropic PBC 和 Vertex Systems Oy 等商業模型開發者提供的應用程序接口集成。
Oumi 的創始人認爲,目前的 AI 研究格局通過將開發限制在企業孤島中而造成了人爲的創新障礙。"我們的願景是讓 AI 成爲終極團隊運動,"Oumi 的聯合創始人、前 Apple Inc. 機器學習工程師 Oussama Elachqar (如圖左) 說。"爲 AI 人才提供一個可以集體工作的平臺將加速進步,並加快 AI 各個領域的發現。"
超越開放權重 該公司的首次亮相早在中國初創公司 DeepSeek 本週以遠低於其他替代方案的成本開發出一個功能強大的大語言模型之前就已計劃好了。
Koukoumidis 指出,DeepSeek 以開放權重許可發佈其模型,提供了 AI 模型的訓練參數,但不包括完整的源代碼、訓練數據或方法論。
"Oumi 的目標是使社區能夠構建下一個真正開放的 DeepSeek,然後是後續版本,"他在書面評論中說。"DeepSeek 的成就表明,解決 AI 開發挑戰並不像受計算能力限制那樣,而是更多地受人才限制,當前的 AI 格局造成了一種虛假的稀缺感。"他說,一個完全開放的平臺可以利用規模經濟來提高效率。
來自伊利諾伊大學香檳分校、卡內基梅隆大學、普林斯頓大學、加州理工學院、加州大學伯克利分校、華盛頓大學、紐約大學、麻省理工學院、滑鐵盧大學、劍橋大學和牛津大學的 AI 研究人員正在開發該平臺。Oumi 表示計劃促進完全開放參與的協調研究工作。
Oumi 邀請有興趣貢獻或使用該平臺的研究人員訪問公司網站或 GitHub 頁面瞭解更多信息。