產官學界合作、NVIDIA開發者計畫技術協助的繁體中文專家模型開源專案「Project TAME」問世
由長春集團、和碩聯合科技、長庚醫院、欣興電子、科技報橘聯合發起,攜手臺大資工系、臺大資管系及律果科技合作,在NVIDIA協助下完成訓練的繁體中文專家模型開源專案「TAiwan Mixture of Experts」 (Project TAME),能以在地文化及用語,加上產業專業知識形式運作,將使臺灣產業能快速導入自動生成式人工智慧技術應用。
舉例來說,一般企業如果要從零開始訓練10億參數模型,通常需耗資新臺幣3.8億元,並且耗時長達576小時時間,而藉由Project TAME 700億參數模型,企業導入僅需新臺幣1600萬元成本,同時以短短3.5小時時間即可完成訓練企業內部資料,大幅降低導入成本及時間,進而能快速最佳化企業運營管理、人員訓練、產品服務、客服等多元人工智慧技術應用。
這次Project TAME繁中專家模型開源計劃,由臺大資工系副教授陳縕儂帶領實驗室同仁與企業夥伴開發團隊共同合作,透過NVIDIA開發者計劃技術協助,讓多家垂直產業的企業專家貢獻專業領域的資料,預訓練近5千億個字元 (token)開發出繁中大型語言專家模型。
在完全沒有簽約的約束下,業界跟學界紛紛自發性合作,短短數月推動下,Project TAME 繁體中文模型已有初步具體顯著成果,在各項繁中相關指標中領先全球模型,連臺灣的「大學學測、律師/中醫考試、導遊證照、駕照、臺灣在地化測驗」均取得優異分數,同時在臺39項綜合評測、近三千個題目的結果中,Project TAME取得分數就超過所有模型,正確率相較第二名的Claude-Opus模型高出6.8%,更比OpenAI的GPT-4o高出9.3%。
Project TAME繁體中文專家模型正式對外發布後,將以開放原始碼的形式對外提供。臺大資工系副教授陳縕儂指出,在不同的資料間可能有共同交集可以使用, 這對語言模型的發展是更好的,也能讓不同產業的專家貢獻自己領域的資料。
《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》