輝達助攻 鴻海推繁中AI大語言模型
鴻海昨天宣佈推出首款繁體中文AI大型語言模型(LLM),此模型是由輝達助攻,並以優異的運算成本,於四周內完成訓練。同時,該模型展現強大的理解與推理能力,還能針對臺灣使用者的語言風格進行優化,並在數學與邏輯推理測試中表現出色,優於Meta目前已經推出的同等級模型。
鴻海表示,首款AI大語言模型,內部開發代碼爲FoxBrain,該模型原是爲了內部應用而設計,涵蓋數據分析、決策輔助、文書協作、數學、推理解題與代碼生成等功能。未來鴻海將與技術夥伴合作,對外開源分享,讓所有人都能使用這些技術,擴大FoxBrain模型運用範圍,共同推動AI在製造業、供應鏈管理與智慧決策領域的應用。
鴻海研究院人工智慧研究所在FoxBrain訓練過程中,使用一二○張輝達H100 GPU,僅花約四星期的時間完成,相較於近期其他公司所推出的推理模型,以更高效率、更低成本的模型訓練方式,爲臺灣AI技術發展樹立新里程碑。
鴻海研究院人工智慧研究所所長慄永徽表示,「近幾個月,推理能力的深化以及GPU的高效運用,逐漸成爲AI領域發展主流。FoxBrain模型採用高效訓練策略,專注於訓練過程優化而非盲目堆砌算力。通過精心設計的訓練方法和資源優化,我們成功打造出具備強大推理能力的本土AI模型」。
鴻海研究院指出,FoxBrain在數學領域較基礎模型Meta Llama 3.1全面提升,相較於目前最好的繁體中文大模型Taiwan Llama,在數學測試中取得顯著進步,並在數學推理能力上超越Meta目前已推出的同等級模型,與DeepSeek蒸餾模型仍有些微差距,但表現已經相當接近世界領先水準。
在模型訓練過程中,輝達提供Taipei-1超級電腦的支持,以及技術諮詢,使鴻海研究院透過使用NeMo AI模型服務。鴻海表示,未來將透過導入AI大型語言模型,優化智慧製造、智慧電動車、智慧城市等三大平臺的數據分析效率,讓FoxBrain成爲驅動智慧應用升級的重要引擎,進一步提升公司營運效益。