新創GeNopsys爲AI資料中心打造高效能 低耗能全光交換網路系統
陽明交大楊啓瑞教授與田伯隆教授之新創GeNopsys研發團隊於OCP 2023 正式發表DOVINSY系統。圖/業者提供
AI爆炸性的發展促成了新一代的工業革命,並在資料中心領域掀起了一波波的技術改革浪潮。AI模型超乎常態的急速增長伴隨着極其龐大的計算資料量及伺服器間資料交換量,對現存的處理器和網路系統技術造成了前所未有的衝擊和挑戰。當衆多研發目光專注於提供強大的伺服器(CPU, GPU)之餘,在2023年OCP (Open Compute Project) 高峰會中多個重量級公司(Google, Marvell, Broadcom, Nvidia…)異口同聲指出,作爲提供大量伺服器互聯並交換資料的網路系統儼然成爲新的嚴重貧頸 (The network is new bottleneck)。”The network is the computer”不再只是口號,而是AI發展迫在眉睫待解決的關鍵技術。
今年甫從國立陽明交通大學退休的楊啓瑞教授、以及電機工程系田伯隆教授於今年創辦了美商公司GeNopsys Technologies, Inc. (臺灣分公司-美商構光科技股份有限公司) https://genopsys-tech.com. 該公司以累積超過20年的研發經驗投入在光交換網路系統,並於2023 OCP發表了領先國際的結合SDN智慧控制的DWDM全光交換資料中心網路系統- DOVINSY。該全光交換網路系統突破傳統電交換系統的限制,具備超低能耗、超低延遲、以及極大頻寬且高擴充性等絕對優勢,爲要求低延遲及高傳輸頻寬的AI資料中心提供絕佳的網路解決方案。
目前市場上提供AI資料中心網路有兩個主要方案: 傳統Ethernet及NVIDIA/Infiniband。傳統Ethernet 存在負載不平衡,以及流量壅塞的效能問題。而infiniBand網路利用更強的CPU/DPU雖然延遲低,但屬特殊規格無法與通用網路相容,而且比Ethernet更爲耗電,價格非常昂貴。GeNopsys團隊在2015年即發覺Ethernet網路的效能問題會產生極大的延遲(tail latency),嚴重影響HPC此類需求高度平行運算應用的效能。因此團隊開始將研發多年的光交換網路技術引入資料中心。2017年並獲得臺達電公司的資金挹注進行5年的大型產學合作計劃。且於2019年時成功完成國際第一套結合光、電、軟體、韌體及智慧控制技術垂直整合的創新光交換網路系統雛型系統,OPTUNS。該系統並在OCP 2019以及OFC 2019向國際發表,獲得產業界大量的關注。歷經了COVID期間持續的精進和研發,GeNopsys團隊在2023年獲得國內外等多方單位的投資成立新創公司。並在短短九個月內成功研發全新的光交換網路系統DOVINSY,具備更高頻寬(每個DWDM波長100G),擴充性更大(架構可支援500-700個機櫃),並同樣達到極低傳輸延遲(< 10us)及高度節能( 節省 85%電力消耗),以更符合目前AI資料中心的需求。其效能遠超越市場上電交換的網路系統。目前系統的軟硬體開發和測試已經完成,並開始要進入商用測試階段。預計一年後可進行產品銷售。
創辦人楊教授三十多年前從世界網路技術先驅的美國Bell Labs 回到母校國立陽明交通大學,持續貢獻所學並深耕在網路技術的研發,特別在後面20多年與共同創辦人田伯隆教授全力投入在光通訊網路領域。並堅持所有研究都要建構實際的雛型系統, 發掘理論所看不到的關鍵問題。國立陽明交通大學擁有非常自由且宏觀的學術風氣,並積極提供各項豐沛的資源,才能讓該團隊能夠累積寶貴的研發能量,並和產業界進行密切的實質合作,奠定了該新創公司的雄厚基礎。而臺達電公司深具遠見及研發資金的奧援也是該公司成立的一大助力。此產學合作的案例是將學術研發轉化成實質產品極爲成功的範例。