高大「手語之聲」系統問世!助瘖啞人士無礙溝通
國立高雄大學資訊工程學系教授餘亞儒(前中)率領學生,結合光流、深度學習,以及大語言模型,開發即時手語辨識系統「手語之聲」。(高雄大學提供/林瑞益高雄傳真)
國立高雄大學資訊工程學系研發出即時手語辨識系統「手語之聲」,圖爲學生示範操作方式。(高雄大學提供/林瑞益高雄傳真)
國立高雄大學資訊工程學系教授餘亞儒率領學生,結合光流、深度學習,以及大語言模型,研發即時手語辨識系統「手語之聲」,造福瘖啞人士,解決日常與聽人之間的溝通問題。
餘亞儒表示,根據政府資料,臺灣約有18萬9000名瘖啞人士,其中,臺灣手語使用者2至3萬人,但全臺僅有591名具備證照的專業手語翻譯員。加上多數民衆不諳手語,使得瘖啞人士在購物、銀行、醫院等生活場景溝通不便,無法得到妥善的迴應。
「手語之聲」系統運用了光流技術、深度學習和資料生成技術,僅需普通攝影鏡頭即可捕捉使用者手部動作及臉部表情並即時分析,能夠準確快速地轉換爲文字或語音,準確率可達93%。
即時手語辨識系統可以應用於教育、醫療、公共服務等多個領域。例如協助學校教師與聽障學生的學習;幫助醫護人員與聽障患者溝通病情等。
團隊成員江東庭說,團隊突破手語資料稀缺的瓶頸,透過少量資料進行生成和擴充,使得系統能正確識別詞彙並將其組成完整句子。該技術的核心在於用影像取代傳統的感測器方案,降低成本同時提升便利性。
餘亞儒補充說明,系統目前能辨識單詞並串接成句,未來若能克服判斷句子斷點等挑戰,以及擴充至穿戴裝置或手機應用程式,應用場景將更爲廣泛。
「手語之聲」系統入選國科會大專學生研究計劃,以及高雄大學校內「激發學生創意競賽——創業實作組」第一名。