OpenAI模擬真人說話AI技術 具應用潛力也藏隱憂
Voice Engine只要一段15秒語音樣本,就能複製出與錄音者相似度極高的說話聲音。加上文字輸入後,就能透過文字轉語音的技術,以模擬出來的錄音者聲音把文字內容說出來。
這種由AI合成出來的人聲,還能轉換成說出錄音者母語以外的其他外語,又同時能保留錄音者的口音和語調。
OpenAI表示這項AI技術,可用來幫助那些因疾病或其他因素,導致說話有困難的人用自己的聲音講話。另外,企業也能在與外國公司接洽過程中,使用這技術把其資訊轉換成對方的語言來加強溝通。
但Voice Engine模擬出來的真人聲音接近難以分辨程度,因此令人憂慮具備這功能的AI聊天機器人,可能被有心人士在選舉或其他重要場合,用來散播虛假資訊的工具。
OpenAI承認這種生成式模擬真人聲音的技術確實存在嚴重風險,尤其在重要選舉時會令人擔心出現虛假訊息的問題。由於有各種可能的風險,因此OpenAI目前暫時沒有對外廣泛地開放使用這技術的計劃。
OpenAI表示現階段仍必須採取多項措施,去防止這項AI技術被不當使用。目前只會小規模地向部份企業提供Voice Engine應用,透過反饋來協助改進使用方法和安全等問題,並思考如何讓不同產業都能好好地使用這AI技術。
目前OpenAI提供試用的企業,包括線上教育公司Age of Learning、敘事視覺化平臺HeyGen、健康資訊軟體商Dimagi、AI通訊app開發商Livox、和健康系統商Lifespan。