☰

OpenAI模擬真人說話AI技術具應用潛力也藏隱憂

Voice Engine只要一段15秒語音樣本，就能複製出與錄音者相似度極高的說話聲音。加上文字輸入後，就能透過文字轉語音的技術，以模擬出來的錄音者聲音把文字內容說出來。

這種由AI合成出來的人聲，還能轉換成說出錄音者母語以外的其他外語，又同時能保留錄音者的口音和語調。

OpenAI表示這項AI技術，可用來幫助那些因疾病或其他因素，導致說話有困難的人用自己的聲音講話。另外，企業也能在與外國公司接洽過程中，使用這技術把其資訊轉換成對方的語言來加強溝通。

但Voice Engine模擬出來的真人聲音接近難以分辨程度，因此令人憂慮具備這功能的AI聊天機器人，可能被有心人士在選舉或其他重要場合，用來散播虛假資訊的工具。

OpenAI承認這種生成式模擬真人聲音的技術確實存在嚴重風險，尤其在重要選舉時會令人擔心出現虛假訊息的問題。由於有各種可能的風險，因此OpenAI目前暫時沒有對外廣泛地開放使用這技術的計劃。

OpenAI表示現階段仍必須採取多項措施，去防止這項AI技術被不當使用。目前只會小規模地向部份企業提供Voice Engine應用，透過反饋來協助改進使用方法和安全等問題，並思考如何讓不同產業都能好好地使用這AI技術。

目前OpenAI提供試用的企業，包括線上教育公司Age of Learning、敘事視覺化平臺HeyGen、健康資訊軟體商Dimagi、AI通訊app開發商Livox、和健康系統商Lifespan。

OpenAI模擬真人說話AI技術 具應用潛力也藏隱憂