谷歌推出爲人工智能文本添加水印的新技術

谷歌正在將 SynthID Text 這項能讓開發者爲生成式人工智能模型生成的文本添加水印並進行檢測的技術全面推出。

SynthID Text 能夠從人工智能平臺 Hugging Face 以及谷歌更新的 負責任的生成式人工智能工具包 進行下載。

“今天,我們正在將我們的 SynthID Text 水印工具開源,”該公司在 X 上的 一篇帖子 中寫道。“免費提供給開發者和企業使用,它將幫助他們識別由人工智能生成的內容。”

那麼它是如何工作的?

給定一個提示,比如“你最喜歡的水果是什麼?”,文本生成模型會一次預測一個“標記”,也就是預測哪個“標記”最有可能跟在另一個之後。標記是生成模型用來處理信息的基本構建塊。它們可以是單個字符、單詞,或者是短語的一部分。

該模型爲每個可能的標記分配一個分數,即其在輸出文本中出現的百分比概率。谷歌表示,SynthID Text 通過“調節生成標記的可能性”在這個標記分佈中插入了額外的數據。

“模型的單詞選擇的最終分數模式與調整後的概率分數相結合,被當作水印,”該公司在博客文章中寫道。“將這種分數模式與有水印和無水印文本的預期分數模式進行比較,幫助 SynthID 檢測文本是由人工智能工具生成的,還是可能來自其他地方。”

谷歌聲稱,自今年春天以來已與其 Gemini 模型集成的 SynthID Text 不會損害文本生成的質量、準確性和速度,甚至對於被裁剪、釋義或修改的文本也能發揮作用。

但這家公司也承認其水印技術存在一定的侷限性。

例如,SynthID Text 在處理短文本、從其他語言重寫或翻譯而來的文本以及對事實性問題的回答時表現欠佳。該公司解釋說:“對於事實性提示的回答,在不影響事實準確性的前提下,調整令牌分佈的機會較少。” “這包括像‘法國的首都是什麼?’這類提示,或者像‘背誦一首威廉·華茲華斯的詩’這種幾乎沒有或毫無變化預期的查詢。”

谷歌並不是唯一一家致力於人工智能文本水印技術的公司。OpenAI 多年來一直在研究水印方法,但因技術和商業方面的擔憂而推遲了其發佈。