金融大模型應用面臨三大挑戰,聯邦學習如何破題?

21世紀經濟報道見習記者程維妙 北京報道

近年銀行頻頻提到要以“科技賦能”提高效率,另一邊,AI(人工智能)、聯邦學習、大模型等熱門技術名詞不斷更迭,對公衆來說還比較抽象。銀行運用了什麼技術、用到哪些環節和場景上?很多人也普遍搞不清其中的關聯。

“近年來,以大模型爲代表的AI技術進入發展快車道,具備數字化程度高、商業化應用場景潛在價值高等優勢的金融業,是AI大模型落地應用的最佳場景之一。”7月2日,在以“大模型時代AI前沿與金融應用”爲主題的微衆媒體學院會議上,與會專家說道。

銀行的營銷、風控等環節是大模型應用的重要場景,不過目前在發展應用中顯現三大挑戰。

與會專家表示,一是從算力角度,大模型的訓練過程中需要龐大的硬件算力資源支撐,大模型參數規模呈持續擴張趨勢,對算力提出了更高要求;二是從算法角度,大模型生成內容可能存在安全風險,同時廣泛存在隱形偏見的可能性;三是從數據角度,近年來各項法律法規對私域數據的使用有“數據可用不可見”的要求,在醫療、金融等行業都存在海量自治的高質量數據,但受限於隱私無法共享利用。

圍繞其中提到的算力提速,此前也曾有機構人士舉例稱,假設一家銀行某地分行每天要給5000個存量用戶打電話進行營銷,每個用戶有2000個標籤,提高營銷轉化率就需要算力。但算力提升也是比較難攻克的一個點,假設一個明文數據是一個bit,爲了不讓數據泄露,同時能夠算出其中的內容,隱私計算就要把它變成1000個bit。沒有增加任何信息,但負載變得非常大。

怎樣解決大模型應用落地的技術難題?微衆銀行人工智能首席科學家範力欣提到聯邦學習。他表示,聯邦學習作爲一種先進的分佈式機器學習範式,允許參與方在不直接共享原始數據的情況下協作訓練模型,爲解決大模型應用落地的技術難題提供了創新路徑。

聯邦學習是隱私計算的關鍵技術之一,它的一個特徵就是“數據可用不可見”,可以防止數據在流轉過程中泄露。業界廣爲流傳一個“羊吃草”的比喻,假設模型是一隻羊,這隻羊吃的草料(即數據)來自不同提供者,提供者之間不想被對方知道自己的草料是如何生產的,羊可以從一個草場到另一個草場,而草料不出本地。

“聯邦大模型技術路線通過其獨特的設計,不僅解決了數據時效性、模型幻覺、專業知識融合及算力資源消耗等挑戰,而且在保護數據隱私和促進AI技術公平性方面邁出了重要一步,爲大模型在各領域的廣泛應用開闢了新的可能。”範力欣表示。