數字金融頂層方案出爐 銀行深挖數據價值

本報記者 郝亞娟 張榮旺 上海 北京報道

近日,中國人民銀行、發改委等七部門聯合印發《推動數字金融高質量發展行動方案》(以下簡稱“《方案》”)。

《方案》要求金融機構完善數據質量管控和治理體系,全面整合內外部數據資源,實現全域數據統一管理和融合共享。

《中國經營報》記者在採訪中瞭解到,如何整合數據資源成爲銀行下一步發力點。興業研究金融監管高級研究員任圖南指出:“我國銀行業在2025年展業中面臨的最重要機遇將是由公共數據資源開發所帶來。”

高質量數據是AI基礎

《方案》明確發展數字金融的目標是爲了金融更好地服務經濟發展,同時提出“到2027年年底,基本建成與數字經濟發展高度適應的金融體系”的總體目標。

蘇商銀行金融科技實驗室指出,《方案》的實施,爲金融行業注入了全新的發展動能。數字化轉型使金融機構在市場響應能力和客戶服務能力上實現質的飛躍,助力提升整體競爭力。前沿技術的應用不僅推動了金融產品的更新迭代,也帶來了全新的服務模式,激發了行業創新潛力。與此同時,基於數據驅動的智能風控體系,將使風險管理更加精準、及時,爲金融機構在複雜多變的市場環境中保持穩健運營提供堅實保障。

任圖南告訴記者,2024年9月到10月,我國密集發佈多項政策破解公共數據資源開發中存在的機制性障礙,2025年或將成爲公共數據資源開發大潮的起點。在數字金融的三個層次(數據要素應用、金融科技運用、銀行展業方式數字化)中,我國銀行業在2025年展業中面臨的最重要機遇將是由公共數據資源開發所帶來的。

記者採訪瞭解到,金融行業是數據密集型行業,大規模且高質量的數據將爲銀行業務提供有力支撐。全球網絡安全領導企業Palo Alto Networks(派拓網絡)發佈的一項預測指出,2025年,與新成立的AI初創公司相比,擁有大量客戶和數據資源的大型企業將在網絡安全領域佔據明顯優勢。這些大型企業可以獲取大量高質量的數據,並使用這些數據提高AI模型的性能,實現競爭優勢。

《2024年畢馬威銀行業首席執行官展望》調研發現,81%的受訪首席執行官表示,生成式人工智能仍是其最優先的投資選擇。大多數受訪者(65%)預計此項投資在三到五年內可獲得回報。他們也特別提到對此類技術在大力改善欺詐識別和網絡安全功能、數據分析、運營效率和客戶服務個性化方面的潛力充滿期待。

交通銀行相關人士表示,在數據要素成爲生產要素的背景下以及生成式人工智能帶來的顛覆性變革下,商業銀行的數據治理工作需要順應要素化、智能化的趨勢,持續把握數據治理的服務目標要求和工作主線,以應對數字經濟時代的新變量。

銀行如何加強數據融合?

在深挖數據價值的同時,數據安全與合規重要性凸顯。多家銀行提出強化數據安全管理,提升數據安全防護能力以及降低數據安全風險。

蘇商銀行金融科技實驗室分析,《方案》要求金融機構完善數據質量管控和治理體系,全面整合內外部數據資源,實現全域數據統一管理和融合共享。深化“數據要素×”應用模式,藉助大數據、隱私計算等技術優化風控模型和金融產品設計。在降低數據採集成本方面,《方案》提出利用全國信用信息共享平臺和公益性融資信用服務平臺,幫助金融機構獲取高質量數據,降低數據使用門檻和成本。

值得注意的是,數據價值的提升也帶來了數據安全、數據治理方面的挑戰。Commvault亞太地區副總裁Martin Creighan接受記者採訪時指出,在雲計算的時代,出現了私有云、公有云以及多個公有云的混合環境。同時,數據量隨着技術發展尤其是人工智能的普及呈現爆炸式增長,這使得數據孤島的問題更加嚴重。企業必須認識到,在數據治理方面,尤其是管理數據孤島,需要一個統一的平臺,能夠全面掌握本地、私有云和公有云的整體數據情況。然而,企業通常僅針對數據孤島構建數據保護和恢復方案,而忽視瞭如何應對意外或不可預見情況對數據恢復能力的影響。針對這一問題,企業需要通過單一平臺來全面解決這一問題,從根本上提升數據治理能力,保障數據的安全性與可用性。

前述交通銀行相關人士也表示,商業銀行豐富的金融服務場景需要多領域數據的融合,《“數據要素×”三年行動計劃(2024—2026年)》提供了契機,但如何在現有數據要素市場規範和交易機制下,規避供需雙方溝通成本高、信任度不夠、交易成本高等問題,拓展數據融合的安全邊界,仍需要各方持續探索與共建。

從交通銀行的實踐來看,該行構建縱跨“數據、模型、知識”三個層次的數據供給能力。

在數據層面,構建全覆蓋的底層數據資產目錄,在結構化數據之外,拓展非結構化數據版圖,加快推進對文本、圖片、音視頻等非結構化數據資產的梳理,支撐人工智能應用的精準定位與前置轉化。

在模型層面,做好指標、標籤、模型等信息的萃取提煉與統籌管理。大模型與小模型共存的格局將長期存在,項目組級的“煙囪式”模型及模型特徵的重複開發愈發普遍,需搭建企業級模型特徵庫,實現模型及模型特徵數據的“一次治理、多場景複用”,提升模型搭建效率。

在知識層面,建立企業級知識沉澱與運營機制,構建高效合規的數據標註體系,明確知識沉澱規範,推動企業內部的“隱性知識”向“顯性知識”轉變,打造全行知識庫,降低溝通成本;組建專業團隊,研究標註規則和工作流程,加強數據審查和脫敏,充分滿足人工智能數據標註合規化、專業化要求,提供安全合規、準確高效的訓練數據集,形成標註質量與模型效果的正向循環。

(編輯:朱紫雲 審覈:何莎莎 校對:張國剛)