數據要素髮展機遇與挑戰並存,投資人看好應用場景創新機會

21世紀經濟報道記者 申俊涵 北京報道

近年來,數據作爲土地、勞動力、資本、技術之後的第五大生產要素,逐漸融入經濟社會的各個領域。同時,在5G、AI和物聯網等技術的帶動下,數據要素的重要性也愈加凸顯。

《全國數據資源調查報告(2023年)》顯示,2023年,全國數據生產總量達32.85ZB(澤字節),同比增長22.44%。在數據存儲方面,2023年我國累計數據存儲總量爲1.73ZB(澤字節),存儲空間利用率爲59%。大數據產業規模達1.74萬億元,同比增長10.45%。

在數據從資源向資產轉變的過程中,面臨哪些挑戰?對投資機構來說,如何挖掘數據產業背後的投資機會?相比國外,中國的數據產業發展具有哪些獨特優勢?近日,在“2024-ADD數據應用場景大會暨Talk@Taihu臺湖見面會啓動儀式”上,多位投資人對此開展討論。

數據要素髮展機遇與挑戰並存

首鋼基金母基金事業部副總經理張寒梅認爲,在大數據時代,無論是個人還是機構都能感受到海量數據的存在。但是如何把數據積澱下來,對其進行有效的篩選、挖掘並快速找到真正需要的內容和信息,目前仍面臨較大挑戰。

比如首鋼母基金自2015年開始從事母基金投資業務,每年都會在平臺上積累近百家的GP數據以及上千家被投企業的數據,這些數據在整個一級投資市場中是較爲有效和廣泛的。在此過程中,團隊秉持着產融結合、進行數字化轉型的理念,搭建了自身的數據平臺。

“衆所周知,一級的私募股權母基金屬於非標產品,如何通過不同的時間、行業、階段等維度,爲該非標產品構建一個定量的打分系統,並且使該系統能夠實現數據可採集、可預警、可量化,這實則是大家都在探尋的一種較好方式。所以我們也是希望在這個過程中,讓非標產品的投資決策流程,能夠有據可依。”張寒梅說。

泥藕資本創始合夥人杜欣談到,從自身實踐來看,隱私和安全與商業化之間的巨大鴻溝,或許是阻礙數據要素髮展的主要難點。

許多數據難以進一步商業化的原因在於,爲滿足共享安全和技術上的要求,而無法呈現數據真正有價值的部分。例如,很多人在商業過程中喜歡購買手機號碼、客戶信息、名單等,拿到後就立刻進行變現,這實際上違反了相關法律,會被追究責任。如何在數據的廣泛安全性與數據資產的可變現性之間實現平衡,是問題的關鍵所在。

“我們要將數據資產和數據要素的價值提升到很高的認知程度,將其與土地、設備、機器、人員等同等定位。其次,我們要明確數據要流動、交易甚至共享,才能產生更多價值。”杜欣說。

過去,十分強調數據的可控性和安全性,力求建立自己的閉環系統,認爲100%掌握數據。但多年後卻發現只是掌握了一堆數據垃圾,無法在同行和應用之間進行交易,而原本期望這些數據有一天能產生大量資產價值,但多年來實際情況與產業期待相差甚遠。

未來,期待政府、國企等核心單位,能夠更多地建立數據共享機制,爲做數據分析和挖掘的下游應用場景公司開放更多機會,這樣才能真正讓數據變成數據資產。

談及數據要素髮展所帶來的投資機遇,元禾原點合夥人米菲認爲,在投資領域,數據引起的投資變化非常明確且明顯。在2014年之前,整個互聯網行業欣欣向榮之時,團隊的投資聚焦於生產工具升級,更多地集中在智能製造、生物醫藥的創新上。

隨着互聯網時代的到來,尤其是2014年以後,可以看到更多與數據安全、數據庫變現以及一些與隱私計算相關的企業開始蓬勃發展,它們實際上也反向推動了硬件升級。

例如,由於數據的增加和算力的升級,促成了更多AI芯片的誕生。包括現在大家熟知的大模型、生成式AI,所有這一切都是由於數據要素的變化和算力的提升,導致了行業的變化以及更多創業機會的出現。

投資人看好行業數據的應用場景創新

相比國外,中國在數據產業發展方面有哪些優勢?米菲認爲,在中國,數據要素具有巨大的數據量這一先天優勢。但同時,數據質量也確實存在着很大的挑戰。此外,由於中國擁有非常豐富的應用場景,所以在很多場景方面,比美國甚至其他許多國家都更具優勢。

比如,以前在先進製造領域的精密機牀等方面,大家會認爲中國不如歐洲。但現在,在智能化設備升級方面,可以看到了中國領先於海外的機會。在傳統的煉油鍊鋼等企業中,由於數據要素的變化和人工智能的應用,中國的企業在傳統升級上已經領先了國外的一些先進企業。

“我們不必僅僅緊盯着之前大家聽到的財稅、人力、法律法規等數據要素,雖然它們應用得非常好,但未來會有更多行業的數據,讓大家進行更多的創新,這也是我非常看好的領域。”米菲說。

值得注意的是,在大模型時代,對算力、算法和數據的需求都在急速提高,數據產業也迎來新的發展機會。

杜欣認爲,OpenAI 的ChatGPT好,很多時候是因爲英文世界的數據質量比較好,數據質量和數據標註的水平更高,這是一個很重要的因素。促進我國基於中文的數據要素更好地獲取、分享、分類、管理和打標註標籤,並能夠變成公共數據資源的池子,再結合算法和算力,就能夠訓練出適合中國、在一些產業應用或細分市場有獨特價值的人工智能應用,這也是中國區別於世界的一個非常大的機會。

畢馬威數據資產主管合夥人陳立節表示,現在也很多地方用“算料”來替指數據,“算料”是中國未來突破的一個很好切入點。美國各個州的行政相對分散,另外美國在個人安全法案這方面執行非常嚴苛(美國和歐洲都是如此),導致他們先天難以在國家層面整合並獲取大量的算料,也就是數據。即便模型算法再領先、再先進,如果沒有大量數據進行訓練,做出來的效果一定不佳。

而中國現在有了這樣的契機,去年國家數據局成立後,最近發佈了一系列政策文件如數據要素×三年行動計劃、開展全國數據資源調查的通知等,此外公共數據授權運營等配套制度也正在起草制定過程中。可以相信,我們國家有能力去構建全國統一的數據要素市場。目前,各省的政數局及相關部門也在積極推進相關工作。中國有機會在區域甚至國家層面實現數據的真正整合,這在世界其他任何地方都難以實現。

陳立節認爲,數據如果割裂,價值就不高,一旦整合才能產生更好的價值。這是現在面臨的挑戰,也是機遇。挑戰在於有如此大量的數據,很多數據都在企業手中,企業可能不太願意提供。但未來潛在的收益價值也很大,這確實需要政府發揮特定作用。

“包括畢馬威在內,也在探索如何通過一些試點應用,讓企業能夠快速看到數據價值釋放的收益,能夠‘短平快’地嚐到甜頭,更好地在其他場景或領域推廣,這也是未來我們要推進的方向。”陳立節說。