火山引擎數據飛輪2.0:聚焦Data+AI,驅動企業數智化轉型

(原標題:火山引擎數據飛輪2.0:聚焦Data+AI,驅動企業數智化轉型)

數字化浪潮席捲全球,數據與人工智能的融合正給各行各業帶來巨大變革,不僅重塑數據處理流程,更在決策支持、業務優化、產品創新等多個維度上展現巨大的潛力。

近期,火山引擎數智平臺技術和產品專家受邀出席DataFun首屆“數據與人工智能解決方案大會”,圍繞數據飛輪2.0模式,及Data+AI領域熱門話題ChatBI、多模態數據湖展開分享。

據介紹,2023年4月火山引擎發佈了數據飛輪,其內核爲“以數據消費促資產建設,以數據消費助業務發展”,升級後,數據飛輪2.0模式聚焦把AI作爲數智化核心競爭力,通過AI技術促進更普惠的企業數據消費。

爲了充分發揮AI技術潛力,一套能適配AI能力的數據底座至關重要。來自火山引擎EMR的高級產品經理則詳細拆解了多模態數據湖建設,在大模型時代數據管理中的作用。

火山引擎多模態數據湖解決方案

隨着企業數據量呈爆發式增長,且數據類型愈發複雜多樣,從傳統的結構化數據,到圖像、音頻、視頻等非結構化數據,如何高效存儲、管理與運用這些數據,成爲擺在企業面前的一大難題。火山引擎多模態數據湖解決方案可以實現海量結構化、半結構化及非結構化數據的統一精細化管理,全方位兼容各類數據格式,爲LLM預訓練、持續訓練和微調全程各個環節提供更好的數據支持。

在解決方案層面,火山引擎多模態數據湖解決方案通過全域數據集成DataSail實現無縫整合,底層採用兼容多種數據湖格式的TOS進行高效存儲與管理。在數據湖管理上,LAS提供全面管理能力和近計算、近存儲加速,配合多元計算引擎滿足複雜數據處理需求。上層DataLeap提供智能化數據開發能力,降低使用門檻。最終,該方案助力海量數據集成、存儲、計算與分析,爲下游應用場景如Data Agent、商業智能等提供數據支持,服務於企業科學決策。

在數據建設層面上,火山引擎數據飛輪2.0也同樣提出了全新解決方案和落地實踐,其中包括DataWind ChatBI能力,實現用AI降低數據消費門檻,提升效率。

火山引擎DataWind大模型能力矩陣

來自火山引擎DataWind資深架構師分享了來自於抖音集團內外部的ChatBI應用經驗。據介紹,DataWind ChatBI將人工智能的自然語言處理技術深度融入數據分析流程,徹底改變了傳統數據分析工具複雜的操作模式。“ChatBI智能體”的引入則進一步精準滿足企業內部多業務的個性化數據查詢與分析需求。

在日常工作中,企業內部員工常需處理多個數據集,但因不同需求可能導致數據口徑不一致,給上游數據生產部門帶來解釋壓力。針對這一問題,“ChatBI智能體”通過聚焦員工所在業務及用數特性,支持指定官方數據集,確保數據消費口徑的一致性,避免跨數據集查詢導致的口徑割裂,並配置推薦問題和Prompt以提供針對性的數據查詢與分析服務。

此外,智能體還能結合業務團隊使用場景,關閉無效字段、精煉語義模型,並提供語義模型配置功能,使業務團隊能依據實際需求自定義大模型字段,實現貼合業務的大模型能力部署與學習效率提升。更重要的是,“ChatBI智能體”在使用過程中能持續深研業務特徵,規整相似業務數據集,優化明確適用場景,並收集維護業務常用詞及同義詞,不僅使大模型應用更加貼合業務需求,還進一步釋放人力。

舉個例子來看,在抖音集團內部銷售情況分析場景中,銷售人員在客戶現場無法即時訪問內部BI平臺,以便查詢token調用數據,影響工作效率。而基於ChatBI智能體,銷售人員能通過自然語言對話的方式,隨時獲取客戶token使用情況及活躍度,更加精準地把握客戶需求和使用習慣,提供更加個性化的服務和支持,有力推動了業務發展。

Data+AI已經成爲引領未來發展的新趨勢。構建適配AI能力的數據底座、智能數據工具,能夠更好地挖掘和利用數據的價值。未來,數據飛輪也將持續加磅AI能力,推動企業更好實現數字化轉型。