“多雲多模型”時代到來,火山引擎的數字化升級“刀法”

2023年,幾乎可以被定義爲中國互聯網公司的“大模型元年”。

ChatGPT的全球爆紅,徹底點燃國內的大模型賽道,曾經的“創業英雄”、如今的商業領袖們親自下場,接連發布生成式人工智能產品與大模型佈局。

大模型火了,沉寂許久的互聯網行業又有了新的“戰事”。同時,大模型的快速發展也改變了雲市場的現狀,企業對算力的需求急劇增長,技術層面從單一雲架構向“多雲架構”轉變的趨勢日益顯著。

2022年,字節跳動旗下雲服務品牌“火山引擎”對4000多家在雲上消耗超過100萬的企業客戶進行調研,他們發現,目前有88%的企業採用多雲架構,平均每家企業會使用“五朵雲”。

在多雲架構趨勢與大模型持續迭代的背景下,火山引擎總裁譚待認爲,未來將是“多雲多模型”的時代。

不難理解,如今國內雲服務市場呈現多元化趨勢,企業從不同廠商採買雲服務已是常態,而大模型也不會一家獨大,最終會形成多模型共生甚至協作的生態。

“在多雲方面的實踐,字節可以說是經驗最豐富的一家。”譚待說。

具體到技術與業務層面,在“多雲多模型”時代下,火山引擎如何爲企業提供針對性的解決方案?

做好大模型的“基礎設施”

大模型是人人都想摘得的“玫瑰枝”,但在國內落地實現的壁壘依然很高。

大模型的訓練與迭代是對算力和數據的雙重考驗,也是對企業資金儲備與戰略定力的挑戰;有業內人士估算過,OpenAI 訓練 GPT-3 一年,算力成本就高達 2000 萬美元。

尤其對中小科技企業或初創公司而言,建設大模型更具體的挑戰在於,企業缺乏足夠的應用場景實踐和行爲分析數據,在訓練和迭代升級上也存在壁壘。

譚待也認爲,國內很多科技公司投入到大模型建設中,他們有優秀的技術團隊、豐富的行業知識和創新想法,但往往缺乏經過大規模場景實踐的系統工程能力。

對此,火山引擎的解法是:爲大模型客戶提供高穩定性和高性價比的AI基礎設施。

如何爲大模型提供基礎設施?據譚待透露,國內大模型領域七成以上企業是火山引擎客戶,火山引擎將爲他們提供關鍵的算力支持和技術平臺,併爲消費者帶來更豐富的AI應用。

具體到產品端,近日,火山引擎發佈新版機器學習平臺:支持萬卡大模型訓練、微秒級延遲網絡,讓大模型訓練更穩更快。

同時,火山引擎發佈了基於自研DPU的Intel CPU計算實例、AMD CPU計算實例、NVIDIA GPU計算實例,以其中“DPU+AMD Genoa CPU平臺的計算實例”爲例,整機性能最高提升138%,單核性能最高提升39%。

算力是實現大模型迭代的關鍵一環,而火山引擎通過與字節跳動國內業務並池,將抖音等業務的空閒計算資源極速調度給火山引擎客戶使用,確保企業在大模型建設中的數據支持與算力保障。

字節跳動副總裁楊震原表示,“並池”意味着可以調度一些資源,去錯峰互用,把運力提上去,“比如其實也有波峰和波谷,凌晨用的人少,這種資源就很適合科學計算的能力。”

基於字節系的算力資源和生態能力,火山引擎所提供的大模型基礎設施,在運算效率和性價比方面更有優勢。

以火山引擎的合作客戶MiniMax爲例,這是一家已經推出自研大模型產品的獨角獸公司,其與火山引擎合作建立的超大規模推理平臺,擁有萬卡級算力池,支撐單日過億次調用。

再比如抖音的推薦系統,在火山引擎的算力支持下,工程師用15個月的樣本訓練某個模型,5小時就能完成訓練,成本只有5000元。

“火爆全網的抖音’AI繪畫’特效,從啓動到上線只用一週多,模型由一名算法工程師完成訓練。”楊震原介紹說。

楊震原還認爲,業務創新需要試錯,試錯要大膽、敏捷,但試錯也一定要控制成本。

效率更優、算力資源豐富、成本可控的大模型訓練與迭代方式,往往是初創型科技公司最爲看重的模式,也是火山引擎努力實現的目標。

譚待指出,火山引擎要服務好那些立志做好大模型的公司,爲其提供基礎算力支持和技術平臺。“如何在工程上幫它們優化,提高效率,穩定性,都是我們關注的重點。”

當然,不同企業在不同應用場景下,對雲服務和大模型的需求千差萬別,火山引擎又如何做好個性化的企業級解決方案?

數據驅動,升級企業解決方案

從2020年成立至今,火山引擎基於內部業務的技術生態,已經向外開放機器翻譯、視覺智能等能力,業務覆蓋金融、汽車、消費、文娛等行業場景。

不過,事情正在起變化,“多雲多模型”時代對雲廠商提出更復雜的挑戰。

一方面,企業加速搭建“多雲架構”,以實現算力的快速增長;另一方面,多模型意味着多場景應用,企業在不同的業務場景中需要差異化的AI應用。

早在2022年,火山引擎就提出“體驗創新、數據驅動、敏捷迭代”的雲上增長三要素,基於企業不同的應用場景,利用數據驅動搭建雲增長模型。

譚待認爲,“過去很多企業花費了大量時間構建數據中臺,但最後失敗了,找不到數據應用的場景,價值也沒有發揮出來。其本質在於,企業沒有將數據驅動整個體系設計好。”

火山引擎非常看重數據驅動爲企業降本增效、技術升級所帶來的作用,內部對數據使用的價值也有一個明確標準——“0987”,即零事故、滿足90%的需求、80%的需求能夠通過技術優化實現秒級調用、通過業務部門評價達到70分以上。

堅持以數據驅動爲增長核心,火山引擎能在內容、營銷等領域提供更多個性化的企業級應用,比如在內容領域通過算法和AI平臺幫助創作更優質內容、在內部運營方面通過數據平臺優化供應鏈和庫存管理等。

如今,火山引擎的解決方案已經在各行各業落地,進一步帶動產業的數字化升級。

2022年卡塔爾世界盃期間,火山引擎就用AI的方式做出窄帶高清,一方面提升視頻幀率,另外還能降低帶寬。

同時,針對網絡觀衆收看比賽最頭疼的直播延時問題,火山引擎通過RTM超低時延直播技術,將直播畫面的端到端延遲最低降到1s,電視觀衆和網絡觀衆幾乎都能“同頻”觀看賽事直播。

此外,在公益領域,火山引擎與字節跳動公益將聯合推出公益版的電子票據服務與公有云服務,爲符合條件的公益組織提供爲期3年的免費服務。

據地歌網瞭解,字節跳動公益電子票據服務已於今年2月上線,目前中華社會救助基金會、中國聽力醫學發展基金會已申請使用該服務。

中華社會救助基金會相關負責人表示,該基金會2022年開票量超過1萬張,電子開票可以節約0.5個財務人力成本。

從直播體驗升級到公益票據服務,火山引擎通過數據驅動,努力在不同行業的不同業務場景中落地數字化應用。

火山引擎所處的雲計算領域是大市場,專業機構估算,國內雲計算市場規模預計在今年突破3000億元。

但,“多雲多模型”時代逐步變爲現實,企業對雲服務的差異化能力提出更高要求,並且需要將雲計算與大模型賦能到實際業務中,帶來整體業務升級。

行業正在起變化,雲計算企業“不得不變”。

在海外,亞馬遜AWS於日前爲企業客戶推出生成式 AI(AIGC)工具“全家桶”,包括用於生成文本、分類、開放式問答和信息提取等任務的生成式大語言模型等。

在國內,雲計算領域競爭激烈,阿里雲、華爲雲等均在行業內深耕多年,火山引擎作爲“後發之人”,依託於字節生態“溢出”的2B能力,持續升級企業數字化解決方案。

當然,爲適應“多雲多模型”時代,爲大模型客戶提供AI基礎設施,火山引擎有着“任重道遠”的目標。好在,基於多年的資源儲備和場景實踐,火山引擎已經摸索出了一條自己的雲增長道路。