鵝廠革新大模型工具全鏈條!5分鐘開發AI助手,河南學生已用上
大模型的風,吹進中小學了。
在河南,十幾所中小學的學生老師,都已經用上專用大模型輔助學習和教課。
而且是熟讀新課標教材的那種,解答習題正確率達到95%。
但開發難度並不高,無需拿着海量數據從頭訓練一個模型,甚至都不一定需要懂編程,大幅降低大模型應用落地門檻。
這就是騰訊雲剛剛公開的大模型商業化新進展。
在騰訊雲生成式AI產業應用峰會上,鵝廠一口氣發佈騰訊混元大模型最新進展、三大引擎工具、以及全面升級的騰訊雲TI平臺等。
他們共同將大模型應用落地全流程鏈條進行大幅革新。
比如開頭提到的教育行業落地案例,就是基於騰訊雲最新發布的大模型知識引擎實現。僅需5分鐘,該引擎即可幫助用戶生成“企業級”的AI問答應用。
透過如上實際落地案例,騰訊雲究竟如何理解生成式AI產業應用?有了更明確解答。
5分鐘,做一個大模型問答應用
騰訊雲提出的知識引擎是一個基於LLM+RAG模式的知識應用構建平臺。
它整合了騰訊混元大模型以及行業特定大模型能力,並結合文檔技術,可以向用戶提供大模型企業只是服務應用模板,以及文檔解析、向量檢索、多輪改寫等原子能力。
在河南中小學實際落地的豫教大模型就是在混元的基礎上,通過知識引擎構建、引入海量教育領域數據,微調之後的行業大模型。
從技術架構來看,知識引擎分爲3層:
其中,大模型底座是基礎設施,關鍵組件爲大模型推理與解析引擎,它通過高度優化的模型推理能力處理複雜數據解析和理解任務,確保信息提取的精確性和效率。
平臺層涵蓋知識問答系統(含任務導向型應用)。中間層負責整合大模型底座能力,提供問答、信息檢索等服務,通過標準化接口實現與不同業務場景靈活對接。
應用層包括控制檯界面和開放API接口,面向終端用戶和開發者,能夠讓大模型能力輕鬆被嵌入到各類外部系統中。
爲了能夠達到更好的應用效果,騰訊雲知識引擎在底層算法方面進行了一系列創新:
首先,知識引擎使用騰訊自研的TRAG技術,不侷限於向量化和檢索增強,對全流程每個環節進行優化,包括文檔處理、檢索、理解和生成等。
其次,OCR解析大模型能夠直接端到端分析各種複雜文檔,比如文檔元素多樣(包括段落、圖、表、子圖等)排版複雜(如橫縱向多欄、圖/圖注羣組等)的Word。通過將複雜文檔圖片表格轉換成可編輯的Markdown文本,它可以準確識別圖表等關鍵元素,並且按照人類閱讀順序理解文檔,整體準確率提升25%。處理複雜圖文PDF、PPT方面,騰訊雲知識引擎還開發了混合圖文的多模態閱讀理解大模型。
然後,RAG能夠精確檢索的前提是做好知識切分,如何保證整個信息塊的語義完整一直是業內難題。騰訊雲採用了一種“暴力解法”,提出業內首個基於語義判斷的知識切分模型,用大模型的方式直接對每個文本做語義級別的切分,然後對多個段落去做更準確拆分,確保每個切片在長度可控的情況下語義是最完整的,沒有缺字、斷章取義的情況。
最後在檢索方面,騰訊雲智慧引擎通過長文檔embedding模型,將檢索最大長度提升至4k字符,遠高於業內平均水平(通常512字),並採用混合檢索、text2sql表格檢索等策略,進一步提高複雜知識的檢索精度,可以處理上萬行超大表格的精確篩選。
在提升平臺專業性的同時,騰訊雲知識引擎還保障了易用性。
它提供開箱可用的應用模板和可被集成的原子能力API,低代碼/無代碼即可快速創建大模型應用。並構建了完善工具鏈,支持用戶自定義模型選擇、角色設定、提示詞自動優化、知識庫管理及維護等,同時支持對話測試-修正-發佈-反饋增強的一站式處理。
實際應用流程只需4步,短至5分鐘即可搞定。
第一步,一鍵導入企業專屬知識。
第二步,填寫基礎配置。也就是你想要一個怎樣的大模型助手,比如汽車售後專家、保險銷售、理財顧問等。
然後選擇相應的底層模型。
第三步,測試發佈。
第四步就能接入應用了。
通過API調用,快速接入智能客服、內部只是問答、數字人等產品,一個企業級的知識問答應用就答應好了。
此外,基於騰訊自研的高性能向量數據庫(可支持百萬級QPS及毫秒級查詢延遲)以及相關加速技術,騰訊雲知識引擎能在保障精度的前提下進一步提升模型推理性能。實際演示中,每次回答完成基本耗時在5秒左右。
總結一下,騰訊雲知識引擎集成更先進的技術,同時還降低使用門檻,主要面向編程小白or非專業人士,能推進大模型應用更快走向千行百業。
這不僅給當下RAG需求市場提供了一個新選擇,同時也是生成式AI應用落地的一個範式參考。
而這還只是騰訊雲生成式AI產業應用峰會新發布內容的冰山一角。
一同亮相的,還有騰訊混元最新進展和騰訊雲TI平臺全面升級。
0門檻應用開發、定製化大模型全覆蓋
最新發布中,騰訊全面升級混元大模型能力。
提供萬億參數hunyuan-pro、千億參數hunyuan-standard、百億參數hunyuan-lite等多種尺寸模型,通過騰訊雲面向企業、開發者全量開放。其中hunyuan-standard支持256K上下文,具備單次處理超過38萬字符的超長文本能力。
升級後的騰訊混元,模型總體性能相比上一代提升50%,部分中文能力已追平GPT-4。在多模態能力方面,支持生圖、生視頻、生3D,比如視頻方面,支持 16s 視頻生成。
基於最新混元大模型底座,這一次騰訊面向AIGC應用落地趨勢、面向產業帶來的,可以說是一波全方位無死角的更新。
除了知識引擎以外,騰訊雲大模型圖像創作引擎具備高質量AI圖像生成和編輯能力,可提供AI寫真、線稿生圖、圖像風格化等能力;騰訊雲大模型視頻創作引擎可生成、編輯高質量視頻,提供視頻轉譯、視頻風格化、畫布拓展等功能。
它們更多面向有應用場景,欠缺開發能力的B端用戶,提供大模型應用浪潮下的低門檻工具鏈。
但這還不夠,騰訊雲還發布“騰訊元器”,進一步拓寬了大模型應用的落地範圍——
即使是缺少數據、工程能力的普通人,也可以一句話打造專屬智能體,讓創意這個大模型時代的重要資源分分鐘“變現”。
具體來說,通過提示詞、插件、工作流、AI輔助等創作能力,用戶能低門檻在該平臺上創建AI智能體。
更關鍵的是,還能將這些智能體發佈到QQ、微信等騰訊App上,享受騰訊全域分發渠道。
另一方面,面向更專業用戶打造行業大模型的需求,騰訊雲TI平臺也完成了全面升級。
騰訊雲TI平臺是一個全棧式人工智能開發服務平臺,簡單來說,就是從數據獲取、數據處理,到算法構建、模型訓練、模型評估、模型部署,再到AI應用開發的大模型落地全鏈路,這個平臺都能一站式打包搞定。
在自家的混元大模型之外,TI平臺還內置了Llama3、Llama2、Baichuan2、Qwen等一系列主流大模型。基於TI平臺,用戶只需要少量算力+領域專業數據,就能高效構建出專屬行業大模型。
此番TI平臺的升級,主要集中在三個方面,以解決企業實際遇到的應用難題:
首先,是發佈了全新數據處理鏈,並且是全開源、易擴展、開箱即用的那種。
具體來說,騰訊雲TI平臺提供了三大類數據處理pipeline,包括100多種任務類型的精調配比數據,支持知識問答、有監督的多輪和單輪問答以及無監督的預訓練等。
此外,還提供原始數據分析、數據清洗、數據去重等功能,並擁有超過100萬條的預置配比數據。
通過Prompt優化和訓練格式生成,TI平臺能夠根據精調任務類型智能分配配比數據,無需額外配置就能自動加載配比數據,快速開始精調任務,並且在Notebook中提供了預置的數據處理鏈代碼,方便用戶快速上手。
其次,是上新了大模型精調工具鏈。
該工具鏈支持任務排隊以提升併發處理能力,採用自研的Angel大模型計算和並行優化方案以提高效率,同時具備故障隔離和自動恢復功能以增強穩定性。
值得一提的是,該工具鏈支持國產化硬件,比如昇騰系列芯片。
最後,TI平臺通過與知識引擎的強強聯合,提供了一種邊迭代邊測評的機制,使用戶能夠及時瞭解並優化大模型的業務效果。
平臺支持客觀和主觀兩種測評方式,可以結合業務中的實際難題和知識庫,進行端到端效果評測。
△精調前後對比
目前,廣東工業大學、騰訊雲和中國大熊貓保護研究中心已經基於TI平臺+知識引擎展開了AI大熊貓保護的探索。
項目組在一階段打造了全球首個大熊貓智能行爲識別模型及智慧系統,能識別大熊貓進食、喝水、睡覺等日常行爲,準確率超過80%。
有意思的是,就在騰訊雲生成式AI產業應用峰會現場,Gartner還聯合騰訊發佈了一份《生成式AI產業落地路徑研究報告》。
其中提到,目前生成式AI的落地路線主要分爲三種:
結果上看,騰訊雲的這一波生成式AI重磅更新,可以說是全面覆蓋了這三條路線。
生成式AI邁入產業落地階段
伴隨着2024而來,業界越來越強烈的共識是,大模型的最新關鍵詞之一,就是“應用”。
無論是Sora掀起的科技圈新風暴,還是OpenAI、谷歌在多模態智能助手方面輪番上演肌肉秀,背後指向的趨勢都是:
生成式AI進入第二階段,場上玩家們正在從卷基礎模型的研發,邁入到應用落地探索的新階段。
在這一浪潮之中,其實不僅僅是AIGC產品的開發廠商,越來越多的傳統企業也已經被捲入實踐的第一線。
值此之時,如何結合自身AIGC場景,選擇合適的落地路線,將成爲越來越多企業需要思考的問題。
騰訊雲此番交卷,其實也在釋放一種信號:
對於平臺廠商而言,如何與產業相結合,真正把大模型應用的門檻全方位降到更低,已成爲新階段的競爭關鍵。
作爲旁觀者,值得期待的是,這些具體實際的落地腳步,或許就是趨勢變革連點成線的關鍵。