AI應用落地提速:大模型開花 小模型破局
大模型的熱度依然不減。
日前,百度董事長兼CEO李彥宏在2024世界人工智能大會(WAIC)產業發展主論壇演講稱,2023年國內出現百模大戰,這造成社會資源的巨大浪費尤其是算力浪費,但也使得中國追趕世界上最先進的技術模型能力得到建立。
毫無疑問,大模型已經成爲當今的生產力明星,而競爭也趨於白熱化。就在不久前,國內模型廠商掀起了一輪大模型降價潮,廠商們試圖通過降低成本搶佔市場,背後是基於基座大模型的應用在各行各業落地開花。降價無疑會加速這個趨勢。
“雖然只有短短一年時間,但變化還是非常大,大家已經從去年關注大模型本身,轉變爲思考或討論大模型本身怎麼來創造價值,怎麼來賦能產業,怎麼來落地應用。”智譜AI公司CEO張鵬向21世紀經濟報道記者表示。
華金證券研報稱,中國10億參數規模以上的大模型數量已超100個,行業大模型深度賦能電子信息、醫療、交通等領域,形成上百種應用模式,賦能千行百業。
不過眼下,業內期待的是大模型與行業更深度的融合。容聯雲產業數字雲VP兼諸葛智能創始人孔淼向記者表示,行業知識和業務理解在大模型應用中至關重要,它們是有效解決方案的基礎,需要深入瞭解特定行業的獨特需求、流程,以及對企業如何運作和實現業務目標有更加全面的認識。
細分、個性化的需求逐漸增多,大模型也難以兼顧全部,應用場景有限、效果參差不齊、高質量訓練數據缺乏等問題阻礙着大模型的落地,相當一部分企業陷入了對該技術的焦慮當中。
如何用、怎麼用,一度困擾着想要跟上這波技術浪潮的企業,這背後的根源或許並不在於大模型本身,而是迴歸企業自身需求。
落地廣泛
近期的大模型降價潮讓應用端煥發生機。張鵬認爲,大幅度降價的出現主要源於技術驅動,“技術不斷提升,生產成本逐漸降低,從而導致價格持續下降。”不過他表示,過度的降價並不是合理的商業模式,降價不會持續很久。
但對於開發者來說,降價是一個利好消息,有助於創新和應用的開發。在大模型時代,擁有強大的應用能力可以成爲企業的核心競爭力。
在百度創始人、董事長兼首席執行官李彥宏看來,大模型的重點還是“卷應用”,“沒有應用,光有基礎模型,不管是開源還是閉源都一文不值。”
他在WAIC上發言表示,要跳出移動時代的思維邏輯,避免掉入“超級應用陷阱”,不是隻有10億DAU的應用才叫成功。
目前,大模型應用已在辦公、企業服務等場景實現商業化前期的落地;文生圖、文生視頻等工具型AI應用已集中於消費者端,尤其是專業用戶的覆蓋比較廣泛;與智能硬件結合的應用也是新的行業中新的趨勢亮點,AI賦能智能手機、智能汽車、機器人等智能終端,目前這部分的融合仍處在相對初級的階段,但未來空間廣闊。
另一個明顯的趨勢是,市場需求正在發生演變,對通用大模型的關注度有所下降,垂直領域大模型逐漸興起。
在業內人士看來,垂直領域大模型通常針對特定行業的數據和問題進行訓練和優化,因此能夠提供更高質量的結果。這種專業化是通用模型難以實現的。
目前,垂直大模型在多個領域有所應用。例如,潤達醫療與華爲雲合作,開發了專注於醫療健康的“良醫小慧”醫療AI垂直大模型,利用先進的自然語言處理技術提供專業的醫療建議和信息;螞蟻集團推出百靈大模型,支撐起金融AI助理“支小寶”,能夠提供個性化的金融諮詢和投資建議。
而對於衆多企業來說,他們尋求的是高度定製化的解決方案,建立企業私有大模型來完成企業內部業務的降本增效。
尤其對於那些擁有敏感數據的企業,如金融、醫療等行業,私有化部署可以確保數據在本地處理,避免數據傳輸過程中的泄露風險,同時也幫助企業遵守嚴格的數據保護法規。
無論是應用還是垂直模型,都是將關注點轉移到了如何將大模型更好地實現落地、創造價值。這也要求技術提供者深入理解行業需求,創新解決方案,並與各方合作。
企業“頭痛”
從落地的角度來看,業內對大模型逐漸祛魅,不再賦予其“無所不能”的想象。孔淼向記者表示,隨着時間的推移,客戶對大模型的需求正在逐步明確和收斂,這意味着客戶對於他們需要什麼樣的產品或服務有了更清晰的認識。
不過,整體來看,大模型在各行業的應用場景和範式還相對有限,一方面,大模型目前主要應用於一些常見的場景,如文本分類、情感分析、機器翻譯等,而在一些特定的業務場景或新興領域中的應用還不夠廣泛。
另一方面,大模型在企業中賦能的實際情況參差不齊,這往往與企業和行業自身有着直接關係。“實踐下來,大部分的客戶很難拿通用大模型直接上手。”有大模型企業人士向記者表示,“企業的需求是很細緻且個性化的,他們也很焦慮,生怕錯過這波機遇。”
張鵬在WAIC的演講中表示,企業在開發AI驅動的應用時,需要有一套能夠支持這種開發需求的技術架構。這包括底層資源、技術組件以及開發人員的能力。如果現有的技術棧不能滿足大模型落地的需求,企業可能需要構建新的基礎能力,這將是一個耗時的過程。
高質量的訓練數據也是一大問題,缺乏足夠豐富和高質量的垂直行業訓練數據,限制了大模型的訓練效果和應用性能。
“垂類模型更多關注細分行業專有數據,既包括與個人相關的用戶數據,還包括企業資產行業數據。”中科曙光集團智能計算產品事業部副總經理胡曉東表示。
但這些數據並不容易獲得。在一些細分行業中,例如工業領域,獲取數據相對困難,不僅數據量較少,而且往往不適合或不願意在企業之間共享。
而中小企業更是一片數據窪地。達觀數據董事長兼CEO陳運文向記者表示,許多中小型企業在過去缺乏統一的資料管理系統,通常分散在員工的個人電腦中,難以進行大模型的賦能。
“首要目標是建立一個集中的文檔管理庫,將所有員工的文檔資料集中存儲。在此基礎上,可以構建大型模型和上層的智能化應用系統。”陳運文向記者表示,“這是一個逐步的過程,首先需要打好基礎。”
下一步則是知識的深度挖掘。陳運文向記者表示,如果大模型與專業知識的結合僅限於表面層次,這是不充分的。只有當這種結合達到深層次時,垂直模型才具有真正的價值。行業知識的深度挖掘能夠帶來更深遠的意義和應用潛力。
這時候仍需要人的力量實現對模型的微調。“要人類專家來傳授經驗,大模型要做定向的修改去吸收這些經驗,最後開發出針對性的產品。”陳運文表示。
小模型破局
如果上述的問題在短期內得不到解決,行業與企業又該怎麼辦?是否意味着錯過這波AI的浪潮呢?
張鵬在接受記者採訪時提到一個有趣的點,當客戶提出需求時,要深入瞭解客戶需求背後的邏輯和根源,而不僅僅是“想用大模型”的表面現象,從而提供更有效的解決方案。
“要考慮業務是否適配,是需要一個類人的智能去解決這個問題,還是說只需要一個簡單的計算器,”張鵬表示,“要做相應的分析,大模型並不是包治百病。”
也是在這個背景下,小模型作爲大模型的有力補充,成爲了衆多企業更加切實的解決方案。“有時我們可能不需要或不適合使用大模型,而是需要相對較小的模型。特別是需要將領域知識、專家經驗和邏輯推理引入到模型中。”華院計算創始人、董事長宣曉華在接受記者採訪時表示。
小模型參數數量通常遠少於大模型,針對特定的任務或領域進行優化,它們在這些特定任務上可能表現出與大模型相近或甚至更好的性能。儘管大模型在技術上具有領先優勢,但小模型以其成本效益、靈活性和專業化特點,在大模型時代下發揮着不可或缺的作用。
例如,在工業領域的表面檢測中,由於缺陷樣本稀缺,傳統的大數據方法在解決此類問題時面臨挑戰,而人類卻能通過少量樣本迅速識別出相似缺陷。宣曉華認爲,通過將特定行業的知識和專家經驗整合到AI算法中,不僅可以降低對大量數據的依賴,還能提升識別的準確性。這種方法使得人工智能在處理特定行業問題時更加高效和精確。
“我認爲最重要的是找到合適的應用場景,追求規模本身並不是目標。如果能夠使用較小的模型和數據有效地解決問題並提供良好的服務,就沒有必要追求規模。”宣曉華表示,在解決特定行業或領域的問題時,需要重新考慮如何更有效地解決問題。
從投入產出比的角度來說,小模型的優勢也十分明顯,尤其是對於預算有限的中小企業。小模型可以在計算能力有限的設備上使用,降低了使用AI技術的門檻和成本,在資源受限的環境中適應不同的應用場景和需求。
孔淼也向記者表示,企業客戶關注的是業務價值和成本效益,他們更傾向於購買能夠帶來明確經濟效益的解決方案,而不僅僅是技術上先進但實際應用效果不明顯的產品。
對於國家而言,這一點也很重要。宣曉華表示,當大家都追求大模型時,可能會造成很多浪費,包括算力資源。“人們可能會不加選擇地購買大量算力,而算力本身也有很高的成本。因此,從應用場景的角度出發,思考需要什麼樣的模型,是解決問題的關鍵。”
面對AI浪潮,企業和行業更應該保持清醒的頭腦,迴歸真實的需求。無論是大模型還是小模型,關鍵在於如何將這些技術與行業需求相結合,創造出真正的價值。