kimi爆火後,大廠角逐長文本|聚焦

《科創板日報》3月23日訊(記者 張洋洋)月之暗面不再“晦暗”。近期,由這家公司創作的大模型應用kimi,吸引了大量目光。kimi產生的效應已經從大模型圈外溢至資本市場,kimi概念股在本週應運而生。用戶激增,巨大流量突然涌入,甚至讓kimi服務器一度宕機。

kimi在這一輪大模型應用當中突圍,核心優勢在於長文本讀取和解析能力。頗爲巧合的是,就在22日晚間,阿里高調宣佈通義千問開放1000萬字長文本能力。360當晚緊隨其後,宣佈360智腦正式內測500萬字長文本處理功能,即將入駐360AI瀏覽器。

而據《科創板日報》瞭解,百度也將在下個月開放200萬-400萬的長文本能力。

阿里巴巴、百度等互聯網巨頭紛紛佈局並升級自家的大模型產品,強化長文本處理能力,正讓業界重新審視長文本處理在大模型領域的必要性和重要性。而隨着kimi的崛起,這也讓大模型的討論焦點從大模型本身轉移到了應用端,2024年是否會成爲AI大模型應用落地元年?

▍長文本是必要的嗎?

相較於其他大模型應用,kimi的長處在於長文本分析聯網搜索、文檔處理和等功能上,尤其在深度解析厚重書籍內容方面,其性能遠超遠超其他模型。3月18日,月之暗面甚至一口氣將無損上下文長度提升了十倍,直達200萬字級別。

據目前的用戶體驗來看,kimi也不是全能選手。有用戶反饋表示,對於一些較爲困難的任務,包括結構化信息處理和圖像中潦草文字的識別,對話連續性上,kimi仍顯示出一些短板。在生成能力和語音能力上,目前kimi還未加入這些模態。

儘管如此,長文本能力的重要性不言而喻。目前,市面上的大模型應用,GPT-4Turbo-128k公佈的文本範圍約爲10萬漢字,Claude3200k上下文約16萬漢字。

一家AI上市公司大模型架構業務人士告訴記者,由於模型訓練結構的限制,以往大模型的文本範圍都不算長,但複雜任務和行業知識通常是長篇鉅製,這種情況下,只能拆分輸入提問,但這可能會導致輸出的結果上下不連貫邏輯不通順。長文本可以全篇連貫的去理解上下文,滿足理解和問答的需求,長文本能力在此時是具備優勢的。

而國內大廠們,則正在長文本領域快速佈局。

《科創板日報》記者從知情人士方面瞭解到,百度在下個月將對文心一言進行升級,屆時也將開放長文本能力,文本範圍在200萬-500萬。目前,文心一言的文本最高上限在3.2萬。

而阿里已經先行一步。22日晚間,阿里的通義千問官宣升級,向所有人免費開放1000萬字的長文檔處理功能。用戶可通過通義千問網站和APP快速讀研報、分析財報、讀科研論文、研判案情、讀醫療報告、解讀法律條文、分析考試成績、總結深度文章。

360緊隨其後,其在當晚宣佈,360智腦正式內測500萬字長文本處理功能,即將入駐360AI瀏覽器。

kimi成功在前,阿里、百度、360先後角逐長文本。長文本能力會是大模型未來差異化的競爭點嗎?

上述大模型架構人士表示,長文本能力目前在訓練和效果上仍存在一些難點,比如如何避免遺漏細節。事實上,文本長度也可以通過RoPE等算法技術去拓展,但是此時會嚴重丟失細節,這就導致輸出效果不準確。因此,核心標準是看輸出結果的精準性連貫性,並不是文本長度越長越好。

另外一名大模型行業人士也告訴記者,長文本實際是大模型的基礎能力,只要算力資源足夠,理論上長文本可以追求無限長,“但是如果使用場景根本用不上長文本,那麼此時的長文本就沒有任何意義”。

▍2024年是大模型應用落地元年嗎?

kimi的火爆,一定程度上也反應了當下國內大模型的發展階段,從打基建開始走向應用落地。那麼,2024年是否會成爲AI大模型應用落地元年?

瀾舟科技CEO周明認爲,從長遠來看,人工智能在逼近AGI。而經過去一年的發展,大模型已經具備了落地的能力,企業側也積攢了很多業務落地場景。加上國家政策的推動,2024年將會是大模型落地元年。

零一萬物聯合創始人祁瑞峰也表達了類似的看法,但他是聚焦在B端場景。目前,內容生成、理解、摘要和對話等應用仍佔據主導,但隨着新一代模型推理、決策和執行能力的提升,有望更快地將AI技術植入企業業務系統,真正開啓大模型賦能的騰飛。

電商是AI應用最具代表性的領域之一。魔琺科技目前是阿里媽媽、淘寶直播生態官方指定的3D超寫實虛擬直播服務商,旗下有一款3D虛擬人直播AIGC產品“有光”。

魔琺科技CEO柴金祥在接受《科創板日報》記者採訪時表示,電商是公司AI產品應用的最主要一個行業。從已有的使用效果來看,多個知名頭部美妝品牌在使用魔琺科技提供的3D虛擬人後,午夜6小時的直播時段內累計年GMV增量高達數千萬。3D虛擬直播午夜超級直播廣告投放高於行業均值2倍以上,ROI大於5倍。

儘管2024年被寄予厚望,但是各方仍然保持着審慎樂觀的態度。

祁瑞峰認爲,在C端市場,目前成本還很高,商業模式還未完全跑通。即便是對於現在已經可以創收的B端市場,周明也認爲,要想做好產品標準化和完整交付,訓練和部署成本、行業適配能力、幻象問題、數據安全四方面的問題,還有待解決。

夢餉科技CTO曾均濤在接受《科創板日報》記者採訪時表示,雖然AI在電商行業的應用,想象空間非常大,夢餉也在通過GPT大模型重構業務場景,包括解決模特圖片生成、素材差異化、服裝秀、AI創作助手、聊天室導購等問題。

“但是現在的階段,基礎設施並不完善。”曾均濤告訴記者,夢餉在去年爲創作者做了AI創作平臺,雖然能生成模特圖,但是成圖率並不高,還是需要技術升級和內部做技術提示詞、算法模型的調優,這個平臺到現在還沒有開放,“現在大家都在找應用場景,估計2024年開始能夠看到更多AI、大模型帶來的變化”。

在42章經創始人曲凱看來,2024年仍會是技術上不斷突破的一年,很難真的做到大規模的落地和有非常多的場景,不過,不管是在B端還是C端,今年有望看到更多應用開始跑出來。與此同時,應用端的項目今年也將更受投資人青睞。

“去年大家投了非常多資金和精力在大模型本身,要想將這個故事持續下去,就需要有落地,因此會在應用端繼續探索,找到PMF(Product Market Fit,產品市場匹配)。”曲凱說。