央國企進入“羣模時代” 科大訊飛率先突圍商業化落地
一個明確的信號,今年的諾貝爾物理學獎、化學獎、經濟學獎都頒發給了 AI 領域的科學家。
毋庸置疑,AI技術作爲一股不可忽視的力量,在全球科研舞臺上的崛起與影響。對此,科大訊飛董事長劉慶峰表示,“AI for Science帶來科研範式的根本變革,正在成爲科技發展的新引擎。”近日,科大訊飛正式發佈訊飛星火4.0 Turbo,根據真實數據背靠背的測試,已在代碼能力和數學能力超越GPT-4o。與此同時,國產超大規模智算平臺“飛星二號”正式啓動。
根據IDC發佈的《中國大模型平臺市場份額,2023:大模型元年—初局》顯示,2023年中國大模型平臺及相關應用市場規模達17.65億元。國產大模型進入高速發展期,截至2023年7月底,我國累計有130個大模型問世。
而與技術蓬勃發展之相對應的是,在商業落地上的大爆發。據不完全統計,僅2024年第三季度,市場上公開可統計的大模型相關中標項目數,已至少有369個,遠超上半年項目總數276個。其中,教育、運營商、政務、能源等行業也位居前列。
2024政府工作報告中直接提到要深化大數據、人工智能等研發應用,開展“人工智能+”行動。而隨着“新質生產力”提出,作爲推動數字經濟高質量發展,構建數字中國的重要力量,央國企始終站在數字化轉型的前沿,陸續深化大模型佈局。
更值得關注的是,央國企對新技術的採納和應用,往往能夠帶動行業趨勢和標準的形成,有助於推動垂直領域的應用創新。在三季度中,項目的採購方們不僅僅是央國企打頭陣,一些地方國企也在加入其中。
雙向奔赴
在未來,人工智能在社會各領域將如同今天的水和電一樣存在。作爲國家“人工智能+”行動的排頭兵,央國企實現數字化轉型的需求尤爲迫切,這既是基於企業長期可持續發展的考量,也是深化落實國家戰略的使命驅動。
正如谷歌CEO桑達爾曾說:“人工智能是人類正在從事的最爲深刻的研究方向之一,甚至要比火與電更加深刻。”在大模型加持下的人工智能,正悄然顛覆原有的能源運用,在具體的生產場景中,賦予火與電更高的效率。能源行業密集完成招投標,不少項目中標金額超千萬元。
其中,近期發佈的由中國海油攜手科大訊飛共建的“海能”人工智能模型,正是其中“通專結合”代表。“海能”人工智能模型,聚焦海上油氣勘探開發、日常辦公中的痛點難點,在算力、數據、大模型、場景應用等方面同步發力,在訊飛星火大模型底座和一系列“AI助手”應用的加持下,化身“AI行業專家”和“AI專屬助理”。類似的還有:中國綠髮和科大訊飛共同發佈的泰山大模型,是綠色產業內的首個行業大模型;由中國石油、中國移動、華爲、科大訊飛共同打造的能源行業大模型——崑崙大模型,是中國能源化工行業首個通過備案的大模型,訊飛星火大模型爲“員工助手”“行業大家”的研發提供了核心技術支持。
從2024年第三季度招標項目中能看到,各行各業的企業都在探索更細分的應用場景落地。
不同的大模型廠商與企業探索不同的核心場景,或針對一些場景開始前瞻性技術研究,但各有側重。如阿里巴巴的強項是阿里雲提供的雲服務,科大訊飛的強項是B/G端。
在人工智能領域深耕25年,科大訊飛在教育、醫療、工業、金融、運營商等多個領域有很強的技術積累和應用經驗。一位業內人士分析:“即使沒有大模型這個技術,科大訊飛依然能用其他人工智能技術來賦能各行各業。”
隨着頭部企業的商業化落地進程加速,訊飛星火的標杆輻射效應凸顯,從央國企帶頭效應中顯見更廣闊的增長空間。今年1-9月,科大訊飛成功中標38個項目,披露中標金額爲2.16億元。通過中國政府採購網、中國招投標公共服務平臺等數據梳理,科大訊飛8月份單月中標金額突破1.5億,行業排名第一。另據三季報,公司前三季度銷售回款150億元,同比增長25%。
數據顯示,截至2024年10月,科大訊飛與各頭部企業共建20多個行業大模型,覆蓋300+應用場景。
從算力到運營的全套解決方案
科大訊飛可以算是中國專注人工智能時間最長的公司之一。
最新發布的訊飛星火大模型4.0 Turbo,在由艾倫人工智能研究所、OpenAI等國內外權威單位發佈,涵蓋理解和推理、綜合考試、數學和科學、代碼等不同任務類型的14項主流測試集中,其中9項測試超越GPT-4o,且訓練效率相對提升50%。
而根據實用數學任務構建測試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計算、財務、金融、度量等多個維度的任務中均超過GPT-4o水平,已完成超長思維鏈、樹搜索和自我反思評價等算法驗證。
當然,各大模型公司各有優勢與短板,來自各行各業的現實需求複雜且多元,這就要求大模型公司也要具備高適配性。訊飛星火大模型也針對這些垂直領域做了各種“雲、邊、端”一體化的全場景佈局策略,如中國鋼研聯合科大訊飛團隊,基於大模型新技術構建了鋼研智能代碼開發平臺,平臺包括 iFlyCode智能編碼助手以及配套的代碼質效管理工具。據瞭解,當前經指標測算,研發人員對 AI 生成代碼的採納率達到了50%;自部署以來,業務代碼中AI生成代碼佔比達到了 30%。通過智能編碼助手的賦能,員工算法與智能化應用的研發效率提升了30%。
“在衆多企業夥伴中,憑什麼科大訊飛能夠建立一個企業真正能用的大模型?企業部署大模型,首先要建算力。訊飛聯合華爲搭建了中國首個萬卡的國產算力集羣,我們熟悉各種算力,可以搭建最好的算力平臺。有了算力,要整理數據。能否更高效、高質地整理數據,整理完數據能夠訓練模型?能否建立各種尺寸的模型滿足企業的應用,落地到真正看得見、摸得着的場景?同時,企業大模型是否能夠政治安全、應用安全,最後能夠真的在運營中產生可以用統計數據證明的應用成效?在此想說,爲什麼我們中標數量第一,而且中標比例越來越高?因爲很多企業只能做到第三步——訓練模型,後面的幾步與我們差距很大。即使能做到,他們實際上整理數據和訓練模型的能力,與我們差距也很大。“劉慶峰介紹,科大訊飛在通用大模型底座能力不斷提升的基礎上,構建了從“建算力、理數據、訓模型,到落場景、保安全、精運營”的全套解決方案。
爲世界提供“第二種選擇”
央國企和行業頭部公司挑選大模型的標準,技術能力之外,自主可控的安全考量,首當其衝。“國產”是任何技術創新與自主可控的大前提,其能夠極大程度保障大模型技術的安全性與獨立性。作爲中國第一個基於全國產算力訓練出來的全民開放的大模型,訊飛星火無疑是獲得先機。
10月24日,科大訊飛、華爲、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平臺“飛星二號”也正式啓動。去年10月24日,首個國產萬卡算力集羣“飛星一號”平臺上線,星火大模型持續引領全國產算力平臺發展,劉慶峰介紹一年以來攻克了很多‘疑難雜症’,解決了500多次以上的基礎軟硬件問題和模型適配問題。
“飛星二號”將帶來新模型新算法的持續適配和智算集羣規模的再次躍遷,持續探索無人區、引領國產大模型底座的發展。
劉慶峰一直說“大樓不能建在別人的院子裡”,這是科大訊飛押重注做算力的根本原因。還有另一個“爲世界提供第二種選擇”的必做之事:科大訊飛發佈了星火多語言大模型。他說,大模型越用越聰明,是自我迭代的,就像PC和互聯網誕生一樣,會成爲社會最基本的底層能力和工具。如果中國的大模型廠商都只做中文,全球沒有第二種選擇,必然會被鎖在中國範圍之內。多語言大模型已經應用在汽車上,助力中國汽車出海。
劉慶峰進一步指出,人工智能產業發展的關鍵是五個關鍵詞:頂天立地、自主可控、通專結合、端雲聯動、軟硬一體。他直言,“堅持這五個關鍵點,我們的人工智能就有大未來,就能真正的解放生產力、釋放想象力,改變產業格局和競爭格局,帶來科研範式的變化,帶來各行各業的變化,最重要的是滿足老百姓對美好生活的期望!這就是我們未來的發展方向。”