北京人工智能基金出手清華系AI創企清程極智 智譜退股
《科創板日報》23日訊(記者 李明明) 新年伊始,AI賽道持續火熱。
近日,國內AI Infra創業企業北京清程極智科技有限公司(下稱“清程極智”)發生工商變更,新增北京市人工智能產業投資基金(有限合夥)、北京中科創星硬科技中小企業創業投資合夥企業(有限合夥)、北京考拉鯤鵬科技成長基金合夥企業(有限合夥)等,註冊資本由約115.4萬元增至約138.4萬元。
《科創板日報》記者注意到,作爲天使輪投資方,智譜近期退出了清程極智,退出前持股比例2.16%。對此,《科創板日報》記者聯繫了智譜,但公司未作迴應。
清程極智聯合創始人湯雄超爲字節系創業者,他於2022年加入字節跳動任高級研發工程師。
聚焦AI Infra賽道
清程極智成立於2023年12月,法定代表人爲湯雄超,是一家智能算力系統軟件服務商。經營範圍含人工智能理論與算法軟件開發、人工智能基礎資源與技術平臺、人工智能基礎軟件開發等,現由北京清程萬象科技中心(有限合夥)、北京清程縱橫科技中心(有限合夥)等及上述新增股東共同持股。
主要產品方面,清程極智此前推出自研高性能推理引擎 “赤兔(Chitu)”。該引擎集低延遲、高吞吐、低顯存佔用、系統運行穩定等技術優勢於一身。目前,“赤兔”推理引擎已支持文本、圖片和視頻等多種模態,並且適配及多款國產芯片。
另外,清程極智的旗艦系統“八卦爐”在某國產芯片集羣訓練 Llama2-70B 場景下,加速效果接近2倍。“八卦爐”系統具有較強的通用性,能針對不同硬件架構和目標模型提供針對性的性能優化方案,可以兼顧預訓練和個性化微調等多樣化業務需求。
清程極智所在的AI Infra賽道,指的是在大模型的生態系統中,除算力外,爲支持大模型訓練和部署流程構建的各種底層軟件技術設施。其能幫開發者簡單方便地設計模型或使用模型,而無需操心底層算力資源的調配。
隨着ChatGPT的火熱,大模型和其相關應用不斷涌現。AI Infra作爲連接算力和應用的AI中間層基礎設施,其技術和商業發展前景被重點關注。
一位投資國內AI Infra早期創企的頭部投資人向《科創板日報》記者表示,由於目前大模型的發展處於早期階段,快速構建和訓練調優模型更受重視。而基礎設施構建雖並非絕對優先級,但是在行業成熟後,應用層發展起來後,基礎設施的支撐將會越來越重要,因此,其個人非常看好AI Infra的前景。
“國內AI Infra創企若想發展的好,還需要思考是面向國內市場還是海外市場、相比現有解決方案或開源軟件的獨特優勢在哪、商業模式是否可以標準化等問題。”
隨着 AI 應用日益廣泛,未來 AI 算力需求呈現推理需求持續攀升的態勢。據相關數據預測,到2026年,大模型推理在算力使用中的佔比有望達到60%以上。
《科創板日報》記者注意到,國內AI Infra創企還包括無問芯穹、硅基流動等,二者均爲清華系公司,此前清程極智的投資方智譜也入資了這兩家企業。
無問芯穹的項目發起人是清華大學電子工程系主任汪玉,創始人是其學生夏立雪;硅基流動的創始人袁進輝也出身於清華,師從中國人工智能的開拓者、中國科學院院士張鈸。
而該賽道的國外企業包括英偉達、亞馬遜、Lepton AI、OctoAI等,以及伯克利大學開發的 vLLM。
創始人系字節跳動前高級工程師
清程極智核心團隊都來自清華,其聯合創始人湯雄超2019年於清華計算機系博士畢業,畢業後加入深信服,在2022年加入字節跳動任高級研發工程師,負責計算密集型產品的架構;2023年12月成立清程極智。
團隊首席科學家爲清華大學計算機系教授翟季冬,研究方向包括高性能計算、編程語言和編譯優化、性能評測等。
此前,訓推一體機是業內較爲流行的產品形態。但在湯雄超看來,訓推一體機是很難滿足未來的 AI 業務全部需求的。
他認爲,訓練和推理兩種業務對算力系統的需求區別較大,很難想象出有一個比較小的一體機能夠承載訓練的業務,現在大模型的預訓練可能都是萬卡以上的規模。所以,清程極智選擇爲推理業務量身定製相應的軟硬一體化算力系統。
商業化方面,湯雄超此前表示,清程極智已經陸續和多家芯片廠商、算力中心、AI 應用開發商以及基礎模型預訓練廠商達成了商業合作,包括沐曦、燧原、天數、摩爾線程等。
成立至今,清程極智已經完成了兩輪融資,本輪投資方之一北京市人工智能產業投資基金表示,當前我國各地智算中心在GPU大集羣上的建設和運營經驗尚顯不足,清程極智是國內有充足潛力的AI Infra企業,核心團隊國內稀缺,具備編譯和並行系統雙重背景,能提供完整並行系統而非單一框架,具備百萬億級參數模型訓練經驗,且具備異構算力集羣訓推優化經驗。
北京市人工智能產業投資基金,於2023年底成立,截至目前,其共有公開投資事件約20起,涉及面壁智能、智譜、深勢科技等多個人工智能領域的知名項目。
另一投資方中科創星表示,清程極智核心團隊在大模型出圈之前,就具備大模型在國產卡上的訓練優化能力。是國內少有的完全掌握從底層編譯器到上層並行加速全棧研發能力的團隊,在國內市場尤爲空缺的編譯器和並行訓練推理系統等核心技術軟件方面,具備完整的自主研發能力。