Sora:又一次GPT式創業?
Sora讓整個行業又興奮起來。字節闢謠中國版Sora,周鴻禕火速“追星”,李一舟趁熱賣課,一衆上市公司夾雜着“顛覆性、里程碑、加速器”等關鍵詞舞動資本市場。又一次創業機會,還是新一輪趕超焦慮,是看待Sora撥雲見日的兩條線索。
在人們驚歎其高超能力的同時,一種有關羨慕與追趕的技術焦慮也隨之產生。正如字節迴應“中文版Sora”,目前無法作爲完善產品落地,與國外有很大差距。但也有人認爲,Sora的出圈是AIGC深入人心的新契機,有助於更好地推動國內AIGC產業的發展。
從ChatGPT到Sora,相同的問題又一次擺到AI廠商面前:如何追趕?如何找準落地場景?如何實現數據飛輪?
新“AI行情”?
熱點最容易在資本市場掀起巨浪。連續爆發兩日後,2月21日,Sora題材股表現分化。截至當日收盤,因賽集團、當虹科技等漲超10%,新易盛、中際旭創跌超5%,萬興科技、東方國信等跌超4%。
其中因賽集團已獲3連板,近4個交易日累計大漲超88%。
股市的起伏和公司的迴應,是市場狂熱的一面,一如一年前ChatGPT的橫空出世,再次掀起一股熟悉的“AI行情”。
不過,Sora雖然復刻了ChatGPT所帶來的轟動,卻沒能在市場上覆刻出同樣的創業風。取而代之的是,一種有關技術的焦慮正逐漸蔓延。
文生視頻並不是個新鮮事,但與Sora相比,時長是以往文生視頻最大的“硬傷”。
一位大廠的業內人士對北京商報記者提到,國內公司的文生視頻產品,都是基於大型語言模型(LLM)和傳統的視頻生成AI集成的結果,生成的視頻長度都是秒級,且簡單場景。
據瞭解,在Sora發佈之前,Runway和Pika普遍被認爲是視頻生成賽道的佼佼者,但前者僅能生成4秒的視頻,後者則只能提供3秒的視頻。Runway的用戶可以將生成的視頻最長延長至16秒,而這已經是AI生成視頻在2023年所能達到的最長時長紀錄。
“三四秒和一分鐘,是天差地別的。”在接受北京商報記者採訪時,無界AI聯合創始人馬千里提到,對於AI生成視頻來說,隨着生成時長增長難度指數級上升,更長的視頻意味着更高的一致性要求、更詳細的畫面描述,對算力的消耗也是遠超此前水平的。
“沒錢,沒卡,沒人才,差距在拉大。”談及當下的真實感受,上述業內人士做了這樣一句概括,在他看來,前兩者的客觀環境也在一定程度上限制着人才的迴流。
此外,萬億級別公司的玩家才能持續的事情,國內雲計算大廠跟起來也很吃力,而且大廠也要考慮投入產出,“總之挺難的”。
在人才角度,伽利略資本合夥人鄭譞也對北京商報記者提到,目前國內真正具有大模型經驗、瞭解大模型的技術專家還太少。
而通過與其身邊少數從業者的交流來看,壓力也是顯而易見的。鄭譞稱,除技術外,焦慮還普遍存在於包括算力等方面資源的充沛程度上,“相比於原來的大模型,文生視頻的計算量是一個‘天文數字’,而國內具備這樣算力基礎的AIDC(人工智能數據中心)數量屈指可數”。
不過馬千里認爲,Sora破圈最重要的意義其實在於教育了客戶,讓外界重視了AIGC產業,從而進一步推動國內AIGC產業的發展。“雖然有壓力,但總歸是一件好事,這不僅是輿論層面的判斷,從技術上看,Sora跑通了這條路,其他人也會更有信心投入這條技術路線,而這對於技術的發展通常也是至關重要的。”
顛覆與祛魅
Sora所引發的焦慮,一部分來源於技術本身,另一部分來源於“顛覆性”的營銷。
Sora的顛覆究竟是技術層面的徹底革新,還是原有路線的進一步成熟?這或許是於狂熱的市場氛圍中,理性看待Sora“衝擊波”的一個關鍵起點。
廣發證券認爲,在底層基礎技術原理上,Sora並未有實質性的突破,或應更多理解爲類似於ChatGPT,基於同樣的技術原理,在暴力美學下的又一次重要“量變”。
香頌資本董事沈萌也提到,從技術架構來看,Sora其實並沒有脫離大語言模型本質,仍是基於深度學習的框架。
馬千里解釋稱,從底層架構級技術角度看,Sora的確沒有很多創新,DIT技術中Diffusion和Transformer都是幾年前的技術了。但Sora的特殊之處在於,它率先實現了大規模的工程化,也就是說把原本應用於文本領域的Transformer技術大規模、成熟地應用在了文生視頻模型當中。此外,它還進行了很多工程層面的創新,比如視頻時空塊Patch技術等。
鄭譞也提到,雖然Sora的效果非常驚豔,但還不能稱爲理論基礎上從無到有的顛覆,但這並不意味着工程上的顛覆就不是顛覆。“當工程量呈現指數級的上升時,一定會出現各種見都沒見過的問題,解決這些問題本身可能就是一種顛覆。”
Sora另一種層面的“顛覆”,集中體現在外界對Sora取代影視行業從業人員的擔心上,一如當年ChatGPT所引發的行業替代焦慮。
不過在沈萌看來,目前Sora只是公開了一些官方視頻,很少有人實際應用,所以其效果到底如何是沒有定論的。而OpenAI CEO阿爾特曼又是一個極度擅長營銷的人,他一定想通過這樣的方式最大程度地放大OpenAI的估值。
由此,Sora也同步進入了被“祛魅”的過程。廣發證券分析稱,Sora的主題意義更爲顯著,商業化進程仍需觀察,一方面,技術文檔提到的當前侷限性需逐步解決;另一方面,版權合規、內容倫理等課題仍是AIGC類應用需要克服的挑戰,文生視頻也不例外。
上述業內人士也提到,Sora生成效果堪稱驚豔,開啓了世界模擬器的進步,但還說不上顛覆性。
Sora不是AI的終點
判斷一件事情火不火,一個關鍵的“指標”就是有沒有人賣課。
Sora發佈不到一週,尚未對公衆開放測試權限,賣課視頻就已經先一步氾濫於閒魚、小紅書等平臺。北京商報記者以“Sora文生視頻”爲關鍵詞在閒魚上搜索,共呈現59條相關內容,價格從9.9元到169元不等。
這些“教程”廣告中,一張以“Sora一鍵文生視頻”爲標題的海報被廣泛使用。海報內容顯示,資料包包含“你的Sora專屬提示詞庫”“Sora專屬提示詞教程”和“30個Sora專用提示詞技巧”三方面。
而透過賣課的“割韭菜”,或許不難摸索國內科技產業發展的亂象和虛火。沈萌稱,國內產業的生命週期,大多以抄概念爲起點,然後大舉跟上,進而衍生一些淺層的應用,進行融資、套項目,最後上市或進行各種程度的資本變現,至此這股風就算過去了。
“整個環節認真、踏實做事的比例很小,這反映出的問題,其實就是不知道自己在幹什麼。”沈萌說,越是可替代,越是價值低,這就是國內AI產業的現狀。
沈萌總結稱,投資者或者機構都覺得AI是風口,瘋狂砸錢,但沒有人去分析砸錢的最後能砸出什麼東西,“如果最後的結果是要進行價格的紅海競爭,這種項目是鐵虧無疑的”。
有消息稱,2023年12月至今三個月內,已有包括萬興科技、博彙科技、易點天下、數碼視訊、漢王科技、當虹科技、東方國信等在內的十餘家A股公司,在投資者互動平臺上披露過視頻生成模型領域的業務情況。
鄭譞認爲,大模型裡面到底能裝多少現實世界的知識,目前還沒有特別明確的判斷,也就是說Sora並不是AI的終點,未來還有很大的發展空間,最後是誰領先都還不好說。
“所以面對Sora帶來的挑戰,不妨讓子彈再飛一會兒”。鄭譞說。
北京商報記者 楊月涵