對話MiniMax創始人:如何打造AI時代最大的APP

文|《中國企業家》記者 孔月昕

編輯|馬吉英

圖片來源|受訪者

在2024世界人工智能大會(WAIC)的MiniMax展位上,呈現出戲劇性一幕:當有記者提到一位員工的真實名字時,公司同事很難跟該員工本人對應起來。

這與MiniMax的管理方式有關。在公司內部,同事彼此之間只稱呼花名,很多人的微信暱稱也是自己的花名。對於創始人閆俊傑,員工也都稱呼他爲IO(花名)。

在員工眼中,閆俊傑是一位很有親和力的管理者,他說話聲音很輕,總是面帶笑容。在展位跟媒體交流時,他一直保持着傾聽的姿態,說話不疾不徐。

作爲一位低調的技術型創業者,閆俊傑曾擔任過商湯副總裁、研究院副院長和智慧城市事業羣CTO。2021年12月,在商湯上市前夕,閆俊傑離開商湯,創立了MiniMax。

MiniMax早期投資人、明勢資本創始合夥人黃明明認爲,從創業時間點的選擇來看,閆俊傑是真的對AGI有信仰。

目前,MiniMax已完成A+輪融資,最新一輪融資由阿里領投,金額爲6億美元,公司估值突破25億美元,其投資方還有騰訊、紅杉中國、高瓴、IDG、米哈遊等。

從創業第一天開始,閆俊傑就堅持模型、產品兩條腿走路。在他看來,一切都以技術爲先,只有大模型底座搭建好了,才能“長”出更有價值的應用。

因此,在2023年6月,大部分國內公司還在迭代稠密模型(dense model)、MoE(混合專家系統)模型尚未成爲行業共識時,MiniMax就花了80%以上的精力下注MoE。

雖然過程歷經坎坷,但閆俊傑最後還是“賭”對了。

2024年1月,MiniMax發佈了國內首個基於MoE架構的千億參數量級模型——abab 6;4月底,又迅速迭代並推出abab 6.5系列模型。在各類核心能力測試中,abab 6.5也接近了GPT-4、Claude-3、Gemini-1.5等世界領先的大語言模型。

探索MoE的好處不限於此。在閆俊傑看來,這次磨礪讓他們不會被侷限在只做公開的東西,也敢去做上限更高、要靠自己探索(的東西)。

不過,閆俊傑也認爲,只有技術好是沒用的,一年之後,一旦失去“AI濾鏡”,大家會從商業化的角度來評價公司。“我覺得短期內最重要的是AI技術的進步。一年之後,商業化一定是非常重要的。”

在2024世界人工智能大會上,閆俊傑接受了《中國企業家》等媒體採訪。

以下爲採訪整理,有刪減:

問:你對WAIC的第一印象是什麼?

閆俊傑:大會的主題是跟安全治理相關,(提出這些問題)還是挺及時的,如AI安全、治理、版權等問題。假設我用了你們的新聞來訓練,這算不算侵權?我覺得這些都是挺迫切的(問題)。

我們過去一年確實開始遇到這樣的問題了。面對這種問題,也沒法靠一個企業來解決。比如用一篇文章來訓練到底有沒有侵權?如果侵權了,是侵了平臺的權利,還是文章作者的權利?

問:現在已經開始思考這些問題了嗎?

閆俊傑:不是思考,其實是遇到了。比如在海外,有好幾家公司起訴OpenAI了。在中國,我們也開始遇到類似的挑戰了。

比如訓練數據。你的模型有沒有用到公開數據?如果迅速出來了,你的模型獲益了,要不要給提供數據的人付錢呢?

此外還有監管的問題。比如,模型輸出的內容有沒有突破一些紅線?該怎麼來算?

再比如用到一個語料要付錢,但如果用這個語料訓練模型說錯了話,提供語料的人是不是要賠錢?有很多這樣的問題。

坦白說,這種問題不是僅靠一家企業能解決的。首先,肯定得需要政府來組織,並且它有時候涉及的不止一個國家,海外可能也會有用戶,也會有相應的數據。其次,即使只在中國,我覺得目前技術往前走了一步,但各種各樣的法律法規還需要跟上。

問:有從業者覺得國內有點太捲了,國外可能沒那麼卷,你看到的情況是這樣的嗎?

閆俊傑:我覺得海外也很捲了,競爭都很激烈。我覺得核心是中國跟美國的基本面不太一樣,比如美國最好的模型顯然比國內最好的模型要強,這是事實;海外公司本來的品牌也比中國公司的品牌要好,至少對海外來說是的。

但是它也有缺點,就是沒有工程師紅利。比如說同樣價值30億美元的公司,在中國公司的工程師肯定比在硅谷多很多,雖然最頂尖的可能有差距,但是平均水平其實是更強的。

如果是平均水平乘以工程師的數量,那麼相同水平或相同估值的中國公司,工程師一定更多。

問:主要是人才嗎?

閆俊傑:對。我自己覺得中國確實還是有工程師紅利的,這是一個客觀事實,可能都不是30%或者50%的差距,而是3~5倍的差距。

第二,移動互聯網時代的中國公司有很多優秀的產品、商業,這東西其實也很強。所以我覺得在海外,我們雖然沒有品牌優勢,一開始也沒有技術優勢,但是可以有工程師紅利,有其他很多積累,其實就是“田忌賽馬”。

問:你如何看待行業裡頭部效應越來越明顯的趨勢?

閆俊傑:其實中國還沒有美國明顯,你看美國的那幾家創業公司,Adept、Inflection都沒有了,Character AI可能馬上也沒有了。

問:你對Character AI這件事情怎麼看?他們跟你們的產品有點像。

閆俊傑:今年你看他們很多功能在參考我們的功能,我覺得這就是工程師紅利,商業化一定是個很重要的事。

問:後續它們會不斷被大廠收購嗎?因爲它們自己難以維持。

閆俊傑:我覺得它們(美國創業公司)被大廠收購了也無所謂,也正常,他們並不覺得失敗。

問:MiniMax也是創業公司,會不會也有這樣的擔憂?

閆俊傑:我覺得核心還是獨立發展。因爲一家公司不管是自己獨立做還是怎麼樣,核心還是看你給用戶創造多大價值,這纔是最本質的。不管怎麼樣,本質上都是看你的技術有多好。技術能做得好,能夠把用戶服務得好,這纔是最本質的。

問:相比國外,在國內有哪些挑戰是需要你們解決的?

閆俊傑:坦白說,我覺得國內大部分公司還沒有形成差異化,模型水平、產品都差不多,所以就會變成拼價格。但我覺得這不是壞事,這其實是逼着大家能夠更好地做技術創新。

問:MiniMax主要的差異化是什麼?

閆俊傑:我覺得這個不是說就要跟別人有什麼不一樣。根源上還是想要有什麼東西或有什麼問題,然後再往這個比較大的問題上努力,這個過程中自然就會有不一樣。

問:你們大的問題是什麼?

閆俊傑:我覺得我們還是很明顯的,就是滲透更多的用戶。在這一過程中,就需要我們的技術變得很強。

問:MiniMax主要的模式是to C?C和B的體量完全不一樣。

閆俊傑:我們現在的C的體量也比別人要大挺多的。

問:部分友商可能明確to B會佔80%,to C會佔20%,你們有這種比例的定位嗎?

閆俊傑:我們沒有這個定位。我們只有一個點,就是用戶滲透率是多少。再簡單一點就是我們的模型被使用次數。

問:效率類和娛樂類兩個產品你都做,這兩個產品你覺得哪個能更快地跑出來?

閆俊傑:現在技術其實也在不停進步,比如一年之後的技術大概率不是現在的技術,產品的體驗又大部分來自模型的能力。所以基於假設的話,我覺得大概率明年最大的產品可能都不是現在的。

問:但是你們星野現在的確跑得挺快了。

閆俊傑:我覺得在今年最大DAU的產品,到年底的時候在中國可能是1000萬DAU,今年我們的目標就是什麼產品能到1000萬DAU。但是明年可會有1億DAU的產品,它可能不是現有的產品,可能是另外一個形態。

問:你現有的產品明年不會變成1億DAU嗎?

閆俊傑:我覺得我們現在的產品應該是能看到千萬DAU,但還看不到億級(DAU)。

問:你覺得現在還看不到killer APP(殺手級應用)嗎?

閆俊傑:舉個例子,現在抖音大概6億DAU,今日頭條是1億DAU,今日頭條算不算killer APP?

但在今日頭條之前,當時最大的是內涵段子,可能有2000萬DAU,那算不算呢?

如果變成在這個時代裡面最大的APP,或者在AI時代最大的APP,我覺得我還是挺有機會的。但是現在這個APP肯定還沒那麼大,我覺得可能要三年之後纔會大衆化。但是沒關係,當你能做到第一個,你的能力變強了、資源變多了、技術能力變好了,大概就可以做出來。

這個東西就一步步來,我不認爲我現在做的可能就是三年之後的APP。

問:做完MoE之後,下一步你覺得應該是哪個方向?

閆俊傑:我們還是做了很多技術創新的,不光是MoE。比如一些transformer的改進,就是怎麼樣能讓它支持無限的上下文;我們的合成數據也做了很多改進。我覺得MoE給我們的收穫,不光是MoE本身,對我們來說最大的價值是說當有個方向它能提升幾倍,但是它沒有開源,也沒有公開的東西,我要把一個幾倍的東西靠自主能力做出來,這個過程中的收穫是比較大的。

當我們把這個事做完之後,現在有一些更新的技術,比如怎麼樣做支持無限長圖上下文的transformer,怎麼樣來做合成數據,怎麼樣用更低精度的方式來訓練模型,這種東西我們都敢做了。

相當於我們就不會被侷限在只做公開的東西,我們敢去做上限更高、要靠自己探索(的東西)。

問:MiniMax還會做新的產品嗎?

閆俊傑:之前不敢做,但是做MoE之後我們就敢做。我覺得經歷MoE之後,我們基本上就比較敢來做很大的(創新)。

視頻可能下個月會出來,在星野和海螺AI裡面也可能會有應用場景。

問:您這邊有跟Sora做過對比嗎?

閆俊傑:有。

問:Sora一直沒有公開,你們是怎麼去做對比的?

閆俊傑:我們做模型不是算法來評測,我們公司裡面有一些很專業的視頻創作者和音樂創作者,比如做音樂模型的運營是一個非常專業的音樂創作者,評估視頻模型的是一個非常專業的視頻創作者。舉個例子,比如說生成40首歌讓他盲聽,看他覺得哪個好哪個不好。當他也區分不出來真實音樂和AI生成音樂的時候,它的能力就夠強了。

問:MiniMax有文生文、文生語音,馬上有文生音樂,這三個方向哪個能最快衝到全國第一?

閆俊傑:現在我們的文生語音就是行業最好的,但這個東西我覺得沒那麼關鍵,文本模型纔是最關鍵的,相當於文本模型能提升10個點,其他模塊自然也能提升。語言模型還是最本質的,其他東西其實都是自然的衍生。

問:下個月文生音樂/視頻一起推,是這個意思嗎?

閆俊傑:更主要的還是我們文本模型變得更強,我們只是順帶做出來音樂、視頻這些東西。

問:OpenAI好像有專門的一個團隊在做視頻。

閆俊傑:這個東西在OpenAI也是一樣的。OpenAI做GPT的團隊可能是幾百個人,可能有幾萬張卡;但做視頻的就只有十幾個人,可能就1000張卡。它其實就是很小的,只是放在中國,大家覺得這個東西很多,其實不是的。

問:在短期內,你最明確的一個或兩個目標是什麼?

閆俊傑:首先是錯誤率,我們的錯誤率還有繼續降低的空間。包括GPT-3,爲什麼用戶沒那麼多?原因就是錯誤率太高了。

問:現在GPT-5放出來的標準是什麼?

閆俊傑:我覺得一個標準就是錯誤率能變得比較低,比如錯誤率變成3%。

問:你在商業化方面的第一個目標是什麼?

閆俊傑:用戶規模。

問:MiniMax在技術和商業化這二者之間怎麼平衡?

閆俊傑:技術是不是在線,這決定你是不是一家合格的AI公司。如果技術不夠好,可能它就應該被淘汰掉。

但是光技術好是沒用的。現在(大家)還有AI濾鏡,但是一年之後,那可能不完全是看技術了,可能會從商業化角度來看這家公司。所以我自己覺得短期內最重要的是AI技術的進步,一年之後,商業化一定是非常重要的,事實上MiniMax這方面的進展也是非常快的。

新聞熱線&投稿郵箱:tougao@iceo.com.cn