☰

對話MiniMax創始人：如何打造AI時代最大的APP

文｜《中國企業家》記者孔月昕

編輯｜馬吉英

圖片來源｜受訪者

在2024世界人工智能大會（WAIC）的MiniMax展位上，呈現出戲劇性一幕：當有記者提到一位員工的真實名字時，公司同事很難跟該員工本人對應起來。

這與MiniMax的管理方式有關。在公司內部，同事彼此之間只稱呼花名，很多人的微信暱稱也是自己的花名。對於創始人閆俊傑，員工也都稱呼他爲IO（花名）。

在員工眼中，閆俊傑是一位很有親和力的管理者，他說話聲音很輕，總是面帶笑容。在展位跟媒體交流時，他一直保持着傾聽的姿態，說話不疾不徐。

作爲一位低調的技術型創業者，閆俊傑曾擔任過商湯副總裁、研究院副院長和智慧城市事業羣CTO。2021年12月，在商湯上市前夕，閆俊傑離開商湯，創立了MiniMax。

MiniMax早期投資人、明勢資本創始合夥人黃明明認爲，從創業時間點的選擇來看，閆俊傑是真的對AGI有信仰。

目前，MiniMax已完成A+輪融資，最新一輪融資由阿里領投，金額爲6億美元，公司估值突破25億美元，其投資方還有騰訊、紅杉中國、高瓴、IDG、米哈遊等。

從創業第一天開始，閆俊傑就堅持模型、產品兩條腿走路。在他看來，一切都以技術爲先，只有大模型底座搭建好了，才能“長”出更有價值的應用。

因此，在2023年6月，大部分國內公司還在迭代稠密模型（dense model）、MoE（混合專家系統）模型尚未成爲行業共識時，MiniMax就花了80%以上的精力下注MoE。

雖然過程歷經坎坷，但閆俊傑最後還是“賭”對了。

2024年1月，MiniMax發佈了國內首個基於MoE架構的千億參數量級模型——abab 6；4月底，又迅速迭代並推出abab 6.5系列模型。在各類核心能力測試中，abab 6.5也接近了GPT-4、Claude-3、Gemini-1.5等世界領先的大語言模型。

探索MoE的好處不限於此。在閆俊傑看來，這次磨礪讓他們不會被侷限在只做公開的東西，也敢去做上限更高、要靠自己探索（的東西）。

不過，閆俊傑也認爲，只有技術好是沒用的，一年之後，一旦失去“AI濾鏡”，大家會從商業化的角度來評價公司。“我覺得短期內最重要的是AI技術的進步。一年之後，商業化一定是非常重要的。”

在2024世界人工智能大會上，閆俊傑接受了《中國企業家》等媒體採訪。

以下爲採訪整理，有刪減：

問：你對WAIC的第一印象是什麼？

閆俊傑：大會的主題是跟安全治理相關，（提出這些問題）還是挺及時的，如AI安全、治理、版權等問題。假設我用了你們的新聞來訓練，這算不算侵權？我覺得這些都是挺迫切的（問題）。

我們過去一年確實開始遇到這樣的問題了。面對這種問題，也沒法靠一個企業來解決。比如用一篇文章來訓練到底有沒有侵權？如果侵權了，是侵了平臺的權利，還是文章作者的權利？

問：現在已經開始思考這些問題了嗎？

閆俊傑：不是思考，其實是遇到了。比如在海外，有好幾家公司起訴OpenAI了。在中國，我們也開始遇到類似的挑戰了。

比如訓練數據。你的模型有沒有用到公開數據？如果迅速出來了，你的模型獲益了，要不要給提供數據的人付錢呢？

此外還有監管的問題。比如，模型輸出的內容有沒有突破一些紅線？該怎麼來算？

再比如用到一個語料要付錢，但如果用這個語料訓練模型說錯了話，提供語料的人是不是要賠錢？有很多這樣的問題。

坦白說，這種問題不是僅靠一家企業能解決的。首先，肯定得需要政府來組織，並且它有時候涉及的不止一個國家，海外可能也會有用戶，也會有相應的數據。其次，即使只在中國，我覺得目前技術往前走了一步，但各種各樣的法律法規還需要跟上。

問：有從業者覺得國內有點太捲了，國外可能沒那麼卷，你看到的情況是這樣的嗎？

閆俊傑：我覺得海外也很捲了，競爭都很激烈。我覺得核心是中國跟美國的基本面不太一樣，比如美國最好的模型顯然比國內最好的模型要強，這是事實；海外公司本來的品牌也比中國公司的品牌要好，至少對海外來說是的。

但是它也有缺點，就是沒有工程師紅利。比如說同樣價值30億美元的公司，在中國公司的工程師肯定比在硅谷多很多，雖然最頂尖的可能有差距，但是平均水平其實是更強的。

如果是平均水平乘以工程師的數量，那麼相同水平或相同估值的中國公司，工程師一定更多。

問：主要是人才嗎？

閆俊傑：對。我自己覺得中國確實還是有工程師紅利的，這是一個客觀事實，可能都不是30%或者50%的差距，而是3~5倍的差距。

第二，移動互聯網時代的中國公司有很多優秀的產品、商業，這東西其實也很強。所以我覺得在海外，我們雖然沒有品牌優勢，一開始也沒有技術優勢，但是可以有工程師紅利，有其他很多積累，其實就是“田忌賽馬”。

問：你如何看待行業裡頭部效應越來越明顯的趨勢？

閆俊傑：其實中國還沒有美國明顯，你看美國的那幾家創業公司，Adept、Inflection都沒有了，Character AI可能馬上也沒有了。

問：你對Character AI這件事情怎麼看？他們跟你們的產品有點像。

閆俊傑：今年你看他們很多功能在參考我們的功能，我覺得這就是工程師紅利，商業化一定是個很重要的事。

問：後續它們會不斷被大廠收購嗎？因爲它們自己難以維持。

閆俊傑：我覺得它們（美國創業公司）被大廠收購了也無所謂，也正常，他們並不覺得失敗。

問：MiniMax也是創業公司，會不會也有這樣的擔憂？

閆俊傑：我覺得核心還是獨立發展。因爲一家公司不管是自己獨立做還是怎麼樣，核心還是看你給用戶創造多大價值，這纔是最本質的。不管怎麼樣，本質上都是看你的技術有多好。技術能做得好，能夠把用戶服務得好，這纔是最本質的。

問：相比國外，在國內有哪些挑戰是需要你們解決的？

閆俊傑：坦白說，我覺得國內大部分公司還沒有形成差異化，模型水平、產品都差不多，所以就會變成拼價格。但我覺得這不是壞事，這其實是逼着大家能夠更好地做技術創新。

問：MiniMax主要的差異化是什麼？

閆俊傑：我覺得這個不是說就要跟別人有什麼不一樣。根源上還是想要有什麼東西或有什麼問題，然後再往這個比較大的問題上努力，這個過程中自然就會有不一樣。

問：你們大的問題是什麼？

閆俊傑：我覺得我們還是很明顯的，就是滲透更多的用戶。在這一過程中，就需要我們的技術變得很強。

問：MiniMax主要的模式是to C？C和B的體量完全不一樣。

閆俊傑：我們現在的C的體量也比別人要大挺多的。

問：部分友商可能明確to B會佔80%，to C會佔20%，你們有這種比例的定位嗎？

閆俊傑：我們沒有這個定位。我們只有一個點，就是用戶滲透率是多少。再簡單一點就是我們的模型被使用次數。

問：效率類和娛樂類兩個產品你都做，這兩個產品你覺得哪個能更快地跑出來？

閆俊傑：現在技術其實也在不停進步，比如一年之後的技術大概率不是現在的技術，產品的體驗又大部分來自模型的能力。所以基於假設的話，我覺得大概率明年最大的產品可能都不是現在的。

問：但是你們星野現在的確跑得挺快了。

閆俊傑：我覺得在今年最大DAU的產品，到年底的時候在中國可能是1000萬DAU，今年我們的目標就是什麼產品能到1000萬DAU。但是明年可會有1億DAU的產品，它可能不是現有的產品，可能是另外一個形態。

問：你現有的產品明年不會變成1億DAU嗎？

閆俊傑：我覺得我們現在的產品應該是能看到千萬DAU，但還看不到億級（DAU）。

問：你覺得現在還看不到killer APP（殺手級應用）嗎？

閆俊傑：舉個例子，現在抖音大概6億DAU，今日頭條是1億DAU，今日頭條算不算killer APP？

但在今日頭條之前，當時最大的是內涵段子，可能有2000萬DAU，那算不算呢？

如果變成在這個時代裡面最大的APP，或者在AI時代最大的APP，我覺得我還是挺有機會的。但是現在這個APP肯定還沒那麼大，我覺得可能要三年之後纔會大衆化。但是沒關係，當你能做到第一個，你的能力變強了、資源變多了、技術能力變好了，大概就可以做出來。

這個東西就一步步來，我不認爲我現在做的可能就是三年之後的APP。

問：做完MoE之後，下一步你覺得應該是哪個方向？

閆俊傑：我們還是做了很多技術創新的，不光是MoE。比如一些transformer的改進，就是怎麼樣能讓它支持無限的上下文；我們的合成數據也做了很多改進。我覺得MoE給我們的收穫，不光是MoE本身，對我們來說最大的價值是說當有個方向它能提升幾倍，但是它沒有開源，也沒有公開的東西，我要把一個幾倍的東西靠自主能力做出來，這個過程中的收穫是比較大的。

當我們把這個事做完之後，現在有一些更新的技術，比如怎麼樣做支持無限長圖上下文的transformer，怎麼樣來做合成數據，怎麼樣用更低精度的方式來訓練模型，這種東西我們都敢做了。

相當於我們就不會被侷限在只做公開的東西，我們敢去做上限更高、要靠自己探索（的東西）。

問：MiniMax還會做新的產品嗎？

閆俊傑：之前不敢做，但是做MoE之後我們就敢做。我覺得經歷MoE之後，我們基本上就比較敢來做很大的（創新）。

視頻可能下個月會出來，在星野和海螺AI裡面也可能會有應用場景。

問：您這邊有跟Sora做過對比嗎？

閆俊傑：有。

問：Sora一直沒有公開，你們是怎麼去做對比的？

閆俊傑：我們做模型不是算法來評測，我們公司裡面有一些很專業的視頻創作者和音樂創作者，比如做音樂模型的運營是一個非常專業的音樂創作者，評估視頻模型的是一個非常專業的視頻創作者。舉個例子，比如說生成40首歌讓他盲聽，看他覺得哪個好哪個不好。當他也區分不出來真實音樂和AI生成音樂的時候，它的能力就夠強了。

問：MiniMax有文生文、文生語音，馬上有文生音樂，這三個方向哪個能最快衝到全國第一？

閆俊傑：現在我們的文生語音就是行業最好的，但這個東西我覺得沒那麼關鍵，文本模型纔是最關鍵的，相當於文本模型能提升10個點，其他模塊自然也能提升。語言模型還是最本質的，其他東西其實都是自然的衍生。

問：下個月文生音樂/視頻一起推，是這個意思嗎？

閆俊傑：更主要的還是我們文本模型變得更強，我們只是順帶做出來音樂、視頻這些東西。

問：OpenAI好像有專門的一個團隊在做視頻。

閆俊傑：這個東西在OpenAI也是一樣的。OpenAI做GPT的團隊可能是幾百個人，可能有幾萬張卡；但做視頻的就只有十幾個人，可能就1000張卡。它其實就是很小的，只是放在中國，大家覺得這個東西很多，其實不是的。

問：在短期內，你最明確的一個或兩個目標是什麼？

閆俊傑：首先是錯誤率，我們的錯誤率還有繼續降低的空間。包括GPT-3，爲什麼用戶沒那麼多？原因就是錯誤率太高了。

問：現在GPT-5放出來的標準是什麼？

閆俊傑：我覺得一個標準就是錯誤率能變得比較低，比如錯誤率變成3%。

問：你在商業化方面的第一個目標是什麼？

閆俊傑：用戶規模。

問：MiniMax在技術和商業化這二者之間怎麼平衡？

閆俊傑：技術是不是在線，這決定你是不是一家合格的AI公司。如果技術不夠好，可能它就應該被淘汰掉。

但是光技術好是沒用的。現在（大家）還有AI濾鏡，但是一年之後，那可能不完全是看技術了，可能會從商業化角度來看這家公司。所以我自己覺得短期內最重要的是AI技術的進步，一年之後，商業化一定是非常重要的，事實上MiniMax這方面的進展也是非常快的。

新聞熱線&投稿郵箱：tougao@iceo.com.cn

對話MiniMax創始人：如何打造AI時代最大的APP

相關資訊