☰

GPT-4o再秀神操作，“復現”OpenAI總裁講課，網友當真了

OpenAI總裁兼聯合創始人Greg再次大秀GPT-4o操作，結果網友直接緬懷DALL-E。

直接看效果。

文本拼寫達到驚人的一致！手部細節、光照全都有，甚至後背上的Logo也完全正確。

有網友表示：恍惚間還以爲真的是本人在講課。

也有人感嘆圖像生成技術發展的飛躍：Holy Cow！

GPT-4o讓網友直接緬懷DALL-E

GPT-4o發佈以來，簡直就被玩兒瘋了，尤其是圖像生成這塊。

比如有網友發現，GPT-4o在組合任意圖像上面就像是打通了任督二脈。

給它兩張完全不相干的圖。

結果搖身一變，“悲傷蛙版的麥片”，這不廣告設計公司直接可以用了。

不過像生成統計圖，就有點子翻車…比如這個，將正態分佈的前 10%染成紅色，就沒有完成。

還有更翻車的效果……

於是乎，就有人認爲這應該是DALL-E，GPT-4o現在還沒辦法生成圖像。

如今Greg親自下場展現GPT-4o的圖像生成效果，應該也算是一種迴應。

當然在評論區有網友質疑：這確定是同一個版本嗎？能不能給完整的提示？

但不管怎麼說，OpenAI這次免費大開放，讓更多的人探索到GPT-4o的能力。

比如在上下文能力上面，有網友發現它就比GPT-4-Turbo好太多。

而在從情景對話這個場景中，GPT-4o也比ChatGPT更樂意談論自己的感受和意識。

Omni團隊大揭秘

Omni團隊負責人Prafulla Dhariwal也在社交網絡上表達了自己團隊成員的感謝，並坦言這項工作是從一年前開始的。

Prafulla Dhariwal本科畢業於MIT，隨後就前往OpenAI已經待了7個年頭。

他首先表示GPT-4o是他們團隊推出的第一個模型，也是OpenAI首個原生多模態大模型。

隨後就來了一個團隊大點名。

James Betker，負責圖像和音頻生成、數據準備、集成以及後續訓練。

Jamie Kiros：負責GPT-4o的視覺感知。

Rowan Zellers：讓模型/產品能夠像人類一樣自然地觀看視頻。

Alexis Conneau：首個在OpenAI提出Her願景的人。他在個人簡介中提到是音頻AGI主管。

Gabriel Goh、Ishaan Gulrajani：負責Scaling Law相關的工作。

Alex Nichol、Heewoo Jun、Li JING，保障GPT-4o的圖像生成、3D生成的能力。

隨後奧特曼也隨手一個轉發評價，並表示這項工作引發了一場革命，它能改變我們使用計算機的方式。

所以，有使用過GPT-4o的朋友嗎？歡迎在評論區分享你們的體驗。

參考鏈接：[1]https://twitter.com/gdb/status/1790869434174746805[2]https://twitter.com/sama/status/1790816449180876804

相關資訊