AI圈沸騰!巨頭神秘新品來了,蘋果“贏麻了”?

千呼萬喚始出來,OpenAI終於“上新”了。

北京時間5月14日凌晨1點,OpenAI直播發布了其產品的更新。在半小時的線上發佈會上,OpenAI的首席技術官米拉·穆拉蒂(Mira Murati)宣佈GPT-4的一系列升級。發佈會的主要亮點如下:

推出了全新的模型GPT-4o,其中的“o”表示“omni”(全面、全能)。同時,GPT-4o 向所有用戶免費開放。

新模型具備強大的多模態交互能力。在發佈會演示中,GPT-4o具備文本、圖片、視頻和語音方面的能力,可以順暢絲滑地與人類進行語音交流,並讀懂屏幕信息。

發佈了ChatGPT 桌面應用程序,目前可適用於 macOS,Windows 版本將在今年晚些時候推出。

AI助手初具雛形

在發佈會前,記者注意到OpenAI的官網上已經將GPT-4的描述從“最先進的模型”更改爲“先進的模型”,爲GPT-4o的發佈提前做了準備。

作爲OpenAI目前最先進的模型,GPT-4o的特別之處在於可以接受任何文本、音頻和圖像的組合作爲輸入,並生成上述這幾種模態的內容。這意味着,GPT-4o具備了AI助手的基本雛形,在通往通用人工智能的道路上又前進了一步。

在發佈會現場,穆拉蒂與OpenAI的前沿研究主管Mark Chen和後期訓練團隊負責人Barret Zoph對實時語音對話功能進行了演示。從演示效果上來看,GPT-4o與人類的交互變得更及時和自然。據介紹,GPT-4o可以在232毫秒內迴應音頻輸入,接近於人類對話的反應時間。在此之前,使用語音模式與ChatGPT進行交流,平均時延爲2.8秒(GPT-3.5)和5.4秒(GPT-4)。GPT-4o不僅可以實時響應對話,還沒有尷尬漫長的時延,而且能夠生成各種不同情緒風格的語音。

例如,當被問及“你最近怎麼樣?”時,GPT-4o 除了表示“我很好”,還會反問“你怎麼樣?”當“要求講一個“機器人和愛情的睡前故事”時,GPT-4o開始說話以後被打斷,要求以更有情緒性、更戲劇化的方式講述故事,隨後GPT-4o在講故事時的語音語調更跌宕起伏,更爲聲情並茂,甚至可以以唱歌的形式結束對話。

從此以後,家長們哄娃睡覺變得so easy。

不僅如此,GPT-4o 還擁有視覺+語音交互功能,能夠看圖解方程式。Zoph打開手機視頻通話,對GPT-4o說:“我要在一張紙上寫下一個線性方程。不要告訴我答案,只是給出解答它的過程。”隨後,Zoph寫下了3x+1=4的方程式,詢問如何解這道題。GPT-4o通過循循善誘的提示,在Zoph提出求助與問題時不斷給出下一個步驟的建議,從而得出了x=1的正確結果。

從此,家長輔導孩子寫作業也變得更輕鬆。

此外,GPT-4o能夠實時讀懂屏幕信息,幫助解答代碼問題和分析圖表;能夠跨語言實時翻譯,在說話者用意大利語和英語對話時,沒有延遲地翻譯成了對應的語言,還能模仿說話者的語氣;能夠識別分析人類的情緒,當說話者展示一張自拍,要求其判斷自己的情緒時,GPT-4o 分析道,“你看起來非常開心,可能還有一些激動,應該心情很不錯。”

雖然OpenAI的首席執行官山姆·奧特曼沒有在發佈會現場出現,但他在個人社交平臺上實時播報着OpenAI的更新。發佈會後,他發佈了一條動態,只寫了“her”這一個詞。據外媒此前報道,奧特曼曾表示自己最喜歡的一個人工智能電影是《她》(Her),最終目標是開發出一種類似電影中的虛擬AI助手,努力使蘋果Siri等現有語音助手變得更加實用和智能。

“截胡”谷歌,示好蘋果

早在一週以前,關於OpenAI發佈新產品的消息就甚囂塵上。有消息稱OpenAI將發佈GPT-5,還有消息稱OpenAI即將發佈一款基於ChatGPT的AI搜索引擎,向谷歌發起衝擊。5月11日,奧特曼在其個人社交平臺上否認了以上的傳言,並表示:“不是GPT-5,也不是搜索引擎,但我們一直在努力開發一些我們認爲人們會喜歡的新東西!對我來說感覺像魔術一樣!”

值得注意的是,谷歌即將在5月14日召開I/O 開發者大會,宣佈安卓、谷歌搜索等方面的更新。OpenAI選擇在I/O 開發者大會前一天召開發佈會,無疑是不希望被谷歌搶了自己的風頭。這樣的事情並非首次,今年2月16日,OpenAI在事先未作預熱的情況下便發佈了Sora文生視頻模型,引發全世界的關注。而彼時谷歌剛剛升級了Gemini Pro大模型,但在Sora的火爆下顯得黯然失色。

如今OpenAI再度宣戰,壓力也直接給到了即將正面迎戰的谷歌。華福證券研報顯示,海外主流AI大模型中,總訪問量上ChatGPT仍居於首位,其餘大模型中Claude、Perplexity、Character.ai 4月訪問量都有一定上漲,但谷歌的Gemini訪問量在4月出現下滑,環比跌幅爲1.4%。可以看到,在競逐大模型的路上,谷歌正面臨着OpenAI愈發強勢的競爭。

與之相對,隱藏在這場新品發佈會中的幕後贏家當屬蘋果。記者注意到,本次發佈會全程用iPhone和MacBook Pro進行演示,同時還發布了Mac桌面版的ChatGPT,似乎是暗示OpenAI將與蘋果合作,在蘋果設備中接入大模型的能力。

事實上,這場合作在OpenAI此前的一些動作及媒體消息中已可見端倪。據彭博社5月10日報道,蘋果正在與OpenAI商議敲定一項協議,計劃在今年在iPhone中引入OpenAI的大模型技術。通過這筆交易,蘋果將能夠提供由ChatGPT提供支持的“聊天機器人”,作爲iOS 18中人工智能功能的一部分。不過報道也指出,蘋果還與谷歌就授權Gemini聊天機器人進行了談判,但尚未達成協議。

最近,奧特曼參加了播客節目“All-in Podcast”,在其中談到了許多人工智能的熱點與方向。他表示,OpenAI將繼續改進語音功能的質量,“相信語音交互或許是通向未來交互方式的重要線索”。當主持人問及他是否和Jony Ive(“iPhone之父”,前蘋果首席設計師)有所合作時,奧特曼還表示,“是的,我們在交流一些想法”。

今年2月,蘋果CEO蒂姆·庫克曾對外透露,公司正在開發生成式AI軟件功能,將在iOS 18中引入由大型語言模型支持的新Siri功能,但並未提及與OpenAI是否有合作事宜。據悉,蘋果將在6月份舉辦WWDC全球開發者大會,展示iOS、iPadOS、macOS、watchOS、tvOS 和 visionOS的前沿創新。

分析人士認爲,若能與OpenAI達成合作,蘋果不僅可以縮短產品研發週期,還可以迅速提升自家產品的智能化水平。在生成式AI時代已經落後太多的蘋果,是否能通過在其硬件中接入全球領先的大模型,打一個漂亮的“翻身仗”,謎底或許也將在6月揭曉。

責編:萬健禕

校對:高源

" Type="normal"@@-->

2024證券時報“尋找創投‘金鷹’、發現企業‘新苗’”計劃隆重啓幕,點亮時代夢想、綻放時代光芒。

點擊海報即可報名,速戳↓↓↓

" Type="normal"@@-->

版權聲明

證券時報各平臺所有原創內容,未經書面授權,任何單位及個人不得轉載。我社保留追究相關行爲主體法律責任的權利。

END

" Type="normal"@@-->