OpenAI宣佈GPT-3.5 Turbo降價,還治好了GPT-4 Turbo的"懶病"
1月26日消息,美國時間週四, OpenAI宣佈了一系列重大更新。這些更新不僅關乎它們備受歡迎的大模型,還包括API訪問價格的調整、性能優化以及全新嵌入性模型的發佈。這些動作旨在吸引更多開發者的注意,也有望爲未來的消費者市場設立新的標杆。
OpenAI這次更新中,特別提到了它們的GPT-4Turbo和GPT-3.5 Turbo兩大模型。它們都是大型多模式模型,可以理解和生成自然語言或代碼。在新版本中,它們迎來了諸多增強功能,包括更精準的指令跟隨、支持JSON模式、更多可復現的輸出,以及並行函數調用的優化。
此外,該公司還推出了全新的16k版本GPT-3.5 Turbo,這一版本在處理超長輸入和輸出時,相比標準的4k版本展現出了更爲出色的性能。
對於衆多用戶而言,GPT-3.5 Turbo並不陌生。作爲大多數人通過ChatGPT進行互動的背後支持模型,它幾乎已經成爲了行業內的金標準。面對其他聊天機器人,如果用戶發現其回答質量不及ChatGPT,那麼繼續使用後者無疑成爲了最佳選擇。
在API領域,GPT-3.5 Turbo同樣表現不俗。在執行各類任務時,它不僅能夠提供比GPT-4更低的成本,還能保證更快的執行速度。因此,對於那些付費用戶來說,此次輸入價格下調50%、輸出價格下調25%無疑是一大利好。具體來說,新的輸入價格定格在每千個代幣0.0005美元,而輸出價格則爲每千個代幣0.0015美元。
在處理文本密集型應用(如整篇論文或書籍的分析)時,這些代幣的累積費用往往相當可觀。而且隨着開源大模型開始發力,OpenAI需要確保其客戶不會離開。因此,這一價格調整無疑將爲用戶帶來真正的實惠。當然,這也是模型精簡和基礎設施改進的結果。
在GPT-3.5 Turbo上,OpenAI還悄然推出了代號爲GPT-3.5 Turbo 0125的新模型版本。雖然該公司並未大肆宣揚,但這一版本顯然包含了一系列“各種改進”。不過,相較於最新版本GPT-3.5 Turbo 0613,這一更新似乎並未帶來公司認爲值得特別提及的重大突破。
在GPT-4 Turbo上,OpenAI同樣有所動作。一個新的API使用預覽模型——GPT-4 Turbo 0125應運而生。這個模型成功解決了GPT-4 Turbo過去存在的一個老問題,即模型在面對某些任務時可能出現的“懶惰”情況。此外,GPT-4 Turbo 0125在代碼生成等任務方面的表現也較之前的預覽模型有了顯著提升。
目前,GPT-4 Turbo 0125仍處於預覽模式階段。不過,具有視覺效果的GPT-4 Turbo(即GPT-4 V)有望在“未來幾個月內”與廣大用戶正式見面。
在嵌入模型方面,OpenAI同樣帶來了令人振奮的消息。該公司推出了全新的text-embeddings-3-small和text-embeddings-3-large模型,它們相較於上一代的text-embeddings-ada-002展現出了更爲強大的性能和更爲親民的價格。
這些新模型能夠創建多達3072維度的嵌入空間,從而捕獲更多的語義信息並提高下游任務的準確性。在性能測試中,新模型將多語言檢索(MIRACL)常用基準的平均分數從31.4%提升至54.9%,而在英語任務(MTEB)常用基準上的平均分數也從61.0%提升至64.6%。
更值得一提的是,與text-embeddings-ada-002相比,text-embeddings-3-small的價格降到1/5,這無疑爲開發人員帶來了更爲經濟實惠的選擇。
此外,OpenAI還發布了一個全新版本的免費文本審覈API。這一API能夠檢測文本是否包含敏感或不安全的內容,並且新版本還擴展了支持的語言和領域範圍,同時爲其預測提供了更爲詳盡的解釋。(小小)