長江證券:OpenAI揭秘“草莓”AI Meta(META.US)多模態新技術重磅落地

智通財經APP獲悉,長江證券發佈研報稱,OpenAI計劃最早在今年秋天推出代號爲“草莓”的新人工智能,該人工智能旨在改進即將推出的“Orion(獵戶座)”,以幫助OpenAI減少模型生成的錯誤數量,提高答案的準確性。Meta(META.US)最近發佈了融合Transformer和Diffusion的訓練能夠生成文本和圖像模型的統一方法Transfusion,該方法有望用於訓練真正的多模態模型。AI技術關卡持續突破,用戶體驗逐步提升。OpenAI和Meta等頭部企業對AI技術的突破以及應用拓展將會帶領全行業技術創新和用戶體驗的提升,AI行業擁有廣闊的發展前景。

OpenAI計劃推出代號爲“草莓”的新人工智能。1)AI大模型技術更新推動演算能力提高。“草莓”具備解決以前從未見過的數學問題的能力,這是當今的聊天機器人所無法準確做到的。給予長時間演算時,“草莓”還能夠回答用戶更主觀的問題,適用於對時間不太敏感的用例。2)訓練數據生成能力增強。“草莓”旨在改進即將推出的“Orion(獵戶座)”,可以幫助OpenAI克服獲取足夠高質量數據的限制,以便利用現實世界的數據訓練新模型,並幫助OpenAI減少模型生成的錯誤數量,提高答案的準確性。“草莓”的推理能力有望被整合進ChatGPT,同時,該技術還將對未來能夠完成多步驟任務的智能體產品產生深遠影響。

Meta多模態模型訓練方法取得新進展,全新視覺模型性能出色。1)高性能圖像與文本生成能力。Transfusion能夠生成與相似規模的擴散模型相媲美的高質量圖像,而且,它同時也保持了強大的文本生成能力。在GenEval基準上,Transfusion模型優於DALL-E2和SDXL等其他流行模型,且在文本基準上達到了Llama1級別的性能水平。該方法使用前景十分廣闊,有望用於訓練真正的多模態模型。2)Sapiens優化視覺任務。Meta推出的全新視覺模型Sapiens對二維姿勢預估、身體部位分割、深度估計和表面法線預測四大關鍵視覺認爲進行了優化,在多種場景均有用武之地。3)泛化能力卓越,用戶使用便利。Sapiens模型易於針對個別任務進行調整,面對真實世界數據時表現出卓越的泛化能力。即便是在標註數據稀缺或完全使用合成數據的情況下,Sapiens依然擁有出色的性能。此外,該模型易用性強,爲具有不同訓練設置偏好的用戶提供了多樣化的安裝路徑選擇。

AI技術關卡持續突破,用戶體驗逐步提升。OpenAI和Meta等頭部企業對AI技術的突破以及應用拓展將會帶領全行業技術創新和用戶體驗的提升,AI行業擁有廣闊的發展前景。AI技術及應用領域持續突破,建議持續關注AI在視覺成像和內容創作等各領域的商業化落地。

風險提示

1、AI技術發展不及預期風險;

2、內容監管風險。

本文源自:智通財經網