全球科技早參丨Sora訓練數據被質疑
每經記者:文巧 每經編輯:蘭素英
|2024年3月18日 星期一|
NO.1 蘋果推出MM1多模態大模型
近日,在一篇名爲MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training的論文中,蘋果正式公佈MM1多模態大模型研究成果。該模型提供30億、70億、300億三種參數規模,擁有圖像識別和自然語言推理能力。它由密集模型和混合專家(MoE)變體組成,不僅在預訓練指標中實現最優效果,在一系列已有多模態基準上監督微調後也能保持有競爭力的性能。
點評:蘋果的這一突破性技術展示了其在多模態AI領域的成果,有助於推動行業創新。
NO.2 英偉達GTC2024即將揭幕
3月18日至21日,英偉達GTC大會將在聖何塞會議中心和線上同時舉行。這是英偉達每年最重要的技術發佈平臺之一,被業界公認爲“AI風向標”。據悉,英偉達有望在大會上發佈Blackwell架構及B100芯片。作爲Hopper架構H200芯片的下一代產品,英偉達早已在全球超算大會上展示過B100芯片的強勁性能,在訓練GPT-3 1750億參數模型的比較中,B100芯片以噴射式的性能提升幅度碾壓H100和H200芯片。此外,英偉達或將發佈一系列生成式AI應用。
點評:英偉達即將發佈的新技術可能會進一步鞏固其在高性能計算和AI領域的市場主導地位。
NO.3 CAR-T療法對實體瘤顯示出效果
近日,兩篇分別刊登於《自然-醫學》和《新英格蘭醫學雜誌》的研究結果表明,抗原嵌合受體T細胞(CAR-T)療法在臨牀試驗中表現出了針對實體惡性腦腫瘤——膠質母細胞瘤的治療效果。據悉,膠質母細胞瘤是成人中最常見的腦部惡性腫瘤,即使是最好的治療也收效甚微。過去利用免疫系統對抗該腦腫瘤的嘗試均失敗了,導致患者只能依靠傳統藥物、放療和化療,但平均生存率改善卻不盡如人意。
點評:這一臨牀進展可能會開啓實體瘤治療的新篇章,對整個醫療行業產生深遠影響。
NO.4 奔馳汽車工廠試點Apollo機器人
近日,奔馳宣佈和仿人機器人開發商Apptronik達成協議,雙方將合作探索高科技機器人Apollo,主要從事搬運、裝配零部件等繁重的低技能勞動。根據雙方協議,奔馳將啓動試點項目,在汽車製造過程中測試Apollo仿人機器人執行各種任務的能力。奔馳稱,相比較全面升級汽車生產流水線,Apollo機器人的運用可以降低員工工傷情況,自動化複雜、重複和枯燥的任務,進一步釋放生產力。
點評:奔馳的這一舉措可能會提高生產效率,同時減少工人的勞動強度。
NO.5 ChatGPT參數規模或被破解
近日,南加州大學研究人員使用一種方法,僅花費不到1000美元就將最新版GPT-3.5-turbo模型的參數規模破解出來。據該研究報告,研究人員破解出了未公佈的GPT-3.5-turbo嵌入向量維度爲4096或4608。幾乎所有已知的開源大模型如Llama和Mistral,在嵌入向量維度爲4096時,參數規模均爲7B(70億)。南加大研究團隊指出,可以推測GPT-3.5-turbo的參數規模也在7B左右。
點評:此發現可能會促使AI領域對模型透明度和安全性的進一步探討和改進。
NO.6 Sora訓練數據被質疑
近日,OpenAI CTO Murati在接受採訪時對Sora訓練數據支支吾吾,讓Sora陷入版權爭議。當記者問及Sora是用什麼數據訓練以及是否用到YouTube、Facebook和Instagram上的視頻時, Murati對此語焉不詳,稱不太確定,並表示不會詳細透露關於使用數據的細節,但強調該公司使用的是公開可用的以及經過許可的數據。此前,OpenAI已頻繁陷入版權訴訟。去年年底,《紐約時報》已向OpenAI及微軟提起侵犯版權訴訟,指控二者未經許可使用其數百萬篇文章以訓練模型。
點評:這可能影響OpenAI在AI領域的聲譽,並加劇版權訴訟風險。
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前核實。據此操作,風險自擔。