☰

全球科技早參丨Sora訓練數據被質疑

每經記者：文巧每經編輯：蘭素英

｜2024年3月18日星期一｜

NO.1 蘋果推出MM1多模態大模型

近日，在一篇名爲MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training的論文中，蘋果正式公佈MM1多模態大模型研究成果。該模型提供30億、70億、300億三種參數規模，擁有圖像識別和自然語言推理能力。它由密集模型和混合專家（MoE）變體組成，不僅在預訓練指標中實現最優效果，在一系列已有多模態基準上監督微調後也能保持有競爭力的性能。

點評：蘋果的這一突破性技術展示了其在多模態AI領域的成果，有助於推動行業創新。

NO.2 英偉達GTC2024即將揭幕

3月18日至21日，英偉達GTC大會將在聖何塞會議中心和線上同時舉行。這是英偉達每年最重要的技術發佈平臺之一，被業界公認爲“AI風向標”。據悉，英偉達有望在大會上發佈Blackwell架構及B100芯片。作爲Hopper架構H200芯片的下一代產品，英偉達早已在全球超算大會上展示過B100芯片的強勁性能，在訓練GPT-3 1750億參數模型的比較中，B100芯片以噴射式的性能提升幅度碾壓H100和H200芯片。此外，英偉達或將發佈一系列生成式AI應用。

點評：英偉達即將發佈的新技術可能會進一步鞏固其在高性能計算和AI領域的市場主導地位。

NO.3 CAR-T療法對實體瘤顯示出效果

近日，兩篇分別刊登於《自然-醫學》和《新英格蘭醫學雜誌》的研究結果表明，抗原嵌合受體T細胞（CAR-T）療法在臨牀試驗中表現出了針對實體惡性腦腫瘤——膠質母細胞瘤的治療效果。據悉，膠質母細胞瘤是成人中最常見的腦部惡性腫瘤，即使是最好的治療也收效甚微。過去利用免疫系統對抗該腦腫瘤的嘗試均失敗了，導致患者只能依靠傳統藥物、放療和化療，但平均生存率改善卻不盡如人意。

點評：這一臨牀進展可能會開啓實體瘤治療的新篇章，對整個醫療行業產生深遠影響。

NO.4 奔馳汽車工廠試點Apollo機器人

近日，奔馳宣佈和仿人機器人開發商Apptronik達成協議，雙方將合作探索高科技機器人Apollo，主要從事搬運、裝配零部件等繁重的低技能勞動。根據雙方協議，奔馳將啓動試點項目，在汽車製造過程中測試Apollo仿人機器人執行各種任務的能力。奔馳稱，相比較全面升級汽車生產流水線，Apollo機器人的運用可以降低員工工傷情況，自動化複雜、重複和枯燥的任務，進一步釋放生產力。

點評：奔馳的這一舉措可能會提高生產效率，同時減少工人的勞動強度。

NO.5 ChatGPT參數規模或被破解

近日，南加州大學研究人員使用一種方法，僅花費不到1000美元就將最新版GPT-3.5-turbo模型的參數規模破解出來。據該研究報告，研究人員破解出了未公佈的GPT-3.5-turbo嵌入向量維度爲4096或4608。幾乎所有已知的開源大模型如Llama和Mistral，在嵌入向量維度爲4096時，參數規模均爲7B（70億）。南加大研究團隊指出，可以推測GPT-3.5-turbo的參數規模也在7B左右。

點評：此發現可能會促使AI領域對模型透明度和安全性的進一步探討和改進。

NO.6 Sora訓練數據被質疑

近日，OpenAI CTO Murati在接受採訪時對Sora訓練數據支支吾吾，讓Sora陷入版權爭議。當記者問及Sora是用什麼數據訓練以及是否用到YouTube、Facebook和Instagram上的視頻時， Murati對此語焉不詳，稱不太確定，並表示不會詳細透露關於使用數據的細節，但強調該公司使用的是公開可用的以及經過許可的數據。此前，OpenAI已頻繁陷入版權訴訟。去年年底，《紐約時報》已向OpenAI及微軟提起侵犯版權訴訟，指控二者未經許可使用其數百萬篇文章以訓練模型。

點評：這可能影響OpenAI在AI領域的聲譽，並加劇版權訴訟風險。

免責聲明：本文內容與數據僅供參考，不構成投資建議，使用前核實。據此操作，風險自擔。

全球科技早參丨Sora訓練數據被質疑

相關資訊