☰

阿里雲通義開源長文本模型及推理框架百萬Tokens處理速度提升近7倍

1月27日凌晨，阿里雲通義開源支持100萬Tokens上下文的Qwen2.5-1M模型，推出7B及14B兩個尺寸，均在處理長文本任務中穩定超越GPT-4o-mini；同時開源推理框架，在處理百萬級別長文本輸入時可實現近7倍的提速。

百萬Tokens長文本，可換算成10本長篇小說、150小時演講稿或3萬行代碼。兩個月前，Qwen2.5-Turbo升級了百萬Tokens的上下文輸入能力。如今，開源社區可基於全新的Qwen2.5-1M系列模型，進行長篇小說或多篇學術論文的解析，或是探索倉庫級代碼的分析和升級。

相關資訊

▣ 阿里通義千問推出開源Qwen2.5-1M模型，長上下文處理能力顯著提升
▣ 阿里雲通義開源首個多模態推理模型QVQ
▣ 百度：文心大模型日均處理Tokens文本已達2490億
▣ 阿里雲通義開源視覺理解模型Qwen2.5-VL
阿里雲通義開源首個多模態推理模型QVQ，視覺推理比肩OpenAI o1
▣ Qwen2.5-Turbo上線阿里雲百鍊平臺，模型上下文長度擴展至百萬tokens
▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
▣ 阿里雲通義開源多模態推理模型QVQ在多領域表現突出
▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
▣ 阿里雲通義開源首個多模態推理模型，OpenAI入局人形機器人 | 藍媒GPT
▣ 阿里雲通義開源視覺模型Qwen2.5-VL
▣ 阿里通義千問升級：免費開放1000萬字長文檔處理功能
▣ 阿里雲通義開源過程獎勵PRM模型，7B尺寸比GPT-4o更能發現推理錯誤
▣ 阿里通義千問免費開放1000萬字長文檔處理功能
繼百度之後阿里雲AI大模型「通義千問」向大衆開放
▣ AI早知道｜智源發佈多模態模型Emu3；阿里巴巴達摩院開源文檔處理模型
▣ 數智早參｜蘋果推出開源大模型OpenELM；阿里雲宣佈EMO模型上線通義APP
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里雲宣佈本年度第三輪大模型降價通義千問視覺理解模型全線降價超80%
▣ 百度李彥宏：開源模型是智商稅，閉源模型更強大、推理成本更低
▣ 阿里雲CTO周靖人：通義千問開源模型下載量突破2000萬次
▣ 阿里通義千問開源首個MoE模型
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里雲通義萬相上新，推出萬相2.1視頻生成模型
▣ 微軟開源爆火1bit大模型推理框架！千億參數模型量化後單CPU可跑
▣ 中電萬維申請基於語義檢索模型和文本生成語言模型的客服處理專利，提升用戶客服問答好感和響應速度
▣ 新鮮早科技丨小米汽車官宣與“蔚小理”合作；京東宣佈爲2萬多名客服漲薪；阿里雲通義開源首個多模態推理模型QVQ
▣ 阿里雲通義千問開源
▣ 阿里雲宣佈大模型降價通義千問視覺理解模型全線降價超80%

DMCA | PRIVACY | s@bg3.co

阿里雲通義開源長文本模型及推理框架 百萬Tokens處理速度提升近7倍

相關資訊

阿里雲通義開源長文本模型及推理框架百萬Tokens處理速度提升近7倍