☰

阿里雲通義開源視覺理解模型Qwen2.5-VL

北京商報訊（記者魏蔚）1月28日，阿里雲宣佈，通義千問開源全新的視覺模型Qwen2.5-VL，推出3B、7B和72B三個尺寸版本。其中，旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍，全面超越GPT-4o與Claude3.5。新的Qwen2.5-VL能夠更準確地解析圖像內容，突破性地支持超1小時的視頻理解，無需微調就可變身爲一個能操控手機和電腦的AI視覺智能體（Visual Agents），實現給指定朋友送祝福、電腦修圖、手機訂票等多步驟複雜操作。

相關資訊

▣ 阿里雲通義開源視覺模型Qwen2.5-VL
▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
▣ 通義千問開源視覺語言模型Qwen2-VL
▣ AI早知道｜阿里開源全新多模態模型 Qwen2.5-VL-32B；DeepSeek-V3模型發佈
阿里雲通義開源首個多模態推理模型QVQ，視覺推理比肩OpenAI o1
▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
▣ 阿里雲宣佈大模型降價通義千問視覺理解模型全線降價超80%
▣ 阿里通義千問代碼模型Qwen2.5-Coder全系列正式開源
▣ 阿里雲通義開源首個多模態推理模型QVQ
▣ 第三輪大降價阿里雲通義千問視覺理解模型降價超80%
▣ 阿里雲開源多模態視頻生成模型通義萬相“Wan2.2-S2V”
▣ 阿里通義千問推出開源Qwen2.5-1M模型，長上下文處理能力顯著提升
▣ 阿里開源視頻模型通義萬相2.2
▣ 阿里雲宣佈本年度第三輪大模型降價通義千問視覺理解模型全線降價超80%
▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
▣ 阿里雲開源視頻基礎模型
▣ 阿里雲通義開源多模態推理模型QVQ在多領域表現突出
▣ 阿里開源電影級視頻模型通義萬相2.2
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 通義千問開源Qwen2.5開源模型，累計下載量突破4000萬
▣ 阿里發佈並開源推理模型通義千問QwQ-32B
▣ 阿里開源電影級視頻生成模型通義萬相2.2
▣ 阿里發佈開源多模態模型Qwen2-VL，多項性能超越GPT-4o
▣ 阿里通義千問開源首個MoE模型
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ 阿里宣佈開源推理模型和視頻生成模型
▣ 美股異動｜阿里巴巴漲近1% 通義千問視覺理解模型全線降價超80%
▣ 阿里雲通義開源首個多模態推理模型，OpenAI入局人形機器人 | 藍媒GPT

DMCA | PRIVACY | s@bg3.co