阿里雲通義開源視覺理解模型Qwen2.5-VL
北京商報訊(記者 魏蔚)1月28日,阿里雲宣佈,通義千問開源全新的視覺模型Qwen2.5-VL,推出3B、7B和72B三個尺寸版本。其中,旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍,全面超越GPT-4o與Claude3.5。新的Qwen2.5-VL能夠更準確地解析圖像內容,突破性地支持超1小時的視頻理解,無需微調就可變身爲一個能操控手機和電腦的AI視覺智能體(Visual Agents),實現給指定朋友送祝福、電腦修圖、手機訂票等多步驟複雜操作。
相關資訊
- ▣ 阿里雲通義開源視覺模型Qwen2.5-VL
- ▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
- ▣ 通義千問開源視覺語言模型Qwen2-VL
- 阿里雲通義開源首個多模態推理模型QVQ,視覺推理比肩OpenAI o1
- ▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
- ▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
- ▣ 阿里通義千問代碼模型Qwen2.5-Coder全系列正式開源
- ▣ 阿里雲宣佈大模型降價 通義千問視覺理解模型全線降價超80%
- ▣ 阿里雲通義開源首個多模態推理模型QVQ
- ▣ 第三輪大降價 阿里雲通義千問視覺理解模型降價超80%
- ▣ 阿里通義千問推出開源Qwen2.5-1M模型,長上下文處理能力顯著提升
- ▣ 阿里雲宣佈本年度第三輪大模型降價 通義千問視覺理解模型全線降價超80%
- ▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
- ▣ 阿里雲通義開源多模態推理模型QVQ在多領域表現突出
- ▣ 通義千問開源Qwen2.5開源模型,累計下載量突破4000萬
- ▣ 阿里雲發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里發佈開源多模態模型Qwen2-VL,多項性能超越GPT-4o
- ▣ 阿里通義千問開源首個MoE模型
- ▣ 阿里雲通義開源首個多模態推理模型,OpenAI入局人形機器人 | 藍媒GPT
- ▣ 阿里雲正式發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 通義千問開源Qwen2.5
- ▣ 美股異動|阿里巴巴漲近1% 通義千問視覺理解模型全線降價超80%
- ▣ 阿里雲通義千問開源
- ▣ 阿里雲發佈開源模型Qwen2
- ▣ AI早知道|阿里通義將發佈視頻大模型;元象發佈MoE開源大模型
- ▣ 阿里雲通義開源長文本模型及推理框架 百萬Tokens處理速度提升近7倍
- ▣ 全球開源大模型新王!阿里Qwen2.5來了,性能跨量級超Llama3.1
- ▣ 數智早參|蘋果推出開源大模型OpenELM;阿里雲宣佈EMO模型上線通義APP
- 阿里開源Qwen2.5-Coder全系列模型 助力編程新手開發各類應用