阿里雲通義開源視覺模型Qwen2.5-VL

1月28日，阿里雲通義開源視覺模型Qwen2.5-VL，共推出3B、7B和72B三個尺寸版本。據介紹，Qwen2.5-VL不僅擅長識別常見物體，如花、鳥、魚和昆蟲，還能夠分析圖像中的文本、圖表、圖標、圖形和佈局。旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍，全面超越GPT-4o與Claude3.5。

阿里雲通義開源視覺模型Qwen2.5-VL

相關資訊