阿里雲通義開源視覺模型Qwen2.5-VL

1月28日,阿里雲通義開源視覺模型Qwen2.5-VL,共推出3B、7B和72B三個尺寸版本。據介紹,Qwen2.5-VL不僅擅長識別常見物體,如花、鳥、魚和昆蟲,還能夠分析圖像中的文本、圖表、圖標、圖形和佈局。旗艦版Qwen2.5-VL-72B在13項權威評測中奪得視覺理解冠軍,全面超越GPT-4o與Claude3.5。