阿里雲發佈開源模型Qwen2
北京商報訊(記者 魏蔚)6月7日,阿里雲發佈開源模型Qwen2-72B。通義千問團隊披露,Qwen2系列包含5個尺寸的預訓練和指令微調模型,Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,其中Qwen2-57B-A14B爲混合專家模型(MoE)。Qwen2所有尺寸模型都使用了GQA(分組查詢注意力)機制。在中英文之外,模型訓練數據中增加了27種語言相關的高質量數據。Qwen2還增大了上下文長度支持,Qwen2-72B-Instruct能夠完美處理128k上下文長度內的信息抽取任務。
相關資訊
- ▣ AI早知道|阿里雲發佈全球最強開源模型Qwen2;快手發佈可靈大模型
- ▣ 阿里通義千問Qwen2大模型發佈並同步開源
- ▣ 阿里發佈開源多模態模型Qwen2-VL,多項性能超越GPT-4o
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- ▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
- ▣ 阿里國際發佈最新開源多模態模型Ovis
- ▣ 阿里雲發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里雲通義開源視覺模型Qwen2.5-VL
- ▣ AI早知道|阿里通義將發佈視頻大模型;元象發佈MoE開源大模型
- ▣ 通義千問開源視覺語言模型Qwen2-VL
- ▣ 阿里雲正式發佈通義千問2.5,開源通義千問1100億參數模型
- ▣ 阿里雲通義開源首個多模態推理模型QVQ
- ▣ 阿里雲通義開源視覺理解模型Qwen2.5-VL
- ▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
- ▣ AI早知道|智源發佈多模態模型Emu3;阿里巴巴達摩院開源文檔處理模型
- ▣ 數智早參|蘋果推出開源大模型OpenELM;阿里雲宣佈EMO模型上線通義APP
- ▣ AI早知道|騰訊發佈最大規模開源MoE模型;阿里巴巴達摩院發佈八觀氣象大模型
- ▣ 阿里雲開源從模型到工具的AI全棧技術
- ▣ 幻方量化旗下DeepSeek發佈開源模型,超越阿里Qwen、Meta Llama
- ▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
- ▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
- ▣ AI早知道|阿里雲發佈音頻模型;OpenAI發佈新技術PVG
- ▣ 吳泳銘:阿里發佈超100個開源模型,超30萬家企業接入通義大模型
- ▣ 國產大模型又有重磅!阿里發佈通義千問旗艦版模型,採用開源策略
- ▣ 通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o
- 阿里巴巴發佈大模型報告,堅持雲和AI協同發展
- ▣ 阿里雲CTO談大模型開閉源之爭:模型應用不能只對接一個形式
- ▣ 阿里雲通義開源多模態推理模型QVQ在多領域表現突出
- ▣ 阿里通義千問開源首個MoE模型