☰

DeepSeek除夕再發布「文生圖」大模型表現優於OpenAI

繼開源大語言模型DeepSeek-R1後，來自杭州的初創企業深度求索1月28日除夕再發布開源多模態模型Janus-Pro 7B。路透社

大陸新創企業深度求索公佈低成本大模型後，除夕（1月28日）再發布開源文字生成圖像（文生圖）大模型Janus-Pro 7B，該模型在基準測試中超越美國巨頭OpenAI。

綜合路透社報導和GitHub消息，這款開源多模態模型被設計爲高效且多功能的模型，擅長生成逼真圖像、執行復雜視覺推理等多種視覺任務。

深度求索自稱，Janus-Pro在使用文本提示生成圖像的基準測試中，表現優於OpenAI的DALL-E 3和Stability AI的Stable Diffusion。

深度求索公衆號說，這款大模型是2024年11月13日發佈的JanusFlow大模型的進階版本。新模型通過改進訓練流程、數據質量和模型規模，提升圖像生成的穩定性和細節表現。

深度求索解釋道，Janus-Pro通過增加7200萬張高質量的合成圖像，並與真實數據進行平衡，進一步提高視覺效果的吸引力和圖像輸出的穩定性；新款模型版本擁有高達70億個參數，在文本生成圖像的速度和準確性及任務理解能力方面取得顯著提升。

深度求索1月20日發佈開源大語言模型DeepSeek-R1，憑藉低訓練成本，卻能比擬OpenAI的o1模型的高效能引發全球科技圈關注，更促使投資者拋售全球科技股。此舉衝擊美股，輝達市值蒸發近6000億美元。

美國科技博客網站VentureBeat報導指出，與一些規模最大、資源最密集的模型不同，擁有70億參數的Janus-Pro無需龐大的計算資源即可提供高水平的性能，這可能大大降低企業採用先進視覺AI的門檻，對初創公司或跨國企業來說具有極大吸引力。

此外，在Janus-Pro模型的開源性質下，企業無需受限於供應商綁定或支付高額費用，就能使用前沿AI技術。這對AI巨頭構成直接威脅：他們的專有高價模型能否在免費、高質量的替代品面前生存？市場的拋售表明投資者對此表示懷疑。

VentureBeat認爲，深度求索選擇在美國科技股暴跌之際發佈Janus-Pro，這一時機顯然經過精心設計，意在突顯這家初創企業對矽谷的挑戰，且具備顛覆AI領域既有秩序的能力。

大陸新創企業深度求索公佈低成本大模型後，除夕再發布開源文字生成圖像（文生圖）大模型Janus-Pro 7B。圖／取自IT之家 ※ 提醒您：禁止酒駕飲酒過量有礙健康

DeepSeek除夕再發布「文生圖」大模型 表現優於OpenAI