☰

教程 | CogView3-Plus文生圖模型在線部署和體驗

CogView3-Plus是由智譜技術團隊推出的圖像生成模型，它是 CogView3 的 DiT 版本。在CogView3（ECCV'24）的基礎上引入了最新的 DiT 框架，以實現整體性能的進一步提升。CogView3已將代碼、模型和技術報告開源，模型已經發布在始智AI wisemodel開源社區，wisemodel社區上也已經提供了CogView3的鏡像，可以通過創建開發環境來使用CogView3模型了。

使用CogView3-Plus-3B-Deploy鏡像直接運行

點擊模型詳情頁-“訓練或微調”按鈕，創建一個開發環境，選擇“CogView3-Plus-3B-Deploy”的鏡像，使用1張A5000或3090的配置（如果需要跑2048*2048的圖片可以選擇1張H20的配置），選擇CogView3-Plus-3B的模型文件路徑“/llm/ZhipuAI/CogView3-Plus-3B”，完成其他屬性的填寫或選擇，然後直接點擊下一步：然後確認一下計費方式，如果是簡單體驗可以選擇按量計費的模型，如果需要使用更長的時間，也可以選擇包周或包月的模式，相比於按量有一些折扣。確定計費方式之後，可以直接點擊提交訂單：

創建完成之後，等待1分鐘左右，開發環境進入運行中的狀態，可以通過ssh登錄到容器內或者通過notebook的方式把CogView3-Plus-3B服務啓動起來。

下面通過SSH的方式來把CogView3-Plus-3B服務啓動起來，在終端裡通命令行SSH連接到開發環境，輸入密碼登錄到開發環境：

登入進來之後先到代碼所在的路徑：

cd /home

cd CogView3

cd inference

進入inference路徑之後直接執行：

CogView3-Plus-3B服務正常啓動

服務啓動之後回到開發環境詳情裡，點擊“服務端口”選項卡，申請一個公網訪問的地址，申請好之後直接複製鏈接到瀏覽器打開

發現服務確實正常啓動了，並且可以直接在線運行進行圖片生成了。

通過notebook的操作也基本類似。

使用基礎鏡像重新開始安裝部署

創建開發環境部署，進入wisemodel的“算力”模塊，選擇3090-24G-PCIe，點擊“創建開發環境”。CogView3-Plus生圖大概佔用20GB左右的顯存。

分別填寫好“中文名稱”、“英文名稱”，選擇好”開發環境標籤“、“選擇鏡像”、“資源配置”和“模型文件”後，具體選擇可以參考圖中紅框內容，點擊下一步。

選擇好“停止時間”後，點擊“提交訂單”。

開發環境此時創建完成。需要注意右上角，等待20秒左右會變成綠色的啓動成功，狀態變成“運行中”。

此時，我們可以選擇使用SSH進行開發，或者使用notebook進行開發，此處我們提供notebook的教程。

進入notebook後，點擊Terminal，打開終端。

進入開發環境之後，可以先執行nvidia-smi查看一下GPU相關的信息。

可以發現目錄下包括code、dataset和model三個文件夾，進入code文件夾，從github上下載CogView3倉庫文件。進入CogView3文件夾，可以發現倉庫文件已經被下載到code文件夾中。

進入inference文件夾中，可以發現文件夾中有一個requirements.txt文件。使用pip install -r requirements.txt安裝推理所需要的python庫。（速度慢可切換pip的清華鏡像）

同時，我們可以在wisemodel的“服務端口”中申請端口，並且將得到的端口信息填到gradio_web_demo.py文件最後一行中。

將得到的端口信息填到gradio_web_demo.py文件最後一行中。

此時，如果我們運行python gradio_web_demo.py會發現遇到以下問題：

經查，發現是環境中的torchvision版本過低，安裝0.19.0版本的torchvision解決問題。

使用命令pip install torchvision==0.19.0。之後我們再運行python gradio_web_demo.py。

可以發現，模型能夠正常加載。

用瀏覽器打開““服務端口”中的“域名地址”，輸入prompt，即可生成圖像。生成一張圖像大概需要1分鐘左右。

加入圖像生成羣

整理：開源共創志願者潘佳棟

----- END -----

wisemodel相關

系統升級

關於wisemodel更多

歡迎持續關注和支持

歡迎加盟wisemodel開源社區

歡迎投稿優質內容

關於wisemodel開源社區

向上滑動查看

教程 | CogView3-Plus文生圖模型在線部署和體驗

相關資訊