教程 | CogView3-Plus文生圖模型在線部署和體驗

CogView3-Plus是由智譜技術團隊推出的圖像生成模型,它是 CogView3 的 DiT 版本。在CogView3(ECCV'24)的基礎上引入了最新的 DiT 框架,以實現整體性能的進一步提升。CogView3已將代碼、模型和技術報告開源,模型已經發布在始智AI wisemodel開源社區,wisemodel社區上也已經提供了CogView3的鏡像,可以通過創建開發環境來使用CogView3模型了。

01

使用CogView3-Plus-3B-Deploy鏡像直接運行

點擊模型詳情頁-“訓練或微調”按鈕,創建一個開發環境,選擇“CogView3-Plus-3B-Deploy”的鏡像,使用1張A5000或3090的配置(如果需要跑2048*2048的圖片可以選擇1張H20的配置),選擇CogView3-Plus-3B的模型文件路徑“/llm/ZhipuAI/CogView3-Plus-3B”,完成其他屬性的填寫或選擇,然後直接點擊下一步:然後確認一下計費方式,如果是簡單體驗可以選擇按量計費的模型,如果需要使用更長的時間,也可以選擇包周或包月的模式,相比於按量有一些折扣。確定計費方式之後,可以直接點擊提交訂單:

創建完成之後,等待1分鐘左右,開發環境進入運行中的狀態,可以通過ssh登錄到容器內或者通過notebook的方式把CogView3-Plus-3B服務啓動起來。

下面通過SSH的方式來把CogView3-Plus-3B服務啓動起來,在終端裡通命令行SSH連接到開發環境,輸入密碼登錄到開發環境:

登入進來之後先到代碼所在的路徑:

cd /home

cd CogView3

cd inference

進入inference路徑之後直接執行:

CogView3-Plus-3B服務正常啓動

服務啓動之後回到開發環境詳情裡,點擊“服務端口”選項卡,申請一個公網訪問的地址,申請好之後直接複製鏈接到瀏覽器打開

發現服務確實正常啓動了,並且可以直接在線運行進行圖片生成了。

通過notebook的操作也基本類似。

02

使用基礎鏡像重新開始安裝部署

創建開發環境部署,進入wisemodel的“算力”模塊,選擇3090-24G-PCIe,點擊“創建開發環境”。CogView3-Plus生圖大概佔用20GB左右的顯存。

分別填寫好“中文名稱”、“英文名稱”,選擇好”開發環境標籤“、“選擇鏡像”、“資源配置”和“模型文件”後,具體選擇可以參考圖中紅框內容,點擊下一步。

選擇好“停止時間”後,點擊“提交訂單”。

開發環境此時創建完成。需要注意右上角,等待20秒左右會變成綠色的啓動成功,狀態變成“運行中”。

此時,我們可以選擇使用SSH進行開發,或者使用notebook進行開發,此處我們提供notebook的教程。

進入notebook後,點擊Terminal,打開終端。

進入開發環境之後,可以先執行nvidia-smi查看一下GPU相關的信息。

可以發現目錄下包括code、dataset和model三個文件夾,進入code文件夾,從github上下載CogView3倉庫文件。進入CogView3文件夾,可以發現倉庫文件已經被下載到code文件夾中。

進入inference文件夾中,可以發現文件夾中有一個requirements.txt文件。使用pip install -r requirements.txt安裝推理所需要的python庫。(速度慢可切換pip的清華鏡像)

同時,我們可以在wisemodel的“服務端口”中申請端口,並且將得到的端口信息填到gradio_web_demo.py文件最後一行中。

將得到的端口信息填到gradio_web_demo.py文件最後一行中。

此時,如果我們運行python gradio_web_demo.py會發現遇到以下問題:

經查,發現是環境中的torchvision版本過低,安裝0.19.0版本的torchvision解決問題。

使用命令pip install torchvision==0.19.0。之後我們再運行python gradio_web_demo.py。

可以發現,模型能夠正常加載。

用瀏覽器打開““服務端口”中的“域名地址”,輸入prompt,即可生成圖像。生成一張圖像大概需要1分鐘左右。

加入圖像生成羣

整理:開源共創志願者 潘佳棟

----- END -----

wisemodel相關

系統升級

關於wisemodel更多

1

歡迎持續關注和支持

2

歡迎加盟wisemodel開源社區

3

歡迎投稿優質內容

4

關於wisemodel開源社區

向上滑動查看