專訪導演陳坤:國內第一部AIGC短劇是怎樣煉成的?

在預告片獲得了60萬全網瀏覽量後,陳坤的正片終於上映了,很快就在快手平臺收穫了超1000萬播放量。

這部名爲《山海奇鏡之劈波斬浪》的短劇講述了一個非常簡單的故事:一位少年爲了救出被擄走的母親,一路衝進海底與最終boss戰鬥並取得勝利。

這樣“勇者鬥惡龍”的簡單故事框架顯然不是讓其收穫巨大關注的原因,而是這部短劇從劇本到分鏡,從概念圖到最終的視頻呈現,甚至配樂,均是由AI工具生成的。而我們通過短劇最終呈現的水神火神、驚濤駭浪以及各路山海經怪物能感受到的是:可靈大模型作爲目前AI生成視頻領域,可被使用的第一名,其生成能力已突破了此前AI視頻常被人詬病的PPT感,也能看到其上下場景中人物的連貫性,“威爾·史密斯吃意麪”的場景不復出現。

然而工具的強大,還要搭配使用者的能力。

陳坤在此前20餘年的工作經驗中,一直是綜藝與大型晚會的導演及監製,包括《好聲音》、《這就是街舞》等。直到2023年下半年,他關注到AI,看到Pixverse等工具的出現,他意識到,AI影視已經成爲一種可能性。

這或許也有一些FOMO在其中。在陳坤忙着數億資金投入的綜藝節目時,抖音與快手悄悄出現,當時陳坤不以爲然,但等到短視頻徹底顛覆長視頻之後,他才後知後覺地意識到,短視頻領域已經擠滿了頭部,難以爲他留下身位。而他不容許自己在AI時代重現這種錯失。

目前,陳坤的公司星賢文化已完成融資,在他看來,AI影視也至少在TVC與短劇的領域裡跑通了商業化。

以下是陳坤與36氪的對話——

Q:讓我們先來聊聊《山海奇境》吧。和火遍全網的預告片相比,我們將在成片裡看到什麼新東西?

A:預告片只有一些精彩的鏡頭,成片我們會有一個具體的故事。雖然這個“劈山救母”的故事比較簡單,但我們能從視覺上感受到,這個短劇不像之前那樣PPT了。包括人物的對話部分也會有一些表演的成分,人物可以微微轉頭,身體也有微微起伏。

Q:在製作這部AI短劇的過程中,您都使用了哪些AI工具?流程中的哪些部分是可以由AI全權接管的,哪些不可以?

A:AI參與最多的部分是我們從前所說的“實際拍攝”。在傳統影視裡,實拍組包括導演以及整個攝像、燈光、音響、服裝、化妝、道具,包括藝人、場務等,可能有幾百人。其次AI也會負責後期特效,這在之前可能是非常龐大的後期特效組所完成的事情。除此之外,前期劇本創作我也用到了部分AI的輔助,但要注意的是,AI只能做輔助,不能做原創,因爲目前的AI只能只能有中生有,它不能無中生有。

在文生圖階段,我會用Midjourney等工具,在圖生視頻階段,我會使用可靈和Pixverse。

Q:這圖生視頻的過程中,您平均需要抽卡多少次才能獲得一個可以使用的畫面?

A:不一定。比如片中有一個水神和火神打架的畫面,那個畫面我們抽了幾百次,都沒有抽到特別好的,最後用的畫面我也不是很滿意。說明現在模型對於動作交互的理解和表現都不是特別好,無法和傳統影視匹敵。

但也有一些好的畫面,比如預告片中有一個水神共工從山里站起來的鏡頭,這個鏡頭一共只抽了不到10次,可用的就有四五條。

Q:應該如何提高抽卡的成功率?

A:通過對圖片的局部修改,或者通過墊圖的方式。

Q:目前AI可以在多大範圍內替代人工?

A:爲什麼這麼多人都在喊人工智障,我覺得是因爲對模型運行的機制不夠了解。比如當前的大語言模型,其實並不是真正的人工智能。真正的人工智能是什麼,應該是我下命令生成一個山海經相關的劇本,AI就能給我提供從《山海奇境》這個劇名到每一個腳本的細節。現在這是做不到的。

其原因在於,現在的大模型只是把你的問題轉化成提示詞,從數據庫調取符合這個提示詞標籤的答案,然後把答案組合成一個答案輸送給你。你可以要求他給你20個答案,但他的前10個答案一定比後10個好,因爲這是一個優選的過程,還是那句話,它只能“有中生有”。因此你只能將它當成一個工具,而不能過度依賴。

Q:如果AI已經能夠無中生有,那我們還需要專業人士嗎?

A:即使AI能夠無中生有,也不是按照人類的“無中生有”邏輯。人類畫畫的邏輯是輪廓和顏色,AI則是一個去噪的過程,就像一個近視眼患者慢慢看清楚一幅畫。所以二者的創作原理本身就不一樣,那麼其帶來的審美情緒就是不一樣的。

現在也有一鍵式生成視頻的AI工具,但相當粗糙。這就像木桶理論,水的高度取決於它的短板,但目前一鍵式AI視頻的問題是,每塊木板都是短的,那就無法稱之爲木桶,只是個碟子,因此現在做這種工具是沒有意義的。

Q:但即使有這樣強力的“木桶”出現,電影行業專業人士生成出來的視頻和普通人生成的還是會天差地別。

A:當下張藝謀導演能用到的所有設備,我只要有錢也可以買得到,但我們最後能生產出的東西是完全不一樣的。AI永遠只是一個工具,我認爲這在任何時代都不會改變,如果有一天你發現專業人士生產出來的東西和小白沒有區別時,那就代表AI已經超越人類了。設想一下,如果有腦機接口,並且AI生成的速度要比人類思考的速度還快,那就意味着人類永遠走不出這個虛擬世界,因爲鋪路的速度甚至快於走路的速度。那就沒有討論的必要了,那時藝術已不復存在。

Q:想要追平傳統影視效果,AI還需要做到什麼?

A:人物一致性,場景一致性、人物表演,和動作交互。其中人物和場景一致性是指,這個鏡頭裡的人物和場景要和下個鏡頭保持一致,這非常依賴大模型對於三維的識別。

Q:您現在做AI短劇和您此前做傳統影視,感受上最大的區別是什麼?

A:我認爲未來的AI時代可能會成就很多超級個體,你只要掌握了一些能力,就完全可以做出來一個還不錯的影視作品,這個在以前是完全做不到的。

Q:你作爲導演,已經有了很多成熟的作品,爲什麼會如此用力追隨AI影視的變革?

A:因爲我整個錯過了短視頻顛覆長視頻的浪潮。那時候我正在做一個綜藝節目,投資數億,抖音出現了,我去看了一眼,只看到小姐姐拿着手機在跳舞,因此我根本沒放在心上。當我意識到長視頻的“樓塌了”時候,我再去看就發現已經看不懂短視頻的運營邏輯了,所有賽道也都有頭部在。

而我現在認爲AI帶給影視行業的變化或許比上一波顛覆還要徹底,所以我才這樣努力地去了解新技術。目前爲止,AI技術遠未到頂,我們只能保持作品內容的領先性,期待大量商業化機會爆發的時刻,我們會成爲第一波衝進桃園的人。