網易伏羲AI虛擬人首席專家丁彧:數字人的未來是服務人類

杭州網訊12月18日-20日,2020本站未來大會在杭州盛大舉行。大會以“洞覺 未見”爲主題,匯聚了全球最強大腦,期盼以遠見超越未見,去尋找打開未來的鑰匙。

大會上,本站伏羲AI虛擬人首席專家丁彧博士發表了《數字人的前生今世與未來》主題演講,分享了本站伏羲的數字人研究成果。在丁彧博士的帶領下,現場嘉賓展開了一場關於未來的想象:如果數字人成爲現實,世界將是怎樣。

數字人,是基於數字成像技術的虛擬人。數字人的起源來自人類,只有理解了人類,數字人才可以復刻人類,富有像人類一樣的能力——比如有說話語音的能力,講話的時候有各種表情肢體語言的能力。

今天,隨着器械的製造、信息學、AI技術的蓬勃發展,人類已經可以開始數字化定量地對人類進行理解。這催生了數字人的誕生,數字人從此進入人類歷史的舞臺

丁彧博士現場展示了本站伏羲的虛擬人技術。在視頻中,數字人可以復現人類細膩的肢體表達。而在一組對比視頻中,由人工智能技術算法產生的面部表情動畫,已經與由動捕產生的畫面十分接近。

運用本站伏羲的技術,由一句話生成動畫的時間大概只要30-50毫秒。這背後的意義絕對不僅僅是降低了動畫的生產成本,而是意味着一個數字人能夠進行自主的表達,不再需要時間。這就爲下一代的人機交互做好了準備。

最後,丁彧博士暢想了數字人發展所展現的廣闊應用前景。未來,在高效的腦信號交流的環境下,數字人能夠完全復刻人類,比如可以復刻無數的“張桂梅”校長去解決教育資源不平等的問題。而AR、VR等技術也爲虛擬人形象的生成提供無限的可能。

以下爲本站伏羲AI虛擬人首席專家丁彧博士演講的部分內容:

大家好,12月的杭州還是有些寒冷的,今天的主題是“洞見與未見”,讓我們把腦洞打得更開一些,想象力更多一些。

我今天帶來的話題是“數字人”。提到數字人,那它一定不是實體的機器人,而是基於數字成像技術的虛擬人。

數字人的前世,今生,和未來。

首先,讓我們來開宗明義: 什麼是數字人的前世,什麼是數字人的今生,更重要的是,我們想知道未來的數字人是什麼樣子

對人類的起源,人們一直以來有很多爭論,但是數字人起源是非常清晰的,數字人的起源一定是人類。讓我們定義成“數字人的前世就是理解人類”。只有理解了人類,搞懂了人類,那麼數字人就可以復刻人類,這也是當今時代各個戰線的科技工作者們正在努力的方向:我們希望數字人富有像人類一樣的能力——比如有說話語音的能力,講話的時候有各種表情、肢體語言的能力。

大家可以發揮想象力,嘗試想想數字人的未來是什麼。在這裡,我首先做一個定義,當數字人的技術無限的強大,在那個時候,數字人的未來一定是無限地、充分地服務人類。

先講講數字人的前世。數字人的前世與理解人類有關。自人類誕生以來,人類從來沒有停止過對人類自身的理解,包括億萬年來人類的起源問題。

在5000年前,在良渚古城向我們揭示了5000年前的人類,他們已經有了非常高效的社交能力。大家可以羣聚在一起,以團隊的方式完成大型的水利工程,這就說明人類的社交能力在人類生產、生活中至關重要,我想這也一定是數字人將來一定要具備的能力,具有數字社交能力。

時間再拉到文藝復興19世紀上半葉,實驗科學得到了大量發展。實驗科學推進了人類對人類的理解。150年前,達爾文通過物證的方法論證了人類的起源,達爾文不僅僅論證了人類的起源,還有實驗的方法研究了人類的社交行爲,比如表情。爲什麼表情很重要呢?對於一個嬰兒來說,在還沒有學會說話的時候,已經會用表情與父母、與親人產生社交行爲。

圖中的六幅圖片,就是150年前達爾文研究人類的表情,他用電擊的方式促進人類不同面部的肌肉,看一下肌肉怎麼反應,以此獲得人類如何通過面部的肌肉、面部的動作來表達情緒的。同時,除了表達以外,還有研究如何從對方面部肌肉中,感知和理解他的情緒和心理狀態。

在過去150年當中,實驗科學得到了巨大的發展,給心理學社會學、行爲學積累了大量的對人類定性理解的積累。

但是到了今天,隨着器械的製造、信息學、AI技術的蓬勃發展,人類已經不再僅僅滿足於定性的對人類理解,人類已經可以開始數字化定量地對人類進行理解。一旦可以定量,這時候數字人就誕生了,數字人就進入人類歷史的舞臺。

這是本站遊戲製作的遊戲視頻,基於光學的“動捕”設備可以捕捉到人類細微骨骼運動,我們把細膩肢體藝術表現,可以復刻在遊戲的數字人當中。

大家可以看到,在這樣一個數字世界中,不僅可以復現人類細膩的肢體表達,數字世界也同樣逼真了。

在21世紀前20年,人工智能的技術得到蓬勃發展,在這個時候,人工智能技術已經賦予數字人一種能力,他們不再需要動捕的設備,不再需要手工的製作動畫,它能夠根據劇情的需要,根據內心表達的需要,能夠自主產生面部的表情。

接下來的視頻是配對的視頻,這個數字人它們在說同樣的話。左邊這個由人工智能技術算法產生的面部表情的動畫;右邊是由動捕產生的,左邊跟右邊越接近,我們認爲這個技術已經讓面部表情的表達已經越逼真了。大家可以感受一下他們之間的相似性和差距。

可以看到這樣動畫參數的生成已經非常接近了,對人類來說,一句話的時間生成動畫大概只要30-50毫秒。這背後有什麼意義?絕對不僅僅是把動畫的生產技術的成本降低了。我認爲30-50毫秒是非常重要的,也就意味着一個數字人能夠進行自主的表達,不再需要時間。比如我現在在這裡演講,我只需要思考我的演講內容,不再需要關注我的表情和肢體動作,也就爲下一代的人機交互做好了準備。

除了智能的表情以外,本站伏羲的人工智能專家們也使得數字人具備了智能肢體語言表達的能力。在交流過程中,除了面部表情,還通過肢體語言來進行交流,這樣一個動畫展示了人工智能技術產生的肢體語言。

這個意義在哪裡?比如今天發生了一個社會熱點,這樣一個新聞的虛擬偶像需要播報熱點,但是按照傳統的技術,需要靠人工製作動畫,或者動捕設備去捕捉這個人體的骨骼,然後再修正。這樣的動畫做好大概一星期以後,經濟和人力的成本不去說,關鍵是一星期以後這個社會熱點已經沒有了,但是用了人工智能的技術,能夠在幾分鐘之內就能完成視頻的製作。

除了交流、說話、表達的時候有豐富的面部表情以外,數字人也可以聽到音樂以後自動編排舞蹈。

在同一個時期,高仿真的數字人也出現了,接下來展示的視頻並不是大家常見用手機或者用相機拍攝的點,完全是由人工智能算法去計算而成的。

大家可以觀察一下,在這個視頻中,兩個數字人在說話,它們的面部表情是否逼真,除了面部表情以外,輕微的頭部運動、肢體的運動包括男士喉結的運動、脖子上橫紋的運動甚至是衣服細微褶皺的運動,可以觀察一下視覺表象。視頻中展現的是他們在學習人類說話,會聽到一個旁白音說一個話,然後他們重複這個話,我們重點關注它的視覺表象。

大家可以看到在外表的表象上很多部分的細節已經跟人類非常非常逼真。但是我們不僅僅侷限於外表像真人,希望我們的數字人還有大腦。那麼現在的5G,將來的6G、7G進一步發展,讓通訊變得更加的高效。同時,物聯網時代到來,一切都是數字化,那這樣一切數字化也就爲數字人帶來強大的大腦知識庫,那一切的算力提高、通訊的快速,還有複雜數據的處理,都爲我們數字人提供了智力的保障,提高了記憶力系統,提高了推理能力。在那時候,我們的數字人一切皆可計算、一切皆可畫像、一切皆可推理。

除了數字人大腦這一塊,數字成像技術也在迅速的發展。今天大家聽到的AR、VR,將來可能還有BCDEFG各種“R”,各種“R”的技術也爲虛擬人表象的生成提供無限的可能。時間再往後推50年,80年,甚至100年,當腦電技術進一步發達時,我們的人類、我們生物人與數字人的交流可能不再是視覺的方式進行交流,也不再是以聽得見的語言來交流,那時候可以以腦電信號來交流。數字人和人類之間可以互相通信,通信腦電的信號。那在這個時候,我們的感知、感覺、情感、性格、愛好、習慣、記憶,這些看不見、聽不見,但卻真實存在的生物信號可以直接用來跟數字人進行交流。

在這樣一個高效的腦電信號的交流情況下,我們數字人能夠完全復刻人類。當數字人技術得到無限發展後,我想到了那個時候,人類的精神體驗就能得到極大的滿足。那就讓我們基於今天技術,又不限於今天技術,大膽想象一下,將來數字人如何服務於人類。

當這個技術無限發展時,數字人能幫我們人類在精神體驗上服務人類,包括可以幫助我們人類跨越空間、跨越時間,甚至跨越生命。有一首歌是這樣子的,“我想帶你去浪漫的土耳其,然後一起去東京和巴黎”。受空間的限制,今天看起來這樣一個旅遊線路真的是糟糕透了,費錢又費力。但是當數字人得到普及以後,這件事情就不再是這樣子了,我們在一個週末可以派孿生數字人,一個去土耳其,一個去巴黎,還有一個去東京。在這個時候,“緣分”這個概念可能會被改寫了。比如,我們在物理世界中的兩個人,我們一輩子都可能不再有機會相遇。但恰巧在同樣一個週末,我派了孿生數字人去了巴黎旅遊,那另外一個朋友也派了他的數字人去巴黎旅遊,兩個數字人在數字世界中,在盧浮宮門前相遇了,他們發現性格、愛好、認知數據完全匹配,他們決定結伴一起渡過美好的巴黎週末。週日回來之後,我們各自的數字人通過腦電信號可以讓我們立馬感知到整個週末的旅遊體驗,那這樣子我們週一還可以打個電話,在物理世界中和另外一個“朋友”聊聊週末旅遊的感受。就這樣,數字人和生物人能夠得到無縫的連接。

好,週末的旅遊已經完了,週一來了,我們來聊一點更加嚴肅的話題,教育資源的不平衡。

張桂梅校長被評爲“時代楷模”,她用了畢生精力來紮根於鄉村教育,其實就是在解決教育資源不平衡的問題。但是可以想象一下,我們還有更多的鄉村,更多的地區,更多的國家,需要更多的張桂梅女士,這樣對生物人來說顯然是不可以解決不了的。

這時候虛擬人教師的出現可以解決這個問題。因爲數字人教師它可以具備完備的知識體系,不受時間和空間的限制,可以實現個性化、一對一的教育。實際這一點,本站伏羲在2019年的暑假就領先於行業,邁出了第一步。我們給一款在線教育編程產品賦於了數字人的教師功能。

我來解釋一下,它解決的痛點是什麼。通過小朋友學生在前端操作電腦的時候,他所有的數據都是可以被跟蹤記錄下來的。其實根據這個知識庫,我們可以判斷出他的知識點薄弱環節,甚至可以判斷出他在什麼時候開始不感興趣了,什麼時候想放棄了。這樣一些能夠檢測到的信號都沒有被利用起來,但數字人、虛擬老師出現,這些數據全部可以利用起來。當我們檢測到他有知識點薄弱環節時,數字人能夠主動的跳出來爲他講解知識,那這樣小朋友就不需要等到家長,等到老師講解了,這樣一個產品的黏性就提高了,學習效率就提高了。同時,我們數字人也是可以具備心理學的知識,當小朋友厭倦時,想放棄時,虛擬教師也可以主動鼓勵他,甚至他也許有點驕傲時,可以稍稍批評他。

教育資源不平衡聊完之後,我們再來聊一下醫療資源不平衡。醫療資源不平衡一直是一個痛點,熱點的話題,不同的地區無法享有同樣的醫療資源,但數字人的普及,我們可能會有一個貼身的數字醫生。貼身的數字醫生,可以監控着我們的飲食起居,甚至對我們的DNA都是瞭如指掌,對我們的生活習慣實時提出各種建議,甚至對餐桌上的食物和餐桌食物製作過程都可以數字化的瞭如指掌,也可以提出建議,什麼該多吃、什麼該少吃、什麼又不能吃。另外一方面,一旦醫療成果出現以後,在今天的社會一定是地區、地區傳播的,不同地區在不同時間段享有最一流的醫療成果。

這樣的話,其實是滯後的。但一旦有了數據的傳輸,貼身的醫生能夠及時爲每一個人更新最新的醫療成果,讓我們在醫療成果面前能夠得到最及時、最公平的享有。有了這樣貼身醫生之後,我們的生物物理身體的壽命能夠極大延長,我們就有機會極大限度去享用身體。

好的,教育資源、醫療資源聊完之後,我們再聊一個輕鬆浪漫的話題。無數的影視作品有去設想,可能會有一個虛擬的女朋友,就像電影片段裡所展示的這個女孩,就是一個虛擬的。其實找對象這個話題一直以來都是人類歷史永恆的話題,甚至找對象今天也成爲了一個產業。其實對一個二三十歲年紀的人來說要決定一生的伴侶,是一個有挑戰性的事情。

但是當數字人普及之後,這件事情就會變得美好了很多。我們可以派出孿生的數字人去數字世界與其他異性的孿生數字人一起談戀愛,因爲在數字世界中數字人不會對異性朋友本身的生活工作造成干擾,那這時候我們可以派出多個數字替身與多名異性數字替身進行談戀愛。在數字世界中,一段時間後,數字人會告訴我們不同的體驗,幫助我們得到更好的選擇。又因爲區塊鏈這樣的技術出現,確保了在數字世界中一切數據都是真實可靠,並且是安全的。在數字戀愛世界中,我們可以更美好的改變愛情生活。

聊完了數字人幫助我們跨越空間、跨越時間,那麼再聊一個更有溫度的話題,跨越生命。其實也有無數的影視作品,無數的科技工作者們提過這個話題,是否能夠讓我們已故的詩人得到復活,是的,這也應該是數字人將來的一個方向,我們也希望能夠跟李白對飲三百杯,再跟他吟詩作賦,讓已故的英雄偶像能夠得到數字化的復活。甚至讓已故的世人能數字化的呈現,我們依然有機會和他們交流。

這個視頻中展示的就是一個年輕的媽媽,技術工作者們幫她復現了去世的小孩。

好的,那我更多想提的不是說數字化能夠復現已故的世人,更多是想提出一個問題,活着的在座,今天我們還活着,但一百年以後,我們將會失去物理的生命,但我們數字化的生命還將存在在數字世界中,它還將生活着500年,生活着1000年。那他將繼續如何在數字社會中存在、生活和工作呢,那就取決於我們活着這100年給他提供的初始化數據,那麼也就提醒大家珍惜到今天的生活和工作。

謝謝大家!

2020本站未來大會由杭州市人民政府和本站公司聯合主辦,杭州市商務局、杭州市經濟和信息化局、杭州市濱江區人民政府、北京本站傳媒有限公司以及本站(杭州)網絡有限公司承辦,中國移動總冠名。大會將進行三天的頭腦風暴、涵蓋了預見未來、新基建、人工智能、區塊鏈、潮商業、UP生活以及和文化等論壇。