虛擬人的發(fā)展簡(jiǎn)史與三條路線
作者|Tim Jiang
編輯|Tim Jiang
01
虛擬人發(fā)展簡(jiǎn)史
什么是虛擬人?結(jié)合行業(yè)里的定義以及個(gè)人理解,虛擬人主要是通過(guò)計(jì)算計(jì)算圖形學(xué)、圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)和語(yǔ)音合成等計(jì)算機(jī)手段制作出來(lái)的具有人類多重特征的虛構(gòu)人物。
來(lái)源:公開網(wǎng)絡(luò),Max Headroom;
虛擬數(shù)字人的歷史敘述可以追溯到上世紀(jì) 80 年代在英國(guó)出現(xiàn)的虛擬數(shù)字主持人—— Max Headroom,其內(nèi)容制作的背后由演員 Matt Frewer 飾演,并在當(dāng)時(shí)被宣傳為“第一位計(jì)算機(jī)生成的電視節(jié)目主持人”;然而,實(shí)際上 Max Headroom 并不是由計(jì)算機(jī)生成,而是由演員 Matt Frewer 戴著假肢并穿著西裝,在特定的拍攝環(huán)境下刻意呈現(xiàn)的。
隨著個(gè)人計(jì)算機(jī)的普及與技術(shù)應(yīng)用,從上世紀(jì) 80 年代開始,通過(guò) CG(Computer Graphics)制作的影視內(nèi)容不斷出現(xiàn),期間包括 1973 年的《Westworld》、1977 年的《星球大戰(zhàn)》以及 1979 年的《異形》;到了1991 年,類似《終結(jié)者 2 》中完全由 CG 制作的角色——終結(jié)者“T-1000”開始出現(xiàn);1995 年,由皮克斯制作的《玩具總動(dòng)員》成為第一部完全通過(guò) CG 技術(shù)制作的電影。
來(lái)源:公開網(wǎng)絡(luò),《星球大戰(zhàn)》;
CG 技術(shù)的出現(xiàn)與普及,主要是為了提高更早以前的傳統(tǒng)動(dòng)畫行業(yè)內(nèi)容制作效率,并讓動(dòng)畫制作繞開了在紙張上著墨的環(huán)節(jié);成本上看,制作周期更短更快、人員成本更少以及更加環(huán)保,并且在收入上更加可觀,例如皮克斯于 1999 年推出的《玩具總動(dòng)員 2 》,當(dāng)時(shí)在全球拿下了 4.85 億美元票房。
來(lái)源:公開網(wǎng)絡(luò), Cabell Calloway III;
動(dòng)作捕捉(Motion Capture,下稱“動(dòng)捕”)其實(shí)最早可以追溯到上世紀(jì) 30 年代的美國(guó)爵士歌手 Cabell Calloway III,他的舞蹈動(dòng)作與風(fēng)格被融入了動(dòng)畫制作當(dāng)中,內(nèi)容制作方通過(guò)將演員跳舞中的動(dòng)作記錄下來(lái),以便藝術(shù)家可以在鏡頭上勾勒出逼真的動(dòng)畫動(dòng)作,以及迪士尼的早期作品《白雪公主和七個(gè)小矮人》也是如此。
進(jìn)入到 21 世紀(jì),結(jié)合 CG和動(dòng)作捕捉(Motion Capture,下稱“動(dòng)捕”)兩項(xiàng)技術(shù)制作的虛構(gòu)人物開始在電影中大放異彩,例如 2001 年上線的《指環(huán)王》中的“咕!边@一角色,以及后來(lái)陸續(xù)出現(xiàn)的《阿凡達(dá)》、《猩球崛起》以及漫威《復(fù)仇者聯(lián)盟》系列中的“滅霸”。
來(lái)源:公開網(wǎng)絡(luò),滅霸拍攝過(guò)程;
21 世紀(jì)的前十年除了計(jì)算機(jī)在視覺(jué)制作上進(jìn)步,同時(shí)間線在音樂(lè)制作領(lǐng)域也出現(xiàn)了一個(gè)代表性的事件,即在 2007 年推出的“初音未來(lái)”,她是 Crypton Future Media(下稱“Crypton”) 旗下通過(guò)雅馬哈旗下 Vocaloid 2 語(yǔ)音合成引擎開發(fā)的虛擬女性歌手,即將聲優(yōu)的錄音合成歌聲,需要輸入部分諸如音調(diào)、歌詞和音速等情感參數(shù)。
來(lái)源:公開網(wǎng)絡(luò),初音未來(lái)演唱會(huì);
原先在 Crypton 負(fù)責(zé)初音項(xiàng)目的僅 3~4 人,早期團(tuán)隊(duì)曾想接洽歌手來(lái)提供聲音,但接洽下來(lái)的歌手基于聲音的復(fù)制與版權(quán)問(wèn)題而拒絕了合作,最后在篩選了 500 位聲優(yōu)后選擇了聲優(yōu)藤田咲來(lái)提供原聲,總錄制時(shí)間達(dá)到 6 小時(shí);另一方面,在初音的 IP 設(shè)定上, Crypton 將其定位為年齡 16歲、生日為2007 年 8 月 13 日、身高 158 cm 以及體重 42 kg 的少女歌手,擅長(zhǎng)流行歌曲、搖滾樂(lè)與舞蹈,隨著初音 IP 知名度的提高,項(xiàng)目方開始向漫畫、游戲、電視節(jié)目、演唱會(huì)以及更多周邊生態(tài)進(jìn)行商業(yè)化。
進(jìn)入到 2011 年,剛剛講的 Vocaloid 語(yǔ)音合成引擎已經(jīng)迭代到第 3 個(gè)版本了,雅馬哈與國(guó)內(nèi)名為 Bplats 的公司合作, Bplats 可能很多人也沒(méi)聽說(shuō)過(guò),但它旗下有家子公司名為“上海禾念”,相信很多人聽過(guò)。
來(lái)源:公開網(wǎng)絡(luò),洛天依;
回到 Vocaloid,雅馬哈和 Bplats 開始在 2011 年一起推進(jìn)“ Vocaloid China ”項(xiàng)目,同年公布征集了人物形象與活動(dòng)計(jì)劃,最后成功入圍了 5 件作品,大家熟知的“洛天依”就是其中之一;到了 2014 年,Bplats 在官網(wǎng)宣布了 “Vocaloid China” 項(xiàng)目的運(yùn)營(yíng),包括洛天依在內(nèi)的 5 個(gè)IP 劃歸為脫離母公司的上海禾念所有,禾念同時(shí)在 2015 年推出了虛擬藝人品牌 Vsinger,在后幾年發(fā)展中被 Bilibili 收購(gòu)成為旗下超電文化的子公司。
2018 年,洛天依的歌聲庫(kù)已經(jīng)擴(kuò)展到了 Vocaloid 5 、ACE AI 歌聲庫(kù)以及微軟小冰歌聲庫(kù),不同于 Vocaloid 基于組合拼接的合成方式,后兩者則基于 AI 生成。
來(lái)源:公開網(wǎng)絡(luò),小冰;
小冰是微軟亞研院在 2014 年在中國(guó)推出的 AI 聊天機(jī)器人,2016 年其在全球已經(jīng)覆蓋 40 多個(gè)平臺(tái)以及合計(jì) 6.6億的用戶使用;2020 年小冰業(yè)務(wù)從微軟拆分成為獨(dú)立運(yùn)營(yíng)的小冰公司。
02
虛擬人的商業(yè)路線
關(guān)于虛擬人的劃分,最簡(jiǎn)單的方式是判斷虛擬人的是不是依靠人的,即依靠人和依靠機(jī)器的。
所謂依靠人的,即通過(guò)動(dòng)態(tài)捕捉技術(shù)來(lái)進(jìn)行肢體與表情的交互,目前常見的動(dòng)作捕捉技術(shù)可分為 3 種:光學(xué)動(dòng)捕、慣性動(dòng)捕和計(jì)算機(jī)視覺(jué)動(dòng)捕。
隨著計(jì)算機(jī)圖像識(shí)別相關(guān)算法的進(jìn)步,通過(guò)慣性動(dòng)捕或者光學(xué)動(dòng)捕將不再是這一類的必須工具,比如 iPhone 中的「擬我表情」,通過(guò) iPhone 的前置攝像頭捕捉我們的面部肌肉和動(dòng)作,再通過(guò)手機(jī)的神經(jīng)網(wǎng)絡(luò)引擎機(jī)器學(xué)習(xí)計(jì)算獲得,本質(zhì)上所有的語(yǔ)言、語(yǔ)音、表情與肢體互動(dòng)還是依靠人來(lái)提供。
所謂依靠機(jī)器,虛擬人呈現(xiàn)的內(nèi)容在語(yǔ)言、語(yǔ)音、表情與肢體互動(dòng)上通過(guò)計(jì)算機(jī)的 AI 模型來(lái)運(yùn)算得出,可以是離線生成也可以是實(shí)時(shí)驅(qū)動(dòng),離線就是異步的,實(shí)時(shí)就是動(dòng)態(tài)同步的。
再進(jìn)一步,虛擬人相關(guān)內(nèi)容的生產(chǎn)主要涉及到三個(gè)環(huán)節(jié):建模、驅(qū)動(dòng)和渲染,每個(gè)環(huán)節(jié)依靠人還是依靠機(jī)器,以及依靠程度的高低,不同的組合造就了現(xiàn)在市場(chǎng)上不同的虛擬人流派。
小冰的CEO 李笛把目前市場(chǎng)上三種主要的虛擬人流派描述為殊途同歸,大白話講就是當(dāng)前所謂的虛擬人賽道上,三撥不同人馬在往里湊,干內(nèi)容特效的,干偶像運(yùn)營(yíng)的和干人工智能的。
2.1 內(nèi)容特效路線
可以追溯到上節(jié)提到的歷史背景,從動(dòng)畫行業(yè)再到影視 CG 特效,呈現(xiàn)的內(nèi)容目前不具備實(shí)時(shí)互動(dòng)的能力,都是提前生產(chǎn)的,中間部分是通過(guò)設(shè)計(jì)師和藝術(shù)家繪制建模與渲染而成,部分是半人工或機(jī)器生成,比如《速度與激情 7 》中已故演員保羅沃克的戲份就是通過(guò)替身和計(jì)算機(jī)合成。
走影視行業(yè)路線,其商業(yè)模式本質(zhì)是內(nèi)容付費(fèi),因此這類項(xiàng)目方對(duì)于內(nèi)容的精細(xì)度與現(xiàn)實(shí)程度有很高要求,對(duì)立面則是隨之而來(lái)的內(nèi)容制作成本會(huì)很高,根據(jù)相關(guān)媒體報(bào)道,這類作品的成本達(dá)到每秒 8000~15000元不等。
來(lái)源:鳳凰網(wǎng),柳夜熙;
走明星網(wǎng)紅路線,其商業(yè)模式本質(zhì)是廣告變現(xiàn),特點(diǎn)是這類人物內(nèi)容更多以靜態(tài) 3D 為主,然后通過(guò)品牌代言創(chuàng)造營(yíng)收,國(guó)內(nèi)虛擬網(wǎng)紅 IP 案例如柳夜熙、AYAYI 以及翎;在人力成本上,以柳夜熙為例,其背后就包括了一個(gè) 150 人的團(tuán)隊(duì)。
2.2 偶像運(yùn)營(yíng)路線
偶像運(yùn)營(yíng)路線背后主要是做 IP 孵化和 MCN 運(yùn)營(yíng)的機(jī)構(gòu),偶像人設(shè)不強(qiáng)調(diào)互動(dòng),人物的驅(qū)動(dòng)主要依靠背后演員的聲音與動(dòng)作(PS:這種模式也被稱為“中之人”);另一方面在渲染上能夠降低成本,多以二次元畫風(fēng)呈現(xiàn),也能夠提高 IP 塑造與風(fēng)險(xiǎn)控制,因此這類路線更加偏重運(yùn)營(yíng),例如被字節(jié)跳動(dòng)收購(gòu)的 A-Soul 就屬于這個(gè)路線,2021 年 A-Soul 團(tuán)隊(duì)直播年?duì)I收達(dá)到 2500 萬(wàn)元。
來(lái)源:公開網(wǎng)絡(luò),Asoul;
相比于孵化真人網(wǎng)紅,可以避免出現(xiàn) MCN 機(jī)構(gòu)與網(wǎng)紅之間的不可控因素,但在 IP 的管理上仍然是以傳統(tǒng)的模式,一方面虛擬網(wǎng)紅與背后的演員和聲優(yōu)是掛鉤的,因此無(wú)法達(dá)到規(guī);趸@也是為什么沒(méi)有見到成批的洛天依和初音未來(lái)。
2.3 人工智能路線
人工智能的路線直接跳過(guò)了通過(guò)人工驅(qū)動(dòng)虛擬人進(jìn)行互動(dòng),對(duì)于表情、肢體、語(yǔ)言和語(yǔ)音等多模態(tài)融合的技術(shù)要求高,按照小冰 CEO 李笛的說(shuō)法,前兩者路線,第一種人力生產(chǎn)成本高昂,內(nèi)容生產(chǎn)與優(yōu)化周期長(zhǎng),第一種仍然與人掛鉤無(wú)法規(guī)模化,且背后依然是以人為核心,偽人工智能。
針對(duì)前兩者沒(méi)有解決的問(wèn)題,小冰希望通過(guò)機(jī)器路線打造 AI 驅(qū)動(dòng)的虛擬人。目前,小冰的制作不同于影視領(lǐng)域的人工動(dòng)態(tài)捕捉建模與畫面渲染,而是通過(guò)機(jī)器學(xué)習(xí)生成,渲染成本控制在 17 元/秒,大約是傳統(tǒng)影視制作的 1/500,缺點(diǎn)是畫面的精度只有 1080 P,無(wú)法和前者相比,但在手機(jī)上呈現(xiàn)是足夠了。
同時(shí)在人員上,小冰的建模渲染由于是通過(guò)計(jì)算機(jī)生成的,因此沒(méi)有專門的美術(shù)相關(guān)人員,出圖效率可以做到以萬(wàn)計(jì)算,而內(nèi)容的好壞交給市場(chǎng)與用戶去評(píng)判,再根據(jù)用戶偏好矯正與迭代。
來(lái)源:小冰;
另一種基于 AI 的虛擬人場(chǎng)景主要是企業(yè)服務(wù)領(lǐng)域,例如 RPA 辦公流程自動(dòng)化,萬(wàn)科的財(cái)務(wù)部虛擬員工崔筱盼,以及近期紅杉推出的虛擬員工 Hóng ,在近期的宣傳視頻中的 IP 形象依然是提到的第一種路線,通過(guò)頭像設(shè)計(jì)與拍攝后期合成。
來(lái)源:紅杉;
封面:公開網(wǎng)絡(luò)
原文標(biāo)題 : 虛擬人的發(fā)展簡(jiǎn)史與三條路線

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 深圳跑出40億超級(jí)隱形冠軍:賣機(jī)器人年入6.1億,港股上市
- 7 特斯拉Robotaxi上路,馬斯克端上畫了十年的餅
- 8 “AI六小虎”到了下一個(gè)賽點(diǎn)
- 9 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)
- 10 張勇等人退出阿里合伙人