曾經(jīng)遙不可及的數(shù)字人,如今在網(wǎng)絡(luò)直播、信息播報(bào)等場景已不新鮮。百度智能云AI人機(jī)交互實(shí)驗(yàn)室負(fù)責(zé)人李士巖甚至放話:“兩年內(nèi)每個(gè)人有望實(shí)現(xiàn)‘數(shù)字人自由’。”那么制作一個(gè)數(shù)字人需要多少錢呢?“便宜的幾萬元,貴一些的需要上百萬元,更精細(xì)且并發(fā)要求高的,上千萬元的也會有”,這是他向記者透露的價(jià)格。
以國內(nèi)外發(fā)展成熟度較高的數(shù)字人主播為例,記者從多家數(shù)字人創(chuàng)業(yè)公司處了解到,定制一個(gè)卡通風(fēng)格的數(shù)字人在3萬-5萬元,再加面部及全身動(dòng)作捕捉、電腦和手機(jī)直播系統(tǒng)共9萬-20萬元。
對于企業(yè)而言,這不是一筆大數(shù)目,但距離普通用戶還有門檻,就像數(shù)字人服務(wù)公司工作人士透露的:“我們的客戶多是企業(yè),購買數(shù)字人直播服務(wù)的也多是有團(tuán)隊(duì)的主播,幾乎沒有個(gè)人主播。”
幾萬元到千萬元
“我們公司最貴的是超寫實(shí)數(shù)字人,你可以理解為是根據(jù)真人制作的數(shù)字人,光數(shù)字人定制一個(gè)就需要50萬-70萬元”,在數(shù)字人定制企業(yè)工作的張鐸(化名)向記者介紹。根據(jù)他提供的信息,該公司可以提供數(shù)字人全服務(wù)流程,生產(chǎn)流程包括雕刻身體高模、制作擬真布料衣服、拓?fù)渚W(wǎng)格和生成毛發(fā)、繪制PBR貼圖、綁定骨架和面捕表情、配置實(shí)時(shí)渲染。
以可實(shí)現(xiàn)直播的數(shù)字人為例,張鐸所在公司提供的是一整套解決方案,價(jià)位由低到高依次是卡通數(shù)字人、二次元數(shù)字人、擬真人數(shù)字人、超寫實(shí)數(shù)字人。一個(gè)卡通級別的數(shù)字人+面部表情+動(dòng)作捕捉,再加一套可同時(shí)配置在電腦和手機(jī)上的軟硬件直播系統(tǒng),不超過20萬元,二次元級別的數(shù)字人加同一配套技術(shù)和系統(tǒng)的價(jià)位在20萬-28萬元之間,擬真人數(shù)字人系列40萬-45萬元。
李鳴(化名)工作的數(shù)字人定制公司,定價(jià)比張鐸的公司更細(xì)化。根據(jù)李鳴分享的資料,如果想要定制一個(gè)可以直播的數(shù)字人,需要購買兩個(gè)項(xiàng)目,一個(gè)是數(shù)字人形象定制開發(fā),另一個(gè)是數(shù)字人直播技術(shù)。
“卡通風(fēng)格的數(shù)字人3萬-5萬元一個(gè),真人風(fēng)格的10萬-20萬元一個(gè)。數(shù)字人直播技術(shù)中的面部及全身動(dòng)作配置的價(jià)格,和數(shù)字人的風(fēng)格有關(guān),卡通風(fēng)格的1萬-3萬元一個(gè),真人風(fēng)格數(shù)字人5萬元一個(gè)。動(dòng)捕服及配置服務(wù)都是5萬元一套,配置完成后就可以用這個(gè)數(shù)字人直播了”。也就是說,按照李鳴的報(bào)價(jià),想要買一個(gè)能直播的數(shù)字人和系統(tǒng)最少需要花9萬元。
在百度B2B平臺愛采購平臺,也有不少數(shù)字人商品在售,但不論是智能數(shù)字客服、虛擬主播、智能理財(cái)顧問、虛擬偶像等數(shù)字人的價(jià)位都統(tǒng)一是50萬元/套。
做一款要2-6周
按照李士巖對數(shù)字人的歸類,數(shù)字人分為服務(wù)型、演藝型兩類,服務(wù)型包括虛擬員工、數(shù)字客服、數(shù)字理財(cái)專員、虛擬培訓(xùn)師,演藝型包括虛擬主播/主持人、虛擬偶像、虛擬IP/明星、數(shù)字二分身。相比之下,演藝型數(shù)字人在臺前的機(jī)會更多,更容易與大眾接觸。B站控股公司旗下的虛擬歌手洛天依、基于人工智能小冰框架的虛擬歌手何暢、斗魚虛擬主播“那小巖”等都屬于演藝型數(shù)字人
“目前虛擬主播、虛擬偶像等面向C端用戶的數(shù)字IP類的數(shù)字人,發(fā)展成熟度較高,也是商業(yè)化競爭最為激烈的領(lǐng)域。虛擬教師、虛擬客服等服務(wù)型數(shù)字人是未來有望得到突破的細(xì)分領(lǐng)域,從更長期來看,作為元宇宙的重要行為主體,虛擬分身類數(shù)字人可能進(jìn)入快速發(fā)展階段”,歐科云鏈高級研究員蔣照生向記者直言。
元宇宙概念火熱,和數(shù)字人關(guān)聯(lián)度很高的智能助手早被預(yù)言有可能人手一個(gè)。那除了價(jià)格,還有什么在拖數(shù)字人規(guī)模后應(yīng)用的后腿?李士巖認(rèn)為是產(chǎn)能。
在談到目前數(shù)字人為何沒有定價(jià)標(biāo)準(zhǔn)時(shí),蔣照生也提到了產(chǎn)能不足,“數(shù)字人產(chǎn)業(yè)目前整體成熟度不高,市場競爭十分激烈,加上目前國內(nèi)多數(shù)應(yīng)用場景都需要高度定制化的數(shù)字人設(shè)計(jì),導(dǎo)致其無法快速復(fù)制推廣,所以市場并未出現(xiàn)統(tǒng)一的定價(jià)標(biāo)準(zhǔn)”。
當(dāng)前制作虛擬人,大部分仍采用3D建模+動(dòng)作捕捉,這種傳統(tǒng)的方式,可以生產(chǎn)出電影畫質(zhì)的虛擬人,精致細(xì)膩,但成本很高,無法生產(chǎn)更多虛擬人。按照張鐸給出的制作周期,“制作一款卡通數(shù)字人需要2周左右,二次元數(shù)字人需要4周,擬真人的數(shù)字人需要6周時(shí)間”。按照李士巖的計(jì)劃,“未來數(shù)字人一定是人工智能制作的,只有這樣才能滿足未來大量海量需求。希望在最近兩年內(nèi),通過百度智能云曦靈平臺的開放,讓每個(gè)人實(shí)現(xiàn)數(shù)字人自由”。
企業(yè)定制的多
只有定制這一條路子嗎?也不是。有數(shù)字人服務(wù)商也提供租賃服務(wù)。“就是租用我們已經(jīng)定制好的數(shù)字人,再搭配直播要使用的硬件和系統(tǒng),但是租的客戶很少”,張鐸透露。至于購買數(shù)字人的都是哪些客戶,張鐸和李鳴都明確表示:企業(yè)客戶下單的多。“就算是主播購買,也多是有團(tuán)隊(duì)的主播”,李鳴補(bǔ)充。
記者在和百度數(shù)字人平臺曦靈的客服溝通時(shí),對方也直言:“我們提供的是一個(gè)定制化的解決方案,價(jià)格比較高,是針對一些大型的企業(yè),比如給銀行做一個(gè)數(shù)字人助手等,不是針對普通用戶的。”
回到數(shù)字人主播這個(gè)分支,斗魚相關(guān)負(fù)責(zé)人向記者透露了推出數(shù)字人主播的初衷,“直播行業(yè)發(fā)展到當(dāng)前階段,用戶對直播內(nèi)容豐富度、多元化的要求越來越高。數(shù)字人主播的出現(xiàn)能豐富平臺內(nèi)容生態(tài)、為用戶提供更多元化的互動(dòng)玩法,也能夠在流量變現(xiàn)、IP變現(xiàn)方面為直播平臺提供更大的想象空間。斗魚從2019年起開始主播技術(shù)研發(fā),陸續(xù)推出近10位官方數(shù)字人主播”。
對比各種直播場景,蔣照生認(rèn)為“目前新聞報(bào)道或其他僅需要簡單問答交互的場景,比較適合數(shù)字人主播”。
那在最早出現(xiàn)的秀場直播場景下呢?主播對數(shù)字人主播的態(tài)度沒有給出統(tǒng)一答案。
主播Zoe(化名)就向記者直言,“沒聽過也不考慮,更沒有關(guān)注過數(shù)字人主播”。她的理由是“網(wǎng)絡(luò)直播已經(jīng)是虛擬環(huán)境了,用戶接納程度太低,數(shù)字人主播會影響用戶的消費(fèi)欲望,一些簡單的場景可以應(yīng)用,但秀場直播受情感因素和消費(fèi)初衷等因素影響不適合數(shù)字人主播”。
Vova(化名)的態(tài)度截然不同。她關(guān)注數(shù)字人直播是因?yàn)?ldquo;看到過映客有主播用過,本來以為是動(dòng)畫效果,后來才知道觀眾看到的數(shù)字人捕捉的是幕后真人主播的動(dòng)作和表情。我也想過自己做一個(gè),但是數(shù)字人直播最好用電腦實(shí)現(xiàn),比較麻煩。我對自己的顏值和裝扮比較自信,后面就不考慮了”。
數(shù)字人主播背后的真人主播更有發(fā)言權(quán),運(yùn)營映客數(shù)字人主播“會唱歌的熊貓”的主播,在回答做數(shù)字人主播和普通主播有什么區(qū)別時(shí)告訴記者,“沒什么不同,一定要說區(qū)別的話,那就是在幕后會更自在一些,有些主播比較羞澀,我覺得在這種情況下,用數(shù)字人主播會更舒服”。(記者 魏蔚)