得益于大模型、多模態(tài)和數(shù)字孿生等技術(shù)的進步,AIGC被提到前所未有的關(guān)注度。AI數(shù)字人作為AIGC對外輸出的渠道,也是各大廠商重點發(fā)展的方向。
(資料圖片僅供參考)
在AIGC的推動下,AI數(shù)字人逐漸升級,相較于過去,過去AI數(shù)字人僅僅將2D圖片轉(zhuǎn)換為3D數(shù)字人,用于帶貨、直播等偏娛樂的場景,現(xiàn)在AI數(shù)字人的制作成本降低,其內(nèi)容創(chuàng)作能力生成內(nèi)容生產(chǎn)工具等,可進一步促進企業(yè)降本增效。
風平智能便是AI數(shù)字人領(lǐng)域的早期布局者,據(jù)介紹,旗下風平IP智造平臺是基于AIGC打造的智能化平臺,提供虛擬數(shù)字人定制、AI短視頻內(nèi)容生產(chǎn)和數(shù)字人直播、IP培育和交易等一站式解決方案。
近日,風平智能創(chuàng)始人&CEO林洪祥接受了藍鯨TMT記者專訪,對AIGC行業(yè)的變遷、行業(yè)技術(shù)發(fā)展、以及安全性問題等提出了自己的看法和思考。
從無人問津到門庭若市,做企業(yè)的“1號員工”
林洪祥見證了整個AIGC賽道的發(fā)展,也眼見AI數(shù)字人領(lǐng)域從無人問津到門庭若市。
“去年,整個行業(yè)都還是特別冷門的,今年以來發(fā)展速度連技術(shù)同行都覺得不可思議,尤其是ChatGPT加上數(shù)字人,再加上直播,三大行業(yè)結(jié)合,讓我們一下子就看到了新的機會點。”
林洪祥認為,AIGC是一個媲美移動互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施革命,“20年前,每個公司都在做自己網(wǎng)站,10年前都在做企業(yè)的App,之后就是做小程序、微信公眾號,AI數(shù)字人會是未來AI世界的基礎(chǔ)交互單元,數(shù)字人可以承載很好的信息溝通與傳遞的功能,我們想為每個企業(yè)打造除公司CEO之外最懂企業(yè)的‘1號員工’,成為公司的新‘網(wǎng)站’。 ”
AI數(shù)字人的生成形式目前有兩種,一種是克隆人,另一種是AI創(chuàng)作。克隆人是將現(xiàn)實中的人1:1復刻出來,而AI創(chuàng)作的數(shù)字人則是在現(xiàn)實生活中不存在的,屬于獨一無二的IP。
林洪祥介紹稱,目前,AI數(shù)字人的應用場景已經(jīng)比較豐富,除了主播,還可以做視頻的批量化生產(chǎn),也可以幫助企業(yè)降本增效,在教師、醫(yī)生、律師、明星等行業(yè)通過數(shù)字人去訓練智能大腦,可以讓這些人去獲得一個分身。
IDC數(shù)據(jù)顯示,數(shù)字人應用范疇包括泛娛樂數(shù)字人以及企業(yè)及服務數(shù)字人,預測2026年中國AI數(shù)字人市場規(guī)模將達到102.4億元。
4月份第三方測評數(shù)據(jù)顯示,風平智能供應了市場上80%頭部的數(shù)字人直播品牌,高峰時期,由其服務的AI數(shù)字人,單日直播GMV超億元。
近期,樂華娛樂CEO杜華推出了她的雙生數(shù)字人華華子,專門替自己直播賣貨。在沒有任何宣發(fā)下,僅直播10分鐘直播間內(nèi)人數(shù)就到達了30萬。從直播間可以看到,華華子較為真實的還原了杜華的形象和表現(xiàn)力,#杜華AI華華子直播#也隨即登上了微博熱搜。而華華子正是風平智能為杜華打造出來的克隆人。
“大模型+小樣本”技術(shù)實現(xiàn)降本增效
隨著AI數(shù)字人的發(fā)展,不僅是應用場景更加豐富,IDC認為,現(xiàn)在的數(shù)字人在預訓練大模型的推動下,不但能夠?qū)⒅谱鞒杀窘档?,在更短的時間內(nèi)賦予數(shù)字人獨特的外貌、性格、特長,還能夠?qū)⑵湓趯兕I(lǐng)域進行內(nèi)容創(chuàng)作的能力,作為內(nèi)容生產(chǎn)工具幫助企業(yè)降本增效。
對此,林洪祥解釋稱,在沒有“大模型+小樣本”技術(shù)之前,原來AI數(shù)字人,尤其是外形制造領(lǐng)域,首先要對一個人進行深度的采集,深度采集這個人的模型需要幾十個小時。
“采集一天,有效時間可能只有兩三個小時,所以經(jīng)常需要采集十幾天才能完成深度建模,成本是很高的,大概在十幾萬到二十萬之間。”林洪祥稱。
“大模型+小樣本”技術(shù)產(chǎn)生之后,成本下滑就非常明顯了?!氨热纾幻鸆EO只需要5分鐘的時間拍攝一個視頻,結(jié)合大模型技術(shù)就可以克隆一個一模一樣的數(shù)字分身,這樣一來,其后續(xù)去做視頻的生產(chǎn)成本就很低了?!绷趾橄楸硎?。
據(jù)介紹,與市場主流方案相比,風平智能的風平IP智造平臺能讓AI數(shù)字人的成本降低90%、效率提升500%。
“大模型+小樣本”技術(shù)將這個行業(yè)的成本降至數(shù)千元級別,“這樣的級別就克服了原來的商用化困難,進而推動了更多領(lǐng)域可商用?!?/p>
林洪祥認為,這在效率上表現(xiàn)得更加明顯。“例如在直播或者視頻錄制中,很多人不擅長鏡頭語言表達,很難一次性流暢地通過整個拍攝。但數(shù)字人甚至比真人的表現(xiàn)力更好,表達流暢,不會出現(xiàn)忘詞、發(fā)音不準或者精神疲憊的狀態(tài)。這個數(shù)字人可以在相關(guān)員工的組織下,無縫批量化高效率生產(chǎn)視頻,這在效率上是一個極大的提升。此外,類似CEO、明星等這類人群,可能平時工作會非常忙,數(shù)字人也可以將他們從重復工作中解脫出來?!?/p>
當然,林洪祥也坦承,AI數(shù)字人是有一定缺點的,并不能完全替代人類,“比如在直播間,需要更換衣服時,AI數(shù)字人不能完成,這一場景的實現(xiàn)成本還是比較高的,因為衣服的建模要實現(xiàn)物理質(zhì)感,比如垂墜感等,這在建模中的成本非常高?!?/p>
人類或與AI共同構(gòu)成未來新世界,安全問題成行業(yè)重要考量
以直播為例,采用數(shù)字人進行直播,平臺目前對于兩種直播模式的政策沒有區(qū)別,與真人直播的審核情況相同。數(shù)字人主播的行為與直播話術(shù)都是由程序控制的,在敏感詞、違禁詞方面訓練得好,出現(xiàn)違規(guī)或封禁的概率會大大降低。
盡管AI數(shù)字人給我們的生活帶來了諸多便利,但同時也存在著風險,尤為突出的是個人隱私泄露和侵權(quán)等問題。
林洪祥表示,AIGC是一把雙刃劍,用到好的地方能產(chǎn)生巨大的價值,用在壞的地方可能會成為壞人的幫兇,他認為人類的未來,跟 AI之間會有一場生死之戰(zhàn)。
據(jù)林洪祥介紹,風平智能公司的名字,來自風平浪靜,英文名字叫full peace?!拔覀兊氖姑窍M较⑦@場戰(zhàn)爭,讓一切變得風平浪靜,讓人類能進入一個風平浪靜的AI幸福世界?!?/p>
他認為,很可能是人類跟AI一起來構(gòu)成新的未來世界,AI應該納入國家級別,甚至是世界級別的強監(jiān)管體系。
據(jù)悉,風平智能采用了專利技術(shù)的5AS風險管理系統(tǒng)。該系統(tǒng)涵蓋了算法分析、安全篩選、授權(quán)審核、內(nèi)容修正和信息追蹤等環(huán)節(jié),通過這一綜合的管理流程,能夠及時識別潛在的侵權(quán)風險,包括對生成的數(shù)字人進行授權(quán)審核,確保僅在獲得本人或相關(guān)權(quán)利方的明確授權(quán)下使用。
林洪祥認為AI數(shù)字人只有實現(xiàn)高質(zhì)量、安全可控發(fā)展,才能造福全人類。“高質(zhì)量是為了勝任不同的工作場景,安全可控是為了使這個技術(shù)有益于人類的發(fā)展。我們想讓AI數(shù)字人擁有漂亮的外表和有趣的靈魂。”