隨著數(shù)字化浪潮的不斷推進(jìn),我國(guó)數(shù)字經(jīng)濟(jì)的發(fā)展布局越發(fā)明晰。今年的政府工作報(bào)告提出,要深入推進(jìn)數(shù)字經(jīng)濟(jì)創(chuàng)新發(fā)展。深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,開(kāi)展“人工智能+”行動(dòng),打造具有國(guó)際競(jìng)爭(zhēng)力的數(shù)字產(chǎn)業(yè)集群。
這是政府工作報(bào)告首次提出開(kāi)展“人工智能+”行動(dòng),標(biāo)志著人工智能技術(shù)在各行業(yè)的廣泛應(yīng)用將開(kāi)啟新篇章。作為人工智能技術(shù)的重要應(yīng)用,數(shù)字人產(chǎn)業(yè)也備受矚目。“數(shù)字人”如何誕生?數(shù)字人產(chǎn)業(yè)發(fā)展現(xiàn)狀如何?哪些應(yīng)用領(lǐng)域?qū)⒊蔀闊狳c(diǎn)?未來(lái)可能面臨哪些挑戰(zhàn)和機(jī)遇?帶著這些問(wèn)題,中國(guó)經(jīng)濟(jì)時(shí)報(bào)記者采訪了多家相關(guān)企業(yè)及多位行業(yè)專(zhuān)家。
數(shù)字人是指通過(guò)計(jì)算機(jī)技術(shù)、人工智能技術(shù)等手段,創(chuàng)建出的具有人類(lèi)特征、能夠模擬人類(lèi)行為的虛擬形象。從功能應(yīng)用來(lái)看,其主要包括內(nèi)容/IP型數(shù)字人、功能服務(wù)型數(shù)字人和虛擬分身數(shù)字人三大類(lèi)。它們可以在虛擬世界中存在,并與現(xiàn)實(shí)世界進(jìn)行交互,被廣泛應(yīng)用于娛樂(lè)、教育、醫(yī)療、游戲、營(yíng)銷(xiāo)等多個(gè)領(lǐng)域。
技術(shù)進(jìn)步是數(shù)字人產(chǎn)業(yè)發(fā)展的第一推動(dòng)力。近年來(lái),隨著計(jì)算機(jī)圖形學(xué)、深度學(xué)習(xí)、虛擬現(xiàn)實(shí)等技術(shù)的不斷突破和進(jìn)步,數(shù)字人在表情、動(dòng)作、語(yǔ)音等方面的模擬能力日益增強(qiáng),逼真度不斷提高。尤其是極具顛覆性的文生視頻模型Sor a的推出,其能夠根據(jù)文本指令生成多種風(fēng)格、不同畫(huà)幅、最長(zhǎng)為一分鐘的高清視頻。在業(yè)內(nèi)看來(lái),Sora的出現(xiàn)將成為AI認(rèn)知世界并與之進(jìn)行交互的里程碑,也讓通用人工智能(AGI)到來(lái)的時(shí)間提前,將給整個(gè)產(chǎn)業(yè)帶來(lái)巨大進(jìn)步。而對(duì)于數(shù)字人產(chǎn)業(yè)來(lái)說(shuō),Sora深入的理解能力、強(qiáng)大的生成能力以及生動(dòng)的互動(dòng)能力,也給數(shù)字人在未來(lái)構(gòu)建更加逼真的虛擬世界提供了新的視角和方法。