傳動網 > 新聞頻道 > 行業資訊 > 資訊詳情

巨頭造“人 一場AI較量

時間:2022-07-13

來源:控制工程網

導語:AI既是數字人的基礎,也決定了數字人能力的天花板。

  AI既是數字人的基礎,也決定了數字人能力的天花板。

  “百度世界大會的一大看點正是火出圈、成頂流的數字人。”

  7月6日,百度世界大會預溝通會上,百度高級副總裁袁佛玉著重介紹了當下數字人的發展情況。

  讓人印象深刻的是在信息密集、節奏緊湊的預溝通會中,主持人度曉曉始終應對自如,其間“她”還向百度高級副總裁袁佛玉問了一個關于自己的問題。而在剛剛過去的6月,度曉曉用40秒鐘時間完成了40篇高考全國卷的命題作文,驚艷眾人。就在今天,度曉曉還將直播挑戰上海高考英語作文。

  眼下不止是百度在打造數字人,包括阿里、網易、騰訊、字節、華為等都推出了類似產品。巨頭下場造“人”不單是具有打造IP的能力,從某種意義上講,數字人是衡量科技企業技術集成與整合能力的標尺。

  一位業內人士認為:“科技公司以IP的方式,全方位呈現各自能力,這背后其實是各自生態展示肌肉的表現形式。”

  一、數字人“纏斗”

  巨大的市場潛力,是巨頭批量制造數字人的直接原因。

  日前,IDC發布的報告顯示,中國AI數字人市場規模呈現高速增長趨勢,預計到2026年將達102.4億元人民幣。而巨頭推出各種各樣的數字人,看似雜亂無章,實際皆有深層次的考量。

  騰訊數字人的基底是建立在語音智能和大文娛生態上的。語音智能方面,根據語義匹配對應動作、字詞的能力,是騰訊數字人在技術上的底色。此外,微信上的實時語音轉換與翻譯,所產生的海量數據,使得其語音會話能力能夠經過翻譯和轉化而持續生長。

  推動騰訊發布數字人的動因是鞏固大文娛生態。“云小微數智人平臺”由播報數智人平臺與交互數智人平臺兩個系統組成。對應的落地場景為手語主播、數字導游、數字客服、虛擬IP偶像等虛擬資產。

  同樣身處文娛市場的字節跳動,雖然在IP與版權資源上的積累有限,但是通過連續不斷地投資與人才引入,一個AI+XR的軟硬協同生態正日益明顯。

  塑造IP較為成功的還有阿里,其曾借著冬奧會,推出了自己的數字人“冬冬”,展示其肌肉。透過冬冬可以發現,由于AI實時驅動,數字人說話的同時,能協調嘴形、表情、動作,乃至模擬真實環境下的部分場景。而且采用了面向高質量圖形的Unity高清渲染管線(HDRP),因此在視覺上有著不輸AR/VR的效果。

  阿里數字人早已開始直播帶貨,用AI“平替”主播。從邏輯上講,數字人帶貨能夠解決真人帶貨的種種局限和各類不可預測的風險。

  AI驅動是百度的數字人的最大特點,靠著硬實力,截至目前打造了多個不同面向的IP,如度曉曉、希加加、文夭夭,覆蓋了功能型與演藝型兩個大類。

  百度AI數字人度曉曉

  度曉曉和文夭夭創造了功能型數字人的兩個范式。前者能力全面,后者則主要面向垂直領域。度曉曉不單是一個CG或者問答環節的數字人,而是能夠勝任各類創意型工作,能夠作文、作詞、作曲、作畫,開辟了一個AIGC的內容生產模式。文夭夭為數字人運營細分領域,打開了市場,通過AI技術為文博領域提供新玩法。

  演藝型數字人希加加,早前在集度汽車發布會上亮相,一度驚艷業內,百度也成為業內率先嘗試在會展領域引入數字人的巨頭。

  百度AI數字人希加加

  看得出或許是由于尋求技術突破的周期長、難度高,現下大部分廠商皆圍繞自身長處,推出數字人。

  像網易林幺幺通過接入AI算法,主要應用到電商帶貨中。科大訊飛,雖然沒有騰訊、網易、阿里那樣強大的圖像處理能力,但是從“冰冰”與“加加”兩個虛擬IP來看,其核心還是輸出科大訊飛的語音交互能力。

  二、百度整“花活兒”

  不難發現,時下的數字人更像是一個載體,要么搭載內容與場景,要么搭載各類技術,正是因為這個原因,巨頭們才不遺余力造“人”。

  在梳理之中我們也能看到,無論是知識庫與交互,還是算法與建模,AI都扮演了舉足輕重的角色,不過分地說,數字人的競爭本質上其實是AI能力的競爭。

  而百度可以在短短兩年多時間內接連推出度曉曉、希加加、文夭夭等特點、功能、使用場景截然不同的數字人IP,表明“AI路線”的潛能。

  在今天的百度世界大會預溝通會上,百度高級副總裁袁佛玉提到,百度AI驅動的數字人的不同在于“可交互”性,而且還具備創作能力。

  把時間回撥到2020年,那年百度世界大會上,度曉曉被定義為“智能助理”而首度問世,彼時,人們只是感受到了AI原來并非那么冷冰冰,而是可以有溫度,這顛覆了傳統認知中,技術都是冷冰冰的陳見。

  “智能助理”的定位意味著百度需要持續解決人的各類需求,全方位應對信息輸入、處理、輸出的挑戰。僅僅通過營銷方式制造IP,讓市場接受數字人,似乎有些追本逐末。事實上,隨著入局玩家、搭載場景的增加,以及競爭走向激烈,市場走過新奇階段時,技術能力將起到決定性作用。

  數字人為百度提供了AI技術落地的場景之一。之所以度曉曉們能夠有極強的互動性,與之溝通更絲滑,主要原因在于由文心大模型、AI超寫實建模所構成的AI內核。

  由于數據、算法和算力出現巨大增長,人工智能發展開始轉向泛化能力與通用性強的預訓練大模型。在百度文心大模型加持下,數字人在生產與創意類應用中的潛能也得到了釋放。

  日前,像度曉曉迅速完成高考作文,以唱作人的身份推出《每分每秒每天》單曲,作出“無界”系列畫作,表明百度數字人已經具備面向多領域能力。而且其創意能力,或將掀起UGC與PGC兩大生產方式之外,一種全新的內容生產方式:AIGC。

  具體而言,百度文心大模型,讓數字人能夠通過AI技術以自動編排合成的方式生產內容。

  AIGC將完全解放內容生產力,滿足一些對時效性要求較高的領域。例如新聞,過去完全依賴人工創作與審校,即便如此,走完三審三校流程之后,新聞時效性已經大打折扣,而且還可能出現“謬誤”。AIGC的出現解決了依賴人工創作,在可靠性與效率上的劣勢。

  今年兩會時,度曉曉就曾在兩會報道中與工人日報開辟了專欄《兩會曉曉說》,為融媒體報道帶來一種耳目一新的體驗。

  憑借在AI方面的積累,百度可以在AI各落地場景中玩各種“花活兒”,無論是作為功能型數字人的智能助理度曉曉,還是作為表演型的“虛擬車主”希加加。

  反之,我們甚至可以認為,AI既是數字人的基礎,也決定了數字人能力的天花板。

  “數字人生產周期,從動輒幾個月,縮短到小時級別。”袁佛玉在預溝通會上提到,由于百度積累了深厚的AI底層技術,其數字人的成本和制作周期優勢將逐漸顯現。

  三、短期拼場景,長期拼AI

  任何技術,如果不能創造價值,很難持續,正是因為巨頭們看到數字人背后的巨大寶藏,眼下才會魚貫而入。

  數字人需要走過如下幾個階段“外表像人,對話像人、作為人的幫手”,AI覆蓋了整個過程。無論是AI建模,還是NLP,或者是更為深入的知識圖譜與百度文心大模型所帶來新的AIGC生產模式。

  事實是,數字人短期拼場景,長期拼AI。

  短期來看,市場對數字人還處于“新奇”階段,因此主要應用場景集中在廣告、電商、游戲領域。這也是為什么,主要受到文娛行業的追捧。

  這里需要提到一點,作為另一種IP形式,數字人風險可控,只要不過度營銷,較少出現翻車的情況。在偶像頻繁塌方的情況下,確實能夠填補一定市場,可是如果AI能力不能進一步提升,真正縮小與人的距離,天花板也不會太高。

  市場遲早會來到成長與成熟階段,所以從長期來看,無論是文娛,還是教育、服務、金融,AI的效能將會持續釋放。

  而另一頭,AI能力也將改變當下各方混戰的格局。眼下百度“AI路線”,已經提前完成了布局,只需要等待從春秋到戰國。

  到那時,沒有了新奇,人們只會問如下問題:你能幫我解決什么問題。

  顯然,百度已經寫就了答案。


AI
中傳動網版權與免責聲明:

凡本網注明[來源:中國傳動網]的所有文字、圖片、音視和視頻文件,版權均為中國傳動網(www.hysjfh.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“中國傳動網”,違反者本網將追究其法律責任。

本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。

如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。

關注伺服與運動控制公眾號獲取更多資訊

關注直驅與傳動公眾號獲取更多資訊

關注中國傳動網公眾號獲取更多資訊

最新新聞
查看更多資訊

熱搜詞
  • 運動控制
  • 伺服系統
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅系統
  • 工業電源
  • 電力電子
  • 工業互聯
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯接
  • 工業機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0