版權問題一直是困擾視頻行業發展的一大瓶頸,隨著人工智能技術的逐漸成熟,這一問題也有望得到解決。
日前,阿里大文娛集團聯合阿里巴巴達摩院共同發布了名為“鯨觀”的全鏈路數字版權服務平臺。據悉,該平臺通過搭載達摩院iDST(數據科學技術研究院)的人工智能技術,可實現對視頻的智能編輯,同時在音視頻素材上抽取“指紋”,讓其在全網范圍可追溯。
這也是阿里達摩院自成立以后,研究成果的首次落地。阿里巴巴達摩院iDST首席科學家兼副院長任小楓告訴21世紀經濟報道記者:“馬老師(指馬云)給我們定的目標非常高,我們要做的就是解決未來的問題?!逼渲芯桶ㄒ曨l行業的版權保護問題。
解決盜版難題
近年來,視頻行業得到了迅猛的發展。據中國互聯網絡信息中心第40次《中國互聯網絡發展狀況統計報告》顯示,截至2017年6月,中國網絡視頻用戶規模已達到5.65億。
與之對應的是視頻數量的爆發。據今日頭條創始人張一鳴近日表示,僅今日頭條旗下的平臺,每天就有超過2150萬條短視頻上傳。但是,隨著行業的迅猛發展,“搬運工”、“剪刀手”等侵權現象也變得日益突出,如何更高效地進行版權保護,成為視頻行業發展的當務之急。
任小楓告訴21世紀經濟報道記者,指紋對于視頻的版權保護來說非常重要。如果能夠像指紋一樣去計算視頻的精確特征,那就可以對每一個視頻實現唯一的匹配。
以往,侵權者會通過加logo、壓縮分辨率或者調整亮度等一系列操作來改變某一視頻的特征?!暗ㄟ^指紋技術,就能夠在各種各樣的變化中找出他們,現在我們已經可以去分辨多場景的視頻,且準確率在99%以上?!比涡髡f。
實現這一成果的背后,人工智能功不可沒。據悉,鯨觀平臺在處理視頻時,會利用達摩院iDST的人工智能技術對視頻內容進行各個維度的分析,并為之打上兩萬余種標簽,同時利用知識圖譜對標簽進行多維度編目。這樣一來,視頻內容就變得可識別和搜索了。
另據21世紀經濟報道記者了解,除了精準的識別技術外,鯨觀平臺在視頻處理效率上也實現了突破。目前,其通過一臺機器就可以處理近30萬小時的視頻。
任小楓告訴記者,這是因為該平臺采用了一個“二值”的索引引擎。簡單來說,就是把視頻所有的變化都轉化成“二值”,即零或一,這樣便能簡化視頻的指紋特征,使得存儲和計算速度得到大幅提升。
目前,鯨觀平臺上視頻的下載、解碼、編碼都能夠達到毫秒級的處理速度,5分鐘時長的視頻經過上述全鏈路處理可在10秒內完成。更為重要的是,在這個過程中,視頻的精度不會損失,和原始特征一模一樣。
視頻技術接近美國
今年6月,任小楓加入阿里擔任阿里巴巴iDST首席科學家和副院長。資料顯示,iDST是阿里巴巴負責人工智能技術研發的核心團隊,成立于2014年,由一批杰出的科學家及工程師組成,分布在杭州、北京、西雅圖、硅谷等地。
而在此之前,任小楓是亞馬遜級別最高的華人科學家。他從2013年開始任職于亞馬遜無人零售店AmazonGo部門,并領導計算機視覺算法團隊。因此,其對計算機視覺領域中的圖像分類、物體識別、跟蹤、檢測、事件檢測等均有全面且深入的理解。
任小楓告訴21世紀經濟報道記者,對于視頻技術,他有很多期望,這次與阿里大文娛一起發布鯨觀平臺,也是希望視頻技術在這個平臺上能夠得到鍛煉和提高。
加入阿里以后,任小楓仍專注于計算機視覺領域的研究,并主攻圖像視頻內容的識別和理解。在他看來,目前的工作內容其實與在亞馬遜并無太大差異,都是對動態的人體或者物體進行檢測,同時對其姿態、動作進行分析等。
從技術角度來說,動態的視頻要比靜態的圖片更加難以識別和分析。以人臉識別為例,在視頻中就可能會受到分辨率、角度、距離等因素的影響。“為解決這些問題,我們選擇使用超深卷積網絡,并對模型簡化加速,從而實現精準的人臉檢測、跟蹤、識別?!比涡髡f。
但對于這位技術大牛而言,他腦海中對視頻的理解,并不是簡單的給視頻加上一些標簽,而是要能對視頻內容更加細致的理解和分析。比如有些視頻的人物、場景都無法識別,但可以分析他們的關系;或者可以對一些動作、行為進行識別和分析。這也將是阿里巴巴iDST未來要研究的方向。
任小楓坦言,視頻技術正處于快速發展的階段,他自己也在思考,除了提升現有的一些技術應用外,還有沒有新的領域可以進行探索。
而在談及中美的技術差異時,他告訴記者,中國在人工智能技術上與美國其實還是有一些差距,不過,在人臉和圖像的識別技術上,這個距離已經非常接近。