手機(jī)也可以訓(xùn)練視頻識別模型?麻省理工給您答案!

時間:2019-12-18

來源: AiChinaTech

導(dǎo)語:這項新技術(shù)有助于減少現(xiàn)有計算機(jī)視覺商業(yè)應(yīng)用中的延遲和計算成本。它可以通過加速自動駕駛汽車對傳入視覺信息的反應(yīng),讓它們變得更安全。還可以解鎖以前無法實現(xiàn)的新應(yīng)用,比如讓手機(jī)幫助診斷病人或分析醫(yī)學(xué)圖像。

        近日,麻省理工學(xué)院和IBM沃森人工智能實驗室的研究人員開發(fā)了一種新技術(shù),可以在處理能力非常有限的手機(jī)或其他設(shè)備上訓(xùn)練視頻識別模型。用戶可以上傳任何照片,并編輯建筑物、植物群和固定裝置外觀的工具。視覺識別作為深度學(xué)習(xí)的最強(qiáng)技能,已經(jīng)成為了計算機(jī)視覺算法可用來分析醫(yī)學(xué)圖像,使自動駕駛汽車成為可能,并驅(qū)動人臉識別的發(fā)展。

        通常算法將視頻分割成圖像幀,并在每個幀上運(yùn)行識別算法。然后通過觀察對象在隨后的幀中的變化,將視頻中顯示的動作拼接在一起。該方法要求算法“記住”它在每一幀中看到的內(nèi)容,以及它看到這些內(nèi)容的順序。新方法中,算法提取每一幀對象的基本草圖,并將它們疊加起來。算法可以觀察草圖中物體在空間中的移動,而不是記住什么時候發(fā)生了什么。在測試中,研究人員發(fā)現(xiàn),這種新方法訓(xùn)練視頻識別模型的速度是現(xiàn)有方法的三倍。它還能通過一臺小型電腦和照相機(jī)來識別手勢,這些設(shè)備的電量僅夠給自行車燈照明用。

        這項新技術(shù)有助于減少現(xiàn)有計算機(jī)視覺商業(yè)應(yīng)用中的延遲和計算成本。它可以通過加速自動駕駛汽車對傳入視覺信息的反應(yīng),讓它們變得更安全。還可以解鎖以前無法實現(xiàn)的新應(yīng)用,比如讓手機(jī)幫助診斷病人或分析醫(yī)學(xué)圖像。

        麻省理工學(xué)院和IBM沃森人工智能實驗室的研究是這一日益增長的趨勢的一部分,這種趨勢將最先進(jìn)的模型縮小到更易于管理的規(guī)模,也為計算機(jī)視覺領(lǐng)域找到了更多的落地方向。

        當(dāng)前計算機(jī)視覺的應(yīng)用場景主要有以下幾個方向:

        人臉識別

        相關(guān)數(shù)據(jù)顯示人臉識別是人工智能計算機(jī)視覺領(lǐng)域中最熱門的應(yīng)用。人臉識別技術(shù)目前已經(jīng)廣泛應(yīng)用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療等行業(yè)。據(jù)業(yè)內(nèi)人士分析,我國的人臉識別產(chǎn)業(yè)的需求旺盛,需求推動導(dǎo)致企業(yè)敢于投入資金。目前,該技術(shù)已具備大規(guī)模商用的條件,未來三到五年將高速增長。而今年,這一技術(shù)有望在金融與安防領(lǐng)域迎來大爆發(fā)。

        代表企業(yè):曠視科技、依圖科技、商湯科技、極鏈科技、云從科技等。

        視頻監(jiān)控

        視頻監(jiān)控分析是人工智能計算機(jī)視覺領(lǐng)域中第二大熱門應(yīng)用。人工智能技術(shù)可以對結(jié)構(gòu)化的人、車、物等視頻內(nèi)容信息進(jìn)行快速檢索、查詢。這項應(yīng)用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能。在大量人群流動的交通樞紐,該技術(shù)也被廣泛用于人群分析、防控預(yù)警等。

        視頻監(jiān)控領(lǐng)域盈利空間廣闊,商業(yè)模式多種多樣,既可以提供行業(yè)整體解決方案,也可以銷售集成硬件設(shè)備。將技術(shù)應(yīng)用于視頻及監(jiān)控領(lǐng)域在人工智能公司中正在形成一種趨勢,這項技術(shù)應(yīng)用將率先在安防、交通甚至零售等行業(yè)掀起應(yīng)用熱潮。

        代表企業(yè):商湯科技、曠視科技、依圖科技等。

        圖片識別分析

        靜態(tài)圖片識別應(yīng)用熱度在視覺與圖像領(lǐng)域中排名第三。將人工智能技術(shù)單純用于圖片識別分析的應(yīng)用企業(yè)數(shù)量并不如預(yù)想的多,可能有以下幾個方面原因:

        1、目前視頻監(jiān)控方向的盈利空間大,眾多企業(yè)的注意力都放在了視頻監(jiān)控領(lǐng)域。

        2、人臉識別屬于圖片識別的一個應(yīng)用場景,做人臉識別的大多數(shù)企業(yè)同時也在提供圖片識別服務(wù),但是銷售效果不佳,主要贏利點還在于人臉識別。

        3、圖片識別大多商用場景還屬于藍(lán)海,潛力有待開發(fā)。

        4、圖片數(shù)據(jù)大多被大型互聯(lián)網(wǎng)企業(yè)所掌握,創(chuàng)業(yè)公司數(shù)據(jù)資源稀少。

        代表企業(yè):曠視科技、極鏈科技、碼隆科技等。

        無人駕駛

        隨著汽車的普及,汽車已經(jīng)成為人工智能技術(shù)非常大的應(yīng)用投放方向,但就目前來說,想要完全實現(xiàn)自動駕駛/無人駕駛,距離技術(shù)成熟還有一段路要走。不過利用人工智能技術(shù),汽車的駕駛輔助的功能及應(yīng)用越來越多,這些應(yīng)用多半是基于計算機(jī)視覺和圖像處理技術(shù)來實現(xiàn)。

        代表企業(yè):縱目科技、Waymo、圖森科技、馭勢科技、佑駕創(chuàng)新、中天安馳等。

        工業(yè)視覺

        機(jī)器視覺可以快速獲取大量信息,并進(jìn)行自動處理。在自動化生產(chǎn)過程中,人們將機(jī)器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗和質(zhì)量控制等領(lǐng)域。機(jī)器視覺系統(tǒng)的特點是提高生產(chǎn)的柔性和自動化程度。運(yùn)用在一些危險工作環(huán)境或人工視覺難以滿足要求的場合;此外,在大批量工業(yè)生產(chǎn)過程中,機(jī)器視覺檢測可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。

        代表企業(yè):創(chuàng)想智控、凱視佳、拓視覺、帆聲圖像、華睿科技等。

        隨著越來越多的人工智能研究被轉(zhuǎn)化為應(yīng)用,對更小模型的需求將會增加。國內(nèi)也在計算機(jī)視覺領(lǐng)域加大了技術(shù)投資力度,誕生了諸如商湯科技、曠視科技、依圖科技、極鏈科技等優(yōu)秀的人工智能初創(chuàng)企業(yè)。未來,這些優(yōu)秀的人工智能企業(yè)也會尋找到更多的落地場景,繼續(xù)推動計算機(jī)視覺這一技術(shù)在應(yīng)用場景快速落地。

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.hysjfh.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運(yùn)動控制
  • 伺服系統(tǒng)
  • 機(jī)器視覺
  • 機(jī)械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機(jī)界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機(jī)器人
  • 低壓電器
  • 機(jī)柜
回頂部
點贊 0
取消 0