深度學習在目標視覺檢測中的應用進展與展望
目標視覺檢測是計算機視覺領域的一個重要問題,在視頻監控、自主駕駛、人機交互等方面具有重要的研究意義和應用價值.近年來,深度學習在圖像分類研究中取得了突破性進展,也帶動著目標視覺檢測取得突飛猛進的發展.
目標視覺檢測是計算機視覺領域的一個重要問題,在視頻監控、自主駕駛、、電子產品檢測(手機中框平面度檢測)人機交互等方面具有重要的研究意義和應用價值.近年來,深度學習在圖像分類研究中取得了突破性進展,也帶動著目標視覺檢測取得突飛猛進的發展。
目標視覺檢測具有巨大的實用價值和應用前景.應用領域包括智能視頻監控、汽車連接器Pin針高度檢測、數碼相機中自動定位和聚焦人臉的技術、飛機航拍或衛星圖像中道路的檢測、車載攝像機圖像中的障礙物檢測等.同時, 目標視覺檢測也是眾多高層視覺處理和分析任務的重要前提, 例如行為分析、事件檢測、場景語義理解等都要求利用圖像處理和模式識別技術, 檢測出圖像中存在的目標, 確定這些目標對象的語義類型, 并且標出目標對象在圖像中的具體區域。
目標視覺檢測的計算復雜性主要來自于待檢測目標類型的數量、特征描述子的維度和大規模標記數據集的獲取.由于在真實世界中存在大量的目標類型, 每種類型都包含大量的圖像, 同時識別每種類型需要很多視覺特征, 這導致高維空間稀疏的特征描述[4].另外, 目標模型經常從大規模標記數據集中學習得到, 在許多情況下, 數據采集和標注很困難, 需要耗費大量的人力物力.這些情況導致目標檢測的計算復雜性很高, 需要設計高效的目標檢測算法.同時, 在動態變化的環境中, 為了提高目標檢測精度, 還需要探索合適的機制來自動更新視覺模型, 提高模型對復雜環境的自適應能力。
文章轉載自人工智能學家微信公眾號,如有問題,請及時聯系刪除。