攝影仍然是人類最喜歡的發明之一。在19世紀初的第一波浪潮中就迅速被藝術家和記者采用,以捕捉從戰爭的恐怖到古代文明壯麗的一切影像。 1888年,George Eastman(科達創始人)發布了一系列傻瓜相機,讓非專業人士能夠記錄他們的生活。
第二波浪潮始于 1878 年 6 月 18 日,當時 Eadweard Muybridge使用24臺照相機拍攝馬奔跑時的連續照片《奔跑中的賽馬》,證明馬奔跑時四蹄騰空。現在著名的序列證明,所有四只蹄子都在大步的頂部離開地面,24幀的概念,也使得好萊塢、電視劇和新聞產業開始蓬勃發展。
如今,圖片和視頻共同主導了互聯網。人類在 2021 年拍攝了大約 1.4 萬億張照片(其中近 100% 是在基于 Arm 的智能手機、平板電腦和智能相機上拍攝的)。與此同時,視頻消耗了 70% 以上的互聯網流量。
那么第三波會是什么呢?由于人工智能 (AI) 支持的處理能力和計算機視覺的不斷改進,“相機”將成為一種捕獲多種感官輸入并將周邊世界畫面編織成更豐富、更全面、更有洞察力的設備。您將能夠捕捉到眼睛所看到的以及通常無法看到的東西。
激光雷達成像正成為熱門
計算機視覺是在物聯網 (IoT) 中捕獲真實世界數據的基礎。
憑借與人眼一樣強大的處理器和重建技術,計算機可以執行更多人類視覺任務。因此,計算機視覺正迅速成為最重要的物聯網真實數據捕捉方式之一。
但智能相機不僅僅捕捉我們作為人類所看到的東西。他們也越來越擅長捕捉我們無法捕捉到的東西——通過使用針對電磁不同區域的頻譜而產生的成像技術。
熱像儀發明于 1920年代,幾十年來主要由軍事或實驗室技術人員和工程師使用。在 2000 年代,價格下降和性能提高使承包商能夠使用熱力設備來確定房屋中的裂縫。盡管如此,熱運動并不是你所說的必備應用,我們大多數人最接近的感官來自觀看《幽靈獵人》中捕獲的超自然現象。
新冠疫情對于熱像儀的采用達到了前所未有的高度。校園、博物館和其他公共區域流量大的設施突然需要一種準確、快速且非接觸式的方法來發現溫度異常的人群。人工智能增強型熱像儀(內置適當的隱私機制)將越來越多地包含在智能建筑平臺中,以改善健康、降低能源消耗并使復雜的人工智能任務(如預測性維護和生產優化)變得實用。
在不久的將來,熱成像——現在可以通過附加模塊獲得——可能會在智能手機中變得更加普遍,而不僅僅是在生死攸關的問題上。想象一下添加到多人增強現實 (AR) 游戲中的熱傳感器,熱增強成像將有效地讓玩家掌握目標或對手的位置和信息。
將視頻流與運動數據相結合,并使用 AI 對其進行分析也逐漸成為熱門。通過將人工智能、運動感應和視覺數據流融合到網絡攝像頭中,可以根據您自己的行為定制帶有手勢導航功能的便攜設備,或各種家用電器。
老年護理也是一個方向。多個傳感器和攝像頭提供數據將使老年人能夠安心的獨立生活,同時讓他們的親屬安心,親屬可以隨時查看父母的生命體征如血氧水平,甚至爺爺制作三明治的視頻片段。
汽車與相機的融合
現在我們轉向汽車。LiDAR 或光檢測和測距系統使用一組人眼安全激光來創建周圍區域的動態 3D 圖像。 Velodyne 的工程師 David Hall 在 2005 年的第二屆 DARPA 機器人車輛大挑戰中首次推出了 LiDAR 原型。他的車沒有完成,但在 2007 年的下一個挑戰中,六名完成者中有五名依賴于 LiDAR。
同時,Lucid 表示其轎車將于明年推出,將包含由 LiDAR 賦能的 DreamDrive Pro 自動駕駛平臺,而 LeddarTech 正在努力標準化使 LiDAR 成本不斷降低。
熱成像技術也將被集成到汽車攝像頭中。 Adasky公司表示,它的 Viper 相機結合了熱技術、視覺成像和 ML,可以檢測 300 米處的物體,并對 200 米處的活體進行分類。而傳統大燈只能提供大約 80 米的能見度。
您還可以組合哪些其他傳感輸入?一些公用事業公司正在尋找可視化氣體泄漏的方法,并將其集成到視頻流和地圖中,以幫助維修人員或消防員。帶有嗅覺傳感器、攝像頭、機器學習和智能手機,就可以幫助你在超市中找到最成熟的橘子,或者讓你遠離一包過期的熱狗。
讓我們不要忘記3D技術。3D無論是在 50 年代和 2010 年代都是時尚的表現,但計算攝影、人工智能、新的屏幕技術以及將 CAD 模型與多幅圖像融合在一起的渲染技術,正在產生逼真的、身臨其境的圖像,而不會讓觀眾反感。
引擎蓋下的技術革命
當然,所有這些都需要更多的技術工作。用于融合傳感器流或增強圖像的計算機視覺和其他 AI 應用將在很大程度上必須在相機本身上進行,以節省時間和能源消耗。例如,對全球估計的 7.7 億個監控攝像頭進行邊緣圖像分析,而不是將數據發送到云端,每年可以避免超過 1900 萬噸的二氧化碳排放,同時加強隱私保護。高級攝像還需要 64 位處理器,其中包含用于圖形和神經網絡處理器的專用內核以及傳統 CPU。
計算存儲:許多計算任務發生在存儲驅動器的范圍內,這些也將在高級攝影產品中找到早期市場。同樣,機器學習算法、處理器和其他組件必須精心設計以提高能源效率,因此電池供電的設備不會在關鍵時刻出現故障。隨著時間的推移,軟件定義的方法將進一步使硬件制造商或應用程序開發人員更容易添加新功能。
與此同時,所有這些工程工作都將伴隨著對更高分辨率和更多功能的需求。從 1080p 到 4K 將使智能相機的數據速率翻倍,并將隨著 8K 30fps或60fps的需求而繼續增長。更復雜的攝像頭也意味著黑客的攻擊面更大,因此預計會在其中看到專門的加密處理器。
用光和技術進行繪畫
有人可能會爭辯說,這種融合超越了攝影。畢竟,攝影的意思就是“用光畫畫”。添加其他種類的傳感輸入或技術上根本不真實的逼真圖像超出了當今相機的范圍。但對于公眾來說,相機一直是為了盡可能準確地捕捉現實——這種“現實”的范圍即將變得更大。