為了訓練機器隨機應變、適應真實環境的能力,南加州大學研究團隊開發了一個模擬器,能訓練機器人拼裝宜家家具。如果你覺得親手組裝家具不太難的話,就試試去調教這些機器人吧!
圖片來源:南加州大學
對那些第一次搬進公寓的人們而言,按一堆神秘的圖紙組裝出宜家家具而確保它不散架,同時保持自己情緒穩定,已經成為了不折不扣的重大儀式。
但是,對于南加州大學(UniversityofSouthernCalifornia)的研究人員們而言,還有比這更好的折磨機器人、使它們學會面對現實的方式嗎?繼去年一群機器人學家用機械手臂組裝了經典的Stefan椅子后,南加大的研究人員們又向機器人學界贈送了一份大禮——一個新的模擬系統,用來訓練機器人組裝這些低成本家具。他們的最終目標是讓機器人更好地應對新事物,達到接近人類的靈活性和適應性。
努力工作的單臂機器人“Sawyer”
圖片來源:南加州大學
對于你我來說,組裝宜家家具既簡單又困難。組裝過程漫長而令人厭煩,但它同時也是一件簡單的事兒,因為人類奇妙的大腦總能將抽象的圖紙轉換為實物。在組裝過程中,你會遇到各種問題,但你的創造力能輕易解決它們;長時間使用六角扳手會累到你手抽筋,但人類的動手能力仍是無可比擬的。
而對機器人來說,組裝宜家家具完全是地獄級難度。是的,機器人已經在裝配線上工作了幾十年了,但它們只是負責體力活兒的“肌肉”。例如,它們只負責把車門之類的大部件抬到合適位置,擰入小零件等精細活兒始終由人類完成。此外,機器人的工作環境受到高度限制,即使它們足夠聰明,也永遠不需要即興發揮,因為它們的不可預測性可能使人類同事處于危險之中。
如果希望機器人在我們的家庭中有所用途,它們就必須變得更靈活。為了達到這個目的,或許需要用一些復合場景對機器人進行訓練,比如安裝宜家家具。
南加大的研究人員們通過模擬真實物理世界中的重力、摩擦力,使用不同的燈光、紋理渲染,建立了他們的三維數字游樂場。在這個環境中,你可以選擇不同的機器人,比如單臂的Sawyer和雙臂的Baxter,然后操縱它們拼裝80多件椅子、桌子、書架等家具。所有的場景都是由游戲引擎Unity渲染的,機器人的點滴進步都能被看到。
多種光照、紋理和背景可供選擇
圖片來源:南加州大學
但是,Sawyer和Baxter都是真實存在的機器人,可以在實驗室中實地學習,為什么還要費勁做個模擬器呢?這是因為訓練一個真實的、由金屬和塑料制成的機器人不是一件容易的事兒。現實中,對機器人的訓練往往是通過強化學習進行的,機器人嘗試用不同的方法解決問題,若此方法有一定的效果則給予獎勵,反之則予以懲罰,循環往復。機器人雖然能摸索出正確的問題解決方法,但是整個過程極其耗時,而在模擬系統中訓練機器人的速度遠比現實中快得多。
這款宜家游樂園一般的模擬系統為研究人員提供了一個訓練機器人操作、組裝復雜物體的標準平臺。“雖然對人類來說‘抓握’只是個微不足道的動作,但對機器人來說,它必須精確知道在哪里抓物品,用多大的力抓住物品,”曾幫助開發該系統的南加州大學機器人專家約瑟夫?里姆(JosephLim)說,“即使是掌握抓握技能,對機器人來說也是一個非常大的開放性問題。”
另外,要搭建一把椅子,零件必須以一定的方式組合,步驟也必須以一定的順序執行,如何讓機器人把一系列的操作串聯起來也是一個問題。為此,研究人員可能會使用“模仿學習”的方法,即先給機器人演示如何搭一把椅子,再讓機器人進行模仿。里姆說:“我們的目標之一是研究如何讓機器人學習人類的行為。我們可以通過視頻等方式讓機器人觀察人類行為,再讓它進行重復或模仿。”
努力工作的雙臂機器人“Bexter”
圖片來源:南加州大學
不過,別指望你的機器人助理可以直接把裝好的辦公椅帶到你的辦公室來。首先,這個系統還不能模擬用釘子或螺釘把部件連接起來的操作。其次,曾用真實機器人組裝了宜家椅子的南洋理工大學工程師彭匡聰(音,Quang-CuongPham)認為這個模擬系統仍然面臨從模擬到現實的轉化問題。也就是說,將機器人在模擬中所學到的知識轉化為它們在現實世界中的技能是極其困難的。彭匡聰說:“一項在模擬環境中成功完成的任務是否能像我們之前做的那樣,由一臺真實的機器人在現實世界里完成?這是目前尚不清楚的。”
圖片來源:南洋理工大學
研究DOI:10.1126/scirobotics.aat6385
但是,也許再經過幾年時間,再犧牲一些椅子,人類搭家具的痛苦就將是機器人的收獲。