基于極限學(xué)習(xí)機(jī)的機(jī)器人示教學(xué)習(xí)研究
文:歐勇盛2017年第一期
機(jī)器人的智能化經(jīng)過多年的發(fā)展,已越來越貼近人類,使其成為具有人類的學(xué)習(xí)能力、運(yùn)動能力、執(zhí)行能力、感知能力、認(rèn)知能力等的新型智能機(jī)器人是人類追求的目標(biāo),其中示教學(xué)習(xí)是研究機(jī)器人學(xué)習(xí)能力的重要分支之一,是智能型仿人機(jī)器人發(fā)展和應(yīng)用的關(guān)鍵。因此,對于示教學(xué)習(xí)的研究一直是學(xué)術(shù)界研究的熱點。
近年來,為達(dá)到機(jī)器人能準(zhǔn)確、快速的完成人類導(dǎo)師對其示教的動作,出現(xiàn)了許多示教方法,如日本Kondo公司生產(chǎn)的KHR系列機(jī)器人,采用直接輸入機(jī)器人各個關(guān)節(jié)角度的方式進(jìn)行示教;美國戴沃爾提出利用伺服技術(shù)對機(jī)器人的關(guān)節(jié)進(jìn)行控制,人手對機(jī)器人進(jìn)行動作示教,機(jī)器人記錄示教過程中的示教數(shù)據(jù)并進(jìn)行再現(xiàn);曹其新等人則提出了利用激光深度傳感器在獲得人體各關(guān)節(jié)轉(zhuǎn)角的三維坐標(biāo)后,將其輸入到控制器中進(jìn)行示教,并采用基于速度的有選擇均值濾波法對控制數(shù)據(jù)進(jìn)行處理,以上示教方法在人類對機(jī)器人進(jìn)行示教研究的進(jìn)程中,做出了重要的貢獻(xiàn),起到了很大的推動作用,但機(jī)器人完成示教動作的準(zhǔn)確性、重現(xiàn)的速度及傳感器數(shù)據(jù)抖動方面扔有待提高。
在系統(tǒng)控制策略方面,有許多算法被相繼應(yīng)用于機(jī)器人示教領(lǐng)域,如高斯混合模型、強(qiáng)化學(xué)習(xí)、試錯學(xué)習(xí)等。以上方法在用于系統(tǒng)控制時,雖然表現(xiàn)出了良好的系統(tǒng)穩(wěn)定性及有效性,但也存在各自的缺點,如訓(xùn)練時間長、生成的軌跡連續(xù)性不好等。極限學(xué)習(xí)機(jī)ELM(ExtremeLearningMachine)是針對上述算法的缺陷設(shè)計的一種新型算法,其具有泛化學(xué)習(xí)能力強(qiáng)、訓(xùn)練速度快等方面的優(yōu)點。
綜上所述,為了使機(jī)器人示教系統(tǒng)具有很好的自適應(yīng)性及魯棒性,即機(jī)器人能按照示教動作,在不同起始點上仍按照示教的軌跡回到終點位置,使得機(jī)器人具有一定的智能性及自學(xué)習(xí)能力,并針對上述算法的缺點,本文選用教學(xué)研究型機(jī)器人NAO為實驗平臺,采用扳動其手臂關(guān)節(jié)的方式進(jìn)行示教,同時構(gòu)建了以極限學(xué)習(xí)機(jī)為核心算法的機(jī)器人示教系統(tǒng),并通過實驗驗證了該算法能使系統(tǒng)具有一定的泛化能力。
控制過程概述
機(jī)器人完成點到點的示教動作是研究仿人機(jī)器人動作編輯的重要組成部分。故本文將以機(jī)器人完成從起始點到目標(biāo)點的動作為基礎(chǔ)動作,以極短的時間間隔作為采樣的頻率,每次采集時,將NAO右手臂上的四個關(guān)節(jié)角的值采集到,然后對數(shù)據(jù)進(jìn)行預(yù)處理,之后進(jìn)行回歸訓(xùn)練,利用訓(xùn)練好的模型對機(jī)器人的控制器進(jìn)行控制,使得機(jī)器人重現(xiàn)示教動作更加準(zhǔn)確。(如圖1)
實驗平臺簡介
法國AldebaranRobotics公司研制的小型仿人機(jī)器人NAO,高度為58厘米,全身共有25個自由度,具有動覺、視覺、觸覺、感知、認(rèn)知等能力,其擁有完善的數(shù)字處理器及電機(jī)制動器、豐富的傳感器系統(tǒng)、多種交流設(shè)備、特有的操作系統(tǒng)NAOqi、完備的配套編程平臺,具備Wi-Fi連接及以太網(wǎng)兩種通信方式,因其具備良好的二次開發(fā)的優(yōu)勢,被廣泛作為教學(xué)、科研等方面的研究工具。
示教學(xué)習(xí)算法
由于傳感器測量時存在累積誤差、噪聲、穩(wěn)定性等問題,會使測量到的數(shù)據(jù)不夠準(zhǔn)確,故使用離散時間的卡爾曼濾波KF(KalmanFilter)來對NAO手臂關(guān)節(jié)上的傳感器輸出數(shù)據(jù)進(jìn)行融合,使得機(jī)器人手臂姿態(tài)的準(zhǔn)確性最優(yōu),有利于提高機(jī)器人示教學(xué)習(xí)的準(zhǔn)確性。根據(jù)上一時刻關(guān)節(jié)傳感器采集到的測量值對下一時刻的測量值進(jìn)行估計,然后與下一時刻傳感器的測量值進(jìn)行數(shù)據(jù)融合,即更正下一時刻的測量值,以便使數(shù)據(jù)更準(zhǔn)確。
根據(jù)機(jī)器人實際運(yùn)動狀態(tài),將運(yùn)動系統(tǒng)定義為一階常微分方程:
實驗
HCS(LearningHumanbyDemonstration)是由Y.OuandY.Xu[12]提出的用于在非線性動態(tài)系統(tǒng)中,利用支持向量基為模型學(xué)習(xí)動態(tài)系統(tǒng)的參數(shù),以保證動作能夠按照示教動作達(dá)到并停止到目標(biāo)點的一種統(tǒng)計學(xué)優(yōu)化算法。為驗證ELM算法具有在上述約束條件下收斂、訓(xùn)練速度快、準(zhǔn)確率高等特點,首先將ELM與SEDS在采用相同的樣本數(shù)據(jù)為前提下,將兩者的仿真實驗結(jié)果進(jìn)行比較。樣本數(shù)據(jù)來源為采集的多種人類實際手寫體數(shù)據(jù)庫。以數(shù)據(jù)庫中的Cshape、Spoon、Line、Trapezoid等數(shù)據(jù)為例,實驗對比圖如圖3所示。
在實驗平臺上做實際的示教實驗,首先由操作者扳動機(jī)器人NAO的手臂末端執(zhí)行器,使其做出要求的避障取物動作,在示教的同時,NAO中的遠(yuǎn)程控制器,記錄下每間隔100ms傳感器、關(guān)節(jié)角等的值,當(dāng)需要機(jī)器人重現(xiàn)示教動作時,動態(tài)系統(tǒng)從存儲器中取出經(jīng)ELM算法訓(xùn)練出的控制信息,將指令信號傳給驅(qū)動機(jī)構(gòu),使驅(qū)動機(jī)構(gòu)準(zhǔn)確、快速的完成要求的動作。ELM中,隱藏層節(jié)點個數(shù)為50,輸入層與隱藏層權(quán)值均為隨機(jī)向量,以處理后機(jī)器人手臂末端執(zhí)行器的空間位置數(shù)據(jù)作為極限學(xué)習(xí)機(jī)的輸入,以手臂末端的速度作為其輸出。
人類導(dǎo)師示教過程及示教曲線圖如圖4所示。
圖5為機(jī)器人從不同的起始點進(jìn)行避障示教及重現(xiàn)的軌跡圖,黑色點集代表動作起始點,藍(lán)色點集代表動作的終止點,紅色曲線為樣本數(shù)據(jù)組成的示教曲線,藍(lán)色曲線為機(jī)器人重現(xiàn)示教動作的曲線圖。
結(jié)論
本文結(jié)合ELM學(xué)習(xí)算法的訓(xùn)練速度快、所需調(diào)節(jié)的參數(shù)少等優(yōu)點,對機(jī)器人進(jìn)行示教學(xué)習(xí),彌補(bǔ)了以往仿人機(jī)器人示教學(xué)習(xí)時學(xué)習(xí)速度慢,重現(xiàn)示教動作精確度不高等方面的不足,實踐效果表明,采用該方法有很好的抗干擾能力、很好的泛化能力,同時也避免了維度災(zāi)難。采用常微分方程將基于ELM的動態(tài)系統(tǒng)描述為非線性動態(tài)系統(tǒng),并給出了該系統(tǒng)在目標(biāo)點達(dá)到局部穩(wěn)定的約束條件,利用李雅普諾夫穩(wěn)定性定理對其穩(wěn)定性給予了理論支撐,為今后仿人機(jī)器人學(xué)習(xí)更多復(fù)雜的示教動作奠定基礎(chǔ)。
中傳動網(wǎng)版權(quán)與免責(zé)聲明:
凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.hysjfh.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運(yùn)動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

掃碼關(guān)注小程序
時刻關(guān)注行業(yè)動態(tài)


填寫郵件地址,訂閱更多資訊:
撥打電話咨詢:13751143319 余女士
郵箱:chuandong@chuandong.cn
- 運(yùn)動控制
- 伺服系統(tǒng)
- 機(jī)器視覺
- 機(jī)械傳動
- 編碼器
- 直驅(qū)系統(tǒng)
- 工業(yè)電源
- 電力電子
- 工業(yè)互聯(lián)
- 高壓變頻器
- 中低壓變頻器
- 傳感器
- 人機(jī)界面
- PLC
- 電氣聯(lián)接
- 工業(yè)機(jī)器人
- 低壓電器
- 機(jī)柜