基于視覺追蹤!在捉人游戲中,機器人現(xiàn)在會“以智取勝”了
9月6日 消息:近日,加州大學(xué)伯克利分校的研究人員開發(fā)出一種新的方法,教機器人進行“基于視覺的追蹤”,實現(xiàn)像捉人游戲等需要動態(tài)決策的任務(wù)。
這種方法不同于簡單地跟蹤一個人或機器人,機器人可以主動推斷目標的去路并進行搜捕目標。由于現(xiàn)實世界的種種限制,如對環(huán)境和其他代理有限的感知,直接通過強化學(xué)習(xí)的方式很難學(xué)會這類行為。
因此,研究人員使用了“特權(quán)學(xué)習(xí)”的方式。這是一種監(jiān)督學(xué)習(xí)形式,其中擁有附加信息的教師幫助沒有附加信息的學(xué)生。
對機器人來說,這意味著機器人老師利用逃避者的未來軌跡來推斷逃避者的意圖。有了這些特權(quán)信息,機器人老師就可以逐步指導(dǎo)學(xué)生機器人采取哪些行動。因此,本質(zhì)上復(fù)雜的規(guī)劃問題對于學(xué)生來說變成了一個簡單的監(jiān)督學(xué)習(xí)問題。
盡管這種方法很簡單,但機器人學(xué)會了動態(tài)行為,如目標轉(zhuǎn)向時減速,或者預(yù)測目標去向并攔截。
研究人員在一個四足機器人上測試了這種方法,它僅依靠內(nèi)置攝像頭和本體感知,就成功與人類和其他機器人進行了追逐游戲。該機器人也展現(xiàn)出了模型在模擬環(huán)境中學(xué)習(xí)到的復(fù)雜追捕行為。
這種“特權(quán)學(xué)習(xí)”的方法教會了機器人進行基于視覺的追蹤,實現(xiàn)了像捉迷藏這樣復(fù)雜的動態(tài)任務(wù),是機器人技術(shù)向真實世界應(yīng)用邁進的一個進步。
不過,目前該系統(tǒng)還無法處理障礙物,需要更廣泛的AI訓(xùn)練和更好的傳感器來實現(xiàn)。
本文來源于站長之家,如有侵權(quán)請聯(lián)系刪除
本站部分文章來自網(wǎng)絡(luò)或用戶投稿。涉及到的言論觀點不代表本站立場。閱讀前請查看【免責(zé)聲明】發(fā)布者:方應(yīng),如若本篇文章侵犯了原著者的合法權(quán)益,可聯(lián)系我們進行處理。本文鏈接:http://www.gdyuanyu.cn/tougao/97332.html