
新浪科技訊 北京時間5月21日上午消息,工業機器人大都是一遍又一遍地重復已經明確編程好的任務。通常來講,這意味著執行這些任務的機器人會與給它們編程的脆弱的工程師們保留安全距離。然而,越來越多的研究人員正在思考機器人如何在充滿人類的環境里工作,甚至向他們學習。例如,英偉達公司目前在西雅圖的新機器人實驗室里專注于一項研究——該公司的研究團隊今天在澳大利亞布里斯班舉辦的機器人與自動化國際會議(ICRA)上展示了機器人觀察人類的實驗,并介紹了其最近的一些關于機器人教學的工作。
正如英偉達的機器人研究高級主管Dieter Fox(他同時也是一位華盛頓大學教授)告訴記者的那樣,該團隊希望啟用一種能夠在靠近人類的條件下安全工作的新一代機器人。但要做到這一點,這些機器人首先需要能夠檢測人類,跟蹤他們的活動,并了解他們如何幫助人們——比如,在小規模的工業環境中,或是某人家中。
雖然有可能通過機械的重復來訓練某個算法,好讓它能成功地玩電子游戲,并教導它從錯誤中學習,但??怂拐J為,這種訓練機器人的方式可能會因為機器人要做決策的內容太多而無法有效地完成。相反,由Stan Birchfield和Jonathan Tremblay領導的英偉達研究小組開發了一個新系統,能允許機器人算法通過簡單地觀察人來得到教導,以執行新的任務。
這個例子中的任務非常簡單——只需要堆疊幾個彩色的積木即可。但這也是在這整個漫漫長征路中邁出的重要一步,好讓人類能夠快速教授機器人的新任務。
研究人員首先訓練了一系列的神經網絡來檢測積木,推斷積木之間的關系,然后生成一個程序,來讓它反復目睹人類表演的各個步驟。研究人員說,這個新系統能讓他們訓練機器人在現實世界中只通過一次演示來完成這個堆疊任務。
這個系統的一個很好的地方在于——它可以對正在執行的步驟產生一個可讀的描述。這樣,研究人員就能更容易地找出發生錯誤時的具體情況。
英偉達的Stan Birchfield告訴我,該團隊旨在為非專業人員提供機器人培訓,并且很少有其他任務能夠比展示堆疊積木等基本的任務更容易。在這個例子中,正如英偉達團隊在布里斯班展出的那樣,有一臺攝影機負責觀看現場,人類只是走上前去,拿起積木并堆疊起來。然后機器人反復地重復這個任務。這聽起來很簡單,但對于機器人來說這是一項非常艱巨的任務。
為了訓練核心模型,英偉達團隊主要使用模擬環境中的合成數據。正如Birchfield和Fox所強調的那樣,這些模擬可以快速地訓練機器人。畢竟,在現實世界中進行培訓需要更長的時間,而且還會更加危險。對于大多數任務,并沒有提前可供參考的培訓數據。
Birchfield指出:“我們認為模擬是一種強有力的范例,可以讓機器人訓練以前不可能做的事情?!?Fox回應了這一說法,并指出這種模擬的需求正是英偉達認為其硬件和軟件非常適合這種研究的原因。畢竟,這個培訓過程有著非常強烈的視覺效果,而英偉達在圖形硬件方面的專業背景肯定會有所幫助。
??怂钩姓J,仍有大量的研究需要繼續完成(畢竟,大多數模擬并非是實際情況),但現在至少已經有了核心基礎。
未來,英偉達團隊打算進一步擴大機器人可以學習的任務范圍,并多多找一些辭藻來描述這些任務。(青卡)

“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)
