這種機器手有五個手指,每個手指都配備了先進(jìn)的光學(xué)觸覺傳感器,能夠精確地定位接觸點,并覆蓋復(fù)雜的曲面。每個手指有三個獨立的關(guān)節(jié),可以靈活地調(diào)整姿態(tài)。為了測試機器手的靈巧性,研究人員選擇了一個難度很高的操縱任務(wù):讓機器手在保持物體穩(wěn)定的同時,任意地旋轉(zhuǎn)物體。這個任務(wù)需要不斷地重新調(diào)整部分手指的位置,而其他手指則要固定物體。
令人驚訝的是,機器手不依賴任何視覺反饋,只根據(jù)觸覺傳感器和自身位置的數(shù)據(jù)完成了這個任務(wù)。這意味著機器手可以在非常差的光線條件下進(jìn)行操作,甚至可以在黑暗中工作。研究人員表示,這種基于觸覺的靈巧性將為自動化操作在現(xiàn)實世界中開辟全新的應(yīng)用場景,比如物流、材料處理、高級制造和裝配等領(lǐng)域。
為了讓機器手學(xué)會這種操縱技能,研究人員使用了一種叫做深度強化學(xué)習(xí)的方法,它可以讓機器人通過實踐來學(xué)習(xí)新的物理任務(wù)。研究人員還開發(fā)了一些新的算法來有效地探索可能的操縱策略。他們利用模擬器作為訓(xùn)練場,在幾個小時內(nèi)完成了相當(dāng)于一年的練習(xí)。然后,他們將模擬器中訓(xùn)練好的技能轉(zhuǎn)移到真實的機器手上,成功地實現(xiàn)了他們期望的靈巧性。
哥倫比亞大學(xué)的馬特伊・喬卡利教授說:“雖然我們展示的是一個概念驗證性質(zhì)的任務(wù),但我們相信這種靈巧性將為自動化操作在現(xiàn)實世界中帶來全新的可能性。一些更直接的用途可能是在物流和材料處理方面,幫助緩解近年來困擾我們經(jīng)濟的供應(yīng)鏈問題,在工廠中進(jìn)行高級制造和裝配。”
喬卡利教授表示,機器人領(lǐng)域的最終目標(biāo)是在家庭中實現(xiàn)輔助性的機器人,這是真正檢驗靈巧性的試金石。他說:“在這項研究中,我們展示了機器手也可以僅僅基于觸覺來實現(xiàn)高度靈巧性。一旦我們把視覺反饋和觸覺結(jié)合起來,我們希望能夠?qū)崿F(xiàn)更高的靈巧性,有朝一日能夠接近復(fù)制人手的功能。”
喬卡利教授指出,一個在現(xiàn)實世界中有用的物理機器人需要同時具備抽象的語義智能(注:能夠概念性地理解世界的運作)和具身智能(能夠物理地與世界互動)。像 OpenAI 的 GPT-4 或谷歌的 PALM 這樣的大型語言模型旨在提供前者,而像這項研究中實現(xiàn)的操縱靈巧性則代表了后者的進(jìn)步。例如,當(dāng)被問到如何做三明治時,ChatGPT 會在回應(yīng)中打出一個步驟清單,但是要真正做出三明治,就需要一個靈巧的機器人。同樣,研究人員希望物理技能高超的機器人能夠?qū)⒄Z義智能從互聯(lián)網(wǎng)這個純虛擬的世界中帶出來,用于真實世界的物理任務(wù)上,甚至可能是在我們的家里。