[摘要]華盛頓大學(xué)機(jī)器人專家開發(fā)出一種新的概率模型,將兒童發(fā)育研究和機(jī)器學(xué)習(xí)方法結(jié)合起來,目標(biāo)是造出能通過觀察和模仿人類來學(xué)習(xí)新技能的機(jī)器人。

華盛頓發(fā)育心理學(xué)家與計(jì)算機(jī)科學(xué)家合作,讓機(jī)器人像兒童那樣自然地學(xué)習(xí)。兒童會(huì)追蹤大人的目光,研究人員將這種方法教給機(jī)器人以完成任務(wù)。
孩子來到這個(gè)陌生的世界上,他們移動(dòng)著自己的身體,探索著身體怎樣移動(dòng)、怎樣抓住玩具、怎樣推開桌上的東西,同時(shí)觀察模仿著成人的做法,如此這般學(xué)習(xí)著這個(gè)世界的一切。
但如果讓機(jī)器人專家教一個(gè)機(jī)器人執(zhí)行任務(wù),一般情況下,他們只能靠編寫程序,或移動(dòng)機(jī)器人的手臂或身體,如此告知它們?nèi)绾涡袆?dòng)。美國(guó)華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程教授拉加什·拉奧說:“你可以把這當(dāng)作是建造能向人類學(xué)習(xí)的機(jī)器人的第一步,它們的學(xué)習(xí)方法和兒童向大人學(xué)習(xí)是一樣的。如果讓那些絲毫不懂計(jì)算機(jī)程序的人去教一個(gè)機(jī)器人,只能用演示的方法——讓機(jī)器人看著怎么洗盤子、疊衣服、做家務(wù)。但要實(shí)現(xiàn)這一目標(biāo),機(jī)器人還要能看懂這些動(dòng)作,并自己學(xué)著做出來。”
華盛頓大學(xué)機(jī)器人專家與該校學(xué)習(xí)與腦科學(xué)實(shí)驗(yàn)室研究所副主管安德魯·麥茲奧夫合作,開發(fā)出一種新的概率模型,將兒童發(fā)育研究和機(jī)器學(xué)習(xí)方法結(jié)合起來,目標(biāo)是解決機(jī)器人技術(shù)中的根本性難題:造出能通過觀察和模仿人類來學(xué)習(xí)新技能的機(jī)器人。
兒童更擅于感知他人意圖
麥茲奧夫以往的研究表明,18個(gè)月大的兒童能推測(cè)出大人動(dòng)作的意圖,并能想出其他方法達(dá)到他們想要的目的。
在一個(gè)案例中,兒童看到大人想拉開一個(gè)玩具杠鈴,但未達(dá)到目的,因?yàn)楦茆徥钦吃谝黄鸬,大人的手滑到了杠鈴末端。兒童看著這一切,然后決定用另一種方法:用他的小手指抓住杠鈴末端,更加用力地猛拉——重復(fù)大人想要做的。
從某種程度上說,兒童更擅于感知他人的意圖,他們通過對(duì)自身的探索,學(xué)習(xí)物理規(guī)律,了解自己的行動(dòng)對(duì)事物的影響,甚至能積累足夠的知識(shí)向他人學(xué)習(xí),并理解他們的意圖。麥茲奧夫認(rèn)為,兒童之所以能學(xué)習(xí)得那么快,原因之一就是他們特別愛玩。
“兒童在玩的時(shí)候,看起來是毫無目的,但卻是一種學(xué)習(xí)。”麥茲奧夫說,“這正是兒童很有創(chuàng)造性的秘密。如果他們想知道怎么玩一個(gè)新玩具,就要用到玩其他玩具時(shí)的經(jīng)驗(yàn)。在玩的過程中,他們也在學(xué)習(xí)著一種思維模式,即自己的行動(dòng)會(huì)對(duì)外界造成怎樣的改變。一旦有了這種思維模式,他們就有了解決新問題的能力,并開始推測(cè)別人的意圖。”
用“學(xué)習(xí)概率模型”指導(dǎo)機(jī)器人
利用對(duì)兒童的研究,拉奧團(tuán)隊(duì)開發(fā)了機(jī)器學(xué)習(xí)算法——一種學(xué)習(xí)概率模型:讓機(jī)器人觀察自己的動(dòng)作,看不同動(dòng)作可能帶來什么樣的不同后果,然后用這種學(xué)習(xí)概率模型,推測(cè)一個(gè)人究竟想做什么,并完成他的意圖,甚至在機(jī)器人無法確定時(shí),還能“詢問”求助。
研究團(tuán)隊(duì)用兩個(gè)不同的場(chǎng)景對(duì)他們的機(jī)器人模型進(jìn)行了測(cè)試:一個(gè)是計(jì)算機(jī)模擬實(shí)驗(yàn),其中的機(jī)器人能通過追蹤人類的目光學(xué)習(xí);另一個(gè)是真的機(jī)器人,能通過模仿人類行動(dòng)來學(xué)習(xí),比如移動(dòng)桌子上的玩具。
在目光追蹤實(shí)驗(yàn)中,機(jī)器人學(xué)習(xí)了一種如何移動(dòng)頭部的規(guī)則模型,并假定人類轉(zhuǎn)頭也遵循這一模型。當(dāng)人在屋內(nèi)環(huán)視時(shí),機(jī)器人會(huì)追蹤他頭部移動(dòng)的起點(diǎn)和終點(diǎn),用這些信息算出他在看什么地方,然后用學(xué)到的頭部運(yùn)動(dòng)規(guī)則,把自己的頭轉(zhuǎn)向人所看的地方。
研究人員還重復(fù)了麥茲奧夫?qū)和龅囊粋(gè)實(shí)驗(yàn),讓一個(gè)大人看向某個(gè)地方然后蒙住眼睛時(shí),兒童會(huì)對(duì)那個(gè)地方視而不見,或者也看向那里并蒙住眼睛,表示不感興趣,因?yàn)榘此麄兊睦斫,大人其?shí)是不想看那里。研究人員讓機(jī)器人“理解”蒙住眼睛(視而不見)的后果,它們就不再追蹤人類轉(zhuǎn)頭所看的地方。
“兒童通過自身的體驗(yàn)來理解他人的行為,我們的機(jī)器人也是這樣。”麥茲奧夫說。
在第二個(gè)實(shí)驗(yàn)中,研究人員讓機(jī)器人模仿人類移動(dòng)桌上的物體并把它們擦干凈。在學(xué)習(xí)模型的指導(dǎo)下,它們每次都不是生硬地模仿人類動(dòng)作,有時(shí)還會(huì)用不同的方法來達(dá)到同樣目的。
華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程博士生鄭宰永說:“抓取、拿起、移動(dòng)這些動(dòng)作對(duì)機(jī)器人來說比推要困難,讓人類把一個(gè)物體拿到另一個(gè)位置或許更容易,也更可靠,但還要知道目的是什么,這是機(jī)器人技術(shù)中的一個(gè)難題,也是我們致力研究的問題。”
雖然實(shí)驗(yàn)最初只是學(xué)習(xí)怎樣推斷目的、模仿簡(jiǎn)單動(dòng)作,但研究人員還打算探索這種模型能否幫助機(jī)器人學(xué)習(xí)更復(fù)雜的任務(wù)。
“兒童通過玩耍觀察別人來學(xué)習(xí)。”麥茲奧夫說,“他們是地球上最棒的學(xué)習(xí)者——為什么不設(shè)計(jì)一種能像孩子那樣毫不費(fèi)力學(xué)習(xí)的機(jī)器人呢?”
責(zé)編:微科普