科學(xué)家教機(jī)器人像兒童那樣學(xué)習(xí)

[摘要]華盛頓大學(xué)機(jī)器人專家開發(fā)出一種新的概率模型，將兒童發(fā)育研究和機(jī)器學(xué)習(xí)方法結(jié)合起來，目標(biāo)是造出能通過觀察和模仿人類來學(xué)習(xí)新技能的機(jī)器人。

華盛頓發(fā)育心理學(xué)家與計(jì)算機(jī)科學(xué)家合作，讓機(jī)器人像兒童那樣自然地學(xué)習(xí)。兒童會(huì)追蹤大人的目光，研究人員將這種方法教給機(jī)器人以完成任務(wù)。

孩子來到這個(gè)陌生的世界上，他們移動(dòng)著自己的身體，探索著身體怎樣移動(dòng)、怎樣抓住玩具、怎樣推開桌上的東西，同時(shí)觀察模仿著成人的做法，如此這般學(xué)習(xí)著這個(gè)世界的一切。

但如果讓機(jī)器人專家教一個(gè)機(jī)器人執(zhí)行任務(wù)，一般情況下，他們只能靠編寫程序，或移動(dòng)機(jī)器人的手臂或身體，如此告知它們?nèi)绾涡袆?dòng)。美國(guó)華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程教授拉加什·拉奧說：“你可以把這當(dāng)作是建造能向人類學(xué)習(xí)的機(jī)器人的第一步，它們的學(xué)習(xí)方法和兒童向大人學(xué)習(xí)是一樣的。如果讓那些絲毫不懂計(jì)算機(jī)程序的人去教一個(gè)機(jī)器人，只能用演示的方法——讓機(jī)器人看著怎么洗盤子、疊衣服、做家務(wù)。但要實(shí)現(xiàn)這一目標(biāo)，機(jī)器人還要能看懂這些動(dòng)作，并自己學(xué)著做出來。”

華盛頓大學(xué)機(jī)器人專家與該校學(xué)習(xí)與腦科學(xué)實(shí)驗(yàn)室研究所副主管安德魯·麥茲奧夫合作，開發(fā)出一種新的概率模型，將兒童發(fā)育研究和機(jī)器學(xué)習(xí)方法結(jié)合起來，目標(biāo)是解決機(jī)器人技術(shù)中的根本性難題：造出能通過觀察和模仿人類來學(xué)習(xí)新技能的機(jī)器人。

兒童更擅于感知他人意圖

麥茲奧夫以往的研究表明，18個(gè)月大的兒童能推測(cè)出大人動(dòng)作的意圖，并能想出其他方法達(dá)到他們想要的目的。

在一個(gè)案例中，兒童看到大人想拉開一個(gè)玩具杠鈴，但未達(dá)到目的，因?yàn)楦茆徥钦吃谝黄鸬�，大人的手滑到了杠鈴末端。兒童看著這一切，然后決定用另一種方法：用他的小手指抓住杠鈴末端，更加用力地猛拉——重復(fù)大人想要做的。

從某種程度上說，兒童更擅于感知他人的意圖，他們通過對(duì)自身的探索，學(xué)習(xí)物理規(guī)律，了解自己的行動(dòng)對(duì)事物的影響，甚至能積累足夠的知識(shí)向他人學(xué)習(xí)，并理解他們的意圖。麥茲奧夫認(rèn)為，兒童之所以能學(xué)習(xí)得那么快，原因之一就是他們特別愛玩。

“兒童在玩的時(shí)候，看起來是毫無目的，但卻是一種學(xué)習(xí)。”麥茲奧夫說，“這正是兒童很有創(chuàng)造性的秘密。如果他們想知道怎么玩一個(gè)新玩具，就要用到玩其他玩具時(shí)的經(jīng)驗(yàn)。在玩的過程中，他們也在學(xué)習(xí)著一種思維模式，即自己的行動(dòng)會(huì)對(duì)外界造成怎樣的改變。一旦有了這種思維模式，他們就有了解決新問題的能力，并開始推測(cè)別人的意圖。”

用“學(xué)習(xí)概率模型”指導(dǎo)機(jī)器人

利用對(duì)兒童的研究，拉奧團(tuán)隊(duì)開發(fā)了機(jī)器學(xué)習(xí)算法——一種學(xué)習(xí)概率模型：讓機(jī)器人觀察自己的動(dòng)作，看不同動(dòng)作可能帶來什么樣的不同后果，然后用這種學(xué)習(xí)概率模型，推測(cè)一個(gè)人究竟想做什么，并完成他的意圖，甚至在機(jī)器人無法確定時(shí)，還能“詢問”求助。

研究團(tuán)隊(duì)用兩個(gè)不同的場(chǎng)景對(duì)他們的機(jī)器人模型進(jìn)行了測(cè)試：一個(gè)是計(jì)算機(jī)模擬實(shí)驗(yàn)，其中的機(jī)器人能通過追蹤人類的目光學(xué)習(xí)；另一個(gè)是真的機(jī)器人，能通過模仿人類行動(dòng)來學(xué)習(xí)，比如移動(dòng)桌子上的玩具。

在目光追蹤實(shí)驗(yàn)中，機(jī)器人學(xué)習(xí)了一種如何移動(dòng)頭部的規(guī)則模型，并假定人類轉(zhuǎn)頭也遵循這一模型。當(dāng)人在屋內(nèi)環(huán)視時(shí)，機(jī)器人會(huì)追蹤他頭部移動(dòng)的起點(diǎn)和終點(diǎn)，用這些信息算出他在看什么地方，然后用學(xué)到的頭部運(yùn)動(dòng)規(guī)則，把自己的頭轉(zhuǎn)向人所看的地方。

研究人員還重復(fù)了麥茲奧夫?qū)和龅囊粋€(gè)實(shí)驗(yàn)，讓一個(gè)大人看向某個(gè)地方然后蒙住眼睛時(shí)，兒童會(huì)對(duì)那個(gè)地方視而不見，或者也看向那里并蒙住眼睛，表示不感興趣，因?yàn)榘此麄兊睦斫�，大人其�?shí)是不想看那里。研究人員讓機(jī)器人“理解”蒙住眼睛（視而不見）的后果，它們就不再追蹤人類轉(zhuǎn)頭所看的地方。

“兒童通過自身的體驗(yàn)來理解他人的行為，我們的機(jī)器人也是這樣。”麥茲奧夫說。

在第二個(gè)實(shí)驗(yàn)中，研究人員讓機(jī)器人模仿人類移動(dòng)桌上的物體并把它們擦干凈。在學(xué)習(xí)模型的指導(dǎo)下，它們每次都不是生硬地模仿人類動(dòng)作，有時(shí)還會(huì)用不同的方法來達(dá)到同樣目的。

華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程博士生鄭宰永說：“抓取、拿起、移動(dòng)這些動(dòng)作對(duì)機(jī)器人來說比推要困難，讓人類把一個(gè)物體拿到另一個(gè)位置或許更容易，也更可靠，但還要知道目的是什么，這是機(jī)器人技術(shù)中的一個(gè)難題，也是我們致力研究的問題。”

雖然實(shí)驗(yàn)最初只是學(xué)習(xí)怎樣推斷目的、模仿簡(jiǎn)單動(dòng)作，但研究人員還打算探索這種模型能否幫助機(jī)器人學(xué)習(xí)更復(fù)雜的任務(wù)。

“兒童通過玩耍觀察別人來學(xué)習(xí)。”麥茲奧夫說，“他們是地球上最棒的學(xué)習(xí)者——為什么不設(shè)計(jì)一種能像孩子那樣毫不費(fèi)力學(xué)習(xí)的機(jī)器人呢？”

責(zé)編：微科普

上一篇：金屬粉末或可替代化石燃料

下一篇：新型納米材料比紙薄千倍每平方米僅重0.1克

分享到：

>相關(guān)科普知識(shí)

相關(guān)科普知識(shí)