中國有句古話:三個臭皮匠頂個諸葛亮,是指三個才能平庸的人,若能同心協(xié)力集思廣益,也能提出比諸葛亮還高明的計(jì)策,比喻人多智慧大。還有一個詞叫做“眾人拾材火焰高”具有相同的意味,F(xiàn)在,互聯(lián)網(wǎng)的發(fā)展已經(jīng)將人群的智慧變成了一個有價值的、可隨需應(yīng)變的資源。眾人的智慧變得如此強(qiáng)大,如果能將這些智慧通過互聯(lián)網(wǎng)連接起來,它自身就變成了一個重要的資源。
2011年,面對全球性的大失業(yè)現(xiàn)象,麻省理工斯隆管理學(xué)院的兩位教授Erik Brynjolfsson和Andrew McAfee合撰《與機(jī)器賽跑》(Race Against the Machine)一書,提出了一種新的觀點(diǎn),隨著技術(shù)的高速發(fā)展,人類正與機(jī)器形成一種對抗,而在這個對抗過程中,人類肯定會輸,因?yàn)榕c機(jī)器相比,人類需要吃飯、睡眠和休息,有情感需求,厭惡重復(fù)性勞動。因此提出,未來我們需要轉(zhuǎn)換思路,別與機(jī)器賽跑,應(yīng)該與機(jī)器合作,適應(yīng)機(jī)器,幫助機(jī)器,體現(xiàn)人類對機(jī)器的價值,這樣人類才可以更好地與機(jī)器協(xié)同進(jìn)化,而不是被機(jī)器所淘汰。
現(xiàn)在,如果我們將這種想法擴(kuò)展開來,人的智慧不僅僅是自己互聯(lián),而且還可以與機(jī)器連接起來,建立一種合作關(guān)系取長補(bǔ)短,變成一個不可戰(zhàn)勝的重要驅(qū)動力。這個重要的資源,美國卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)的Luis von Ahn在其博士論文中引入了一個術(shù)語,叫人類計(jì)算(Human computation),指的是結(jié)合人類和計(jì)算機(jī)的優(yōu)勢來完成某個人類和計(jì)算都不能獨(dú)立完成任務(wù)的分布式系統(tǒng)。同時,伴隨著這個詞的產(chǎn)生的,還誕生了一個大數(shù)據(jù)行業(yè)經(jīng)常拿來說事兒的故事,就是我們現(xiàn)在網(wǎng)站登陸注冊時所用到的“驗(yàn)證碼”,其英文全稱是Completely Automated Public Turing test to tell Computers and Human Apart(CAPTCHA,全自動區(qū)分計(jì)算機(jī)和人類的圖靈測試)。最初的CAPTCHA圖片是由機(jī)器生成的,控制程序也知道正確答案,其作用純粹就是為了防止機(jī)器惡意自動注冊和機(jī)器攻擊,用于驗(yàn)證當(dāng)前正在進(jìn)行的操作是人類而不是機(jī)器。
坦率地講,許多身份驗(yàn)證機(jī)制的產(chǎn)生,是人類與技術(shù)之間的內(nèi)耗,比如機(jī)場安檢的逐步升級,純粹善良大眾為少數(shù)壞人買單,消耗了大量的人力和物力。CAPTCHA顯然也是如此。聰明的人總是不滿足現(xiàn)狀的,既然CAPTCHA消耗了廣大網(wǎng)民的時間資源,那么能否利用這些“浪費(fèi)”的資源做一些有意義的事兒呢?后來出現(xiàn)的reCAPTCHA就是在這方面進(jìn)行的挖掘,它除了能更好地區(qū)分人和機(jī)器外,還能“順便”為文獻(xiàn)數(shù)字化做貢獻(xiàn)。具體如何實(shí)現(xiàn)的呢?現(xiàn)在新的文字材料一般都有電子版,但計(jì)算機(jī)出現(xiàn)之前的大量書籍、報(bào)刊等書面資料沒有現(xiàn)存的電子化版本,要將其進(jìn)行電子化顯然很有意義,但任務(wù)異常繁重。隨著OCR的發(fā)展,文字自動識別的水平越來越高,但有些文獻(xiàn)由于年代久遠(yuǎn),字跡開始變得模糊、褪色、污損等,OCR無法識別。但是,這些OCR無法識別的內(nèi)容由人工辨認(rèn)卻相對比較簡單。reCAPTCHA系統(tǒng)中,驗(yàn)證碼由兩個單詞組成,一個是系統(tǒng)設(shè)定并知道答案的“control word”(對照詞),另一個是來源于OCR無法識別的“unknow word”(未知詞),前一個用于驗(yàn)證用戶是否有能力識別這些文字,如果答案正確,就認(rèn)為用戶對“unknown word”部分的回答也是可信的。為了增強(qiáng)可信度,同一個的“unknown word”會被分配給多個用戶,然后綜合這些用戶的回答來判定這個疑難字符是否被正確識別了。reCAPTCHA系統(tǒng)以免費(fèi)服務(wù)形式的形式提供給各網(wǎng)站,加速了文獻(xiàn)數(shù)字化的工作。
這種形式,也有人稱之為協(xié)同智能(collaborative intelligence)或眾包(crowdsourcing)。各種服務(wù)現(xiàn)在正在虎視眈眈地看著這些人類認(rèn)知的豐富資源供應(yīng),如維基百科、使命游戲(Games with a purpose)和亞馬遜土耳其機(jī)器人(Amazon Mechanical Turk)。維基百科,盡管最初人們擔(dān)心其準(zhǔn)確性,但毫無疑問現(xiàn)在它已成為各種基本信息的關(guān)鍵資源。使命游戲中的ESP,專門針對在線玩家,他們在玩一個有趣的游戲過程中,可生成有用的數(shù)據(jù)(如圖像標(biāo)記)。眾包市場的亞馬遜土耳其機(jī)器人用于協(xié)調(diào)那些為獲得報(bào)酬的工人來完成任務(wù)。
多鄰國(Duolingo)是一個免費(fèi)語言學(xué)習(xí)網(wǎng)站和眾包文字翻譯平臺。其設(shè)計(jì)理念是,當(dāng)用戶逐漸學(xué)習(xí)課程時,同時也在幫助翻譯網(wǎng)站上的內(nèi)容或文件。這個平臺推出后很快成為全球最受歡迎的外語學(xué)習(xí)神器,是唯一一款曾被谷歌Play Store和蘋果App Store都評為年度最佳的教育類應(yīng)用。也就是說,在線學(xué)習(xí)過程,也可以變成一種工作,相反,工作也可以變成一種學(xué)習(xí)過程,有些人在線工作的時候可以幫助其他人學(xué)習(xí)新的技能,這可能對未來的工作和教育產(chǎn)生變革性的影響。基于這種思路,在放射醫(yī)學(xué)領(lǐng)域如何從x射線照片中識別腫瘤是一個非常重要的工作,但現(xiàn)在這樣的任務(wù),依靠機(jī)器視覺算法還不可靠,然而人類對此擅長。一個放射醫(yī)生新手剛開始也是觀察易于分類的照片進(jìn)行訓(xùn)練的,而后達(dá)到一定的熟練程度后就可以應(yīng)對更困難的情形,這種進(jìn)步過程,既幫助了機(jī)器,也幫助了他人。
人類計(jì)算在科學(xué)研究上所體現(xiàn)的非凡成就,最引人注目的當(dāng)屬Fold it項(xiàng)目了。參與者被要求盡可能以最有效的方式折疊虛擬蛋白質(zhì)。該目標(biāo)是為了解決分子生物學(xué)一個最重要難題:蛋白質(zhì)折疊是如何這般迅速和有效的?該項(xiàng)目開始后不久,就發(fā)現(xiàn)猴免疫缺陷病毒調(diào)節(jié)蛋白的三級結(jié)構(gòu),這個問題曾經(jīng)困擾了該研究群體數(shù)十年,如果得到解決可能會找到應(yīng)對艾滋病病毒的新方法。另外,宇宙動物園(Zooniverse)項(xiàng)目要求公民科學(xué)家確定月球上的環(huán)形山,幫助翻譯舊船的行船日志,在天文圖像中確定星系,并發(fā)現(xiàn)其他恒星周圍的行星,都是利用眾包來進(jìn)行科學(xué)研究的重要案例。
信息科學(xué)建立在這些早期的成功上,證明推進(jìn)人類計(jì)算系統(tǒng)的潛力可以模擬和解決一些經(jīng)濟(jì)、環(huán)境和社會政治系統(tǒng)交叉的奇怪問題(那些挑戰(zhàn)傳統(tǒng)解決問題的方法)。從上我們看到,在過去幾年里,由于眾包市場和一些巧妙應(yīng)用程序的出現(xiàn),人類開始實(shí)現(xiàn)一些之前不可能完成的任務(wù)。通常情況下,這樣的應(yīng)用涉及到人類需要利用人類的智慧執(zhí)行某些形式的計(jì)算,如圖像分類、翻譯、蛋白質(zhì)折疊這些問題對目前最先進(jìn)的人工智能算法來說也是一個幾乎難于完成的挑戰(zhàn)。
今天,由于計(jì)算機(jī)科學(xué)家、眾包先驅(qū)者和遠(yuǎn)見者的努力,創(chuàng)造了研究人類計(jì)算的路線圖,使我們能從中得到各種答案。人類計(jì)算系統(tǒng)已經(jīng)非常成功地解決一些復(fù)雜問題,從確定螺旋星系到組織賑災(zāi)。而且,只要人類認(rèn)知可以在全球范圍內(nèi)有效地利用,他們的潛力仍將變得越來越強(qiáng)大。這些目標(biāo)都是非常有價值的,但會產(chǎn)生一些重大問題。其中最重要是倫理、法律的本質(zhì)以及人類計(jì)算的社會影響。如何設(shè)計(jì)這個工作才能允許有意義的和有尊嚴(yán)人類的參與?獲得何種結(jié)果才能讓最弱勢人群從中受益?機(jī)器與人類之間產(chǎn)生特定結(jié)果的最優(yōu)分工是什么?
你能讀懂這段文字嗎?
責(zé)編:微科普網(wǎng)