人類(lèi)能夠本能地學(xué)會(huì)諷刺,不需要?jiǎng)e人幫助就能聽(tīng)出話語(yǔ)里的嘲諷腔調(diào)。要讓機(jī)器弄明白這些可要困難得多,因?yàn)樗鼈儠?huì)嚴(yán)格按照程序設(shè)置來(lái)讀取文字信息,通過(guò)數(shù)據(jù)編碼的形式來(lái)記錄圖片,不會(huì)想到這些信息背后的意義。如果計(jì)算機(jī)能夠更好地理解網(wǎng)絡(luò)社交媒體上的信息,連諷刺也能讀得懂,該有多么奇妙!別著急,在計(jì)算機(jī)專(zhuān)家的努力研發(fā)下,這項(xiàng)技術(shù)突破似乎很快就能實(shí)現(xiàn)了。
計(jì)算機(jī)讀懂諷刺不容易
意大利都靈大學(xué)計(jì)算機(jī)專(zhuān)業(yè)助理教授羅薩諾·史芬尼拉和雅虎公司的研發(fā)人員正試圖開(kāi)發(fā)一款諷刺探測(cè)引擎,使計(jì)算機(jī)明白人類(lèi)語(yǔ)言中蘊(yùn)含的意思并不總跟表面意思一個(gè)樣。
描述我們是如何學(xué)會(huì)諷刺,有時(shí)是很難的,因?yàn)檫@取決于許多背景信息。識(shí)別諷刺需要認(rèn)清這些語(yǔ)境,這和篩除垃圾郵件和進(jìn)行情感分析都大有不同。研究人員觀察了大量文字和圖像,努力尋找能夠讓計(jì)算機(jī)理解信息真正意義的線索。他們發(fā)現(xiàn),如果只看文字本身是不夠的,圖像提供了重要的背景信息,比如說(shuō),一幅冠以“天氣好爆了”的下雨圖片,放在準(zhǔn)備出游的逍遙長(zhǎng)假背景下來(lái)說(shuō),其實(shí)就是很掃興的意思。
讓計(jì)算機(jī)像人一樣識(shí)別諷刺,何不先看看人類(lèi)對(duì)諷刺的辨識(shí)結(jié)果?研究人員創(chuàng)造出一種群體采樣工具,讓眾多以英語(yǔ)為母語(yǔ)的網(wǎng)絡(luò)志愿者們對(duì)社交媒體上發(fā)布的圖像和信息進(jìn)行分類(lèi),分辨這些信息是否具有諷刺性。首先,志愿者們只評(píng)價(jià)僅含文字的論述,然后,再對(duì)含有配圖的信息進(jìn)行分類(lèi)。志愿者們對(duì)于諷刺的看法也不總是一樣,不過(guò)研究人員發(fā)現(xiàn)多數(shù)情況下,有圖像的信息能夠讓讀者更好地了解文字背后的諷刺信息,更容易看出文字中的諷刺之意。
根據(jù)這一點(diǎn),研究人員設(shè)計(jì)出一種計(jì)算機(jī)算法,以數(shù)據(jù)的形式向計(jì)算機(jī)呈現(xiàn)了人類(lèi)對(duì)諷刺信息的判定,這使得機(jī)器能夠使用這些基礎(chǔ)信息來(lái)審查新發(fā)布的信息,判斷這些信息中是否含有諷刺意味。采用這一算法,加上圖片輔助,計(jì)算機(jī)可以識(shí)別社交網(wǎng)絡(luò)信息中80%~89%的諷刺語(yǔ)氣。因?yàn)楦鱾(gè)平臺(tái)上發(fā)布的信息運(yùn)用諷刺的風(fēng)格略有不同,所以測(cè)評(píng)的結(jié)果也會(huì)略有差別。目前來(lái)說(shuō),計(jì)算機(jī)對(duì)于有配圖信息的文字能夠理解得更好,如果只有文字沒(méi)有配圖,計(jì)算機(jī)可能就會(huì)有點(diǎn)發(fā)懵,辨識(shí)諷刺的效果會(huì)差一些。
讀懂諷刺的重要意義
通過(guò)改進(jìn)計(jì)算機(jī)算法,未來(lái)計(jì)算機(jī)在基于學(xué)習(xí)的深度神經(jīng)式網(wǎng)絡(luò)支持下會(huì)有更好的發(fā)展,計(jì)算機(jī)對(duì)諷刺語(yǔ)言的學(xué)習(xí)能力也會(huì)相應(yīng)提高。同時(shí),社交網(wǎng)絡(luò)將會(huì)源源不斷地提供龐大的數(shù)據(jù)信息,讓計(jì)算機(jī)更準(zhǔn)確地理解人類(lèi)的語(yǔ)言。計(jì)算機(jī)學(xué)習(xí)就像小孩子看棒球比賽一樣,只看一場(chǎng)球,可能并不明白比賽規(guī)則,但是比賽看得夠多了,就會(huì)慢慢弄懂規(guī)則了。
諷刺是我們語(yǔ)言中非常重要的一個(gè)部分,識(shí)別出語(yǔ)言中的諷刺具有重要意義。計(jì)算機(jī)的這種新能力可以幫助市場(chǎng)經(jīng)理更好地評(píng)估公眾對(duì)于其產(chǎn)品的意見(jiàn),分辨消費(fèi)者的評(píng)論到底是在夸他們的產(chǎn)品還是在批評(píng)產(chǎn)品的問(wèn)題,由此相應(yīng)地調(diào)整策略,改進(jìn)產(chǎn)品,以向客戶銷(xiāo)售更多東西。此外,精明的計(jì)算機(jī)還能夠幫助執(zhí)法機(jī)構(gòu)通過(guò)社交網(wǎng)絡(luò)上帶圖片的帖子看到人們對(duì)于一些案件或法令的意見(jiàn),更好地維持公平,有針對(duì)性地對(duì)缺乏法律常識(shí)的人推送相關(guān)法律信息,預(yù)防一些人因?yàn)闊o(wú)知而犯下罪行。國(guó)外政客進(jìn)行選舉的時(shí)候也可以用這樣的系統(tǒng)準(zhǔn)確了解民意,給出更好的競(jìng)選方案,改變那些起反作用的選舉策略,減少不必要的損失。
在新技術(shù)的推進(jìn)下,計(jì)算機(jī)正變得越來(lái)越像我們,能更好地與人類(lèi)溝通。隨著這項(xiàng)技術(shù)的成熟,未來(lái)計(jì)算機(jī)說(shuō)不定也會(huì)和我們開(kāi)玩笑,像好朋友一樣調(diào)侃你我。
責(zé)編:科普知識(shí)網(wǎng)