人類現(xiàn)存于世的語言有六七千種之多,哪一種是效率最高的語言呢?法國里昂大學(xué)的語言學(xué)家給出了一個(gè)衡量標(biāo)準(zhǔn)——信息率,即在相同時(shí)間內(nèi)表達(dá)的信息量的多少,信息率越大,效率就越高。2010年,他們選取了世界上講得最多的7種語言:英語、法語、意大利語、日語、西班牙語、漢語和德語,計(jì)算了它們的信息率,最后得出英語的信息率是最大的,意味著英語是最高效的,這也為英語能稱霸全球找到了一個(gè)新原因。那么,具體說來,這些語言又該如何比較呢?又是什么影響了它們的速度和信息量呢?
英語PK德語
我們不妨選一個(gè)簡單的句子做個(gè)比較。比如在英語中,當(dāng)一位父親說要一個(gè)小孩到他身邊來時(shí),是這樣表達(dá)的:“The father said:‘Come here’”可以看到,這個(gè)語句明確說明這兒有一個(gè)父親,他說話的動(dòng)作是過去式,他表示孩子應(yīng)該靠近他的位置是“here”。
那么,其他語言又是怎么表達(dá)的呢?相同的意思,德國人會(huì)說:“Der Vater sagte:‘Komm her!’”這個(gè)句子看上去與英語句子差不多,其實(shí)有很多不同,“der”表示“the”,雖然也是特指,但“der”只用在男性名詞之前。如果這句話是一個(gè)母親說的,那就要使用女性冠詞,“Die”,或者一個(gè)孩子的,要用到中性詞“Das”。
那我們?cè)倏纯幢硎?ldquo;說”的動(dòng)詞“sagte”,這個(gè)詞其實(shí)表示的是第三人稱的過去式。如果主語是第一人稱,比如你,那將是“sagtest”。在英語中,這些形式過去式并不會(huì)變化,無論你我他,“說”的過去式都用“said”表示。
再看另一個(gè)差異,“her”意思是“to here(到這里)”;如果想表達(dá)“這里”,德語會(huì)有一個(gè)不同的詞語:“hier”。
從這個(gè)德語句子里我們能看出什么不同呢?可以看出,德語要求我們更加注意人和物體的性別,注意到是我還是你、她、他或者我們、他們發(fā)出的動(dòng)作。它也需要人們辨別的不僅是說話人在哪兒,而且是否這個(gè)人正在靠近或者遠(yuǎn)離。這樣對(duì)比下,一個(gè)相同的意思,德語信息量不大,反而單詞量更多,意思重復(fù)。比如既然有單詞表示父親的意思,前面表示性別的詞語完全可以省略。所以,德語比英語更復(fù)雜,也更不簡潔。里昂大學(xué)的研究顯示,德語的信息密度只有0.79,音節(jié)率只有5.97,而英語信息密度達(dá)到0.91,音節(jié)率為6.19,總體的信息率比德語高0.18,所以更有效率。
漢語的效率
那么,漢語又是如何表達(dá)的呢?很簡單,一句話:“父親說:到這兒來!”和英語一樣,漢語對(duì)父親的性別沒有特別指明,動(dòng)詞“說”也沒有暗示說話者的人稱是第一人稱還是第三人稱。像英語“here”一樣,“這里”既可以表示在這里,或者到這里來的意思。
然而,比起英語,漢語更具暗示性,比如父親的前面沒有定冠詞“the”,而且也沒有標(biāo)出時(shí)態(tài),“說”這一動(dòng)詞的過去、現(xiàn)在、將來時(shí)的時(shí)態(tài)都是一樣的。這就說明漢語比英語的象征性更強(qiáng),語言用得更簡潔。里昂大學(xué)的研究也顯示,漢語的信息密度為0.94,是七種語言中密度最高的。那么,漢語為什么反而沒有成為這幾種語言中最有效率的語言呢?這是因?yàn)闈h語在語速上敗給了英語。研究顯示漢語的音節(jié)率為5.18,而英語則高達(dá)6.19,綜合衡量,英語的信息率為1.08,漢語則為0.94,略高于德語。
然而,這樣的比較還是小范圍的比較,那么,世界上其他的語言又是怎么樣的呢?
最沒效率的語言
如果有人要設(shè)立一個(gè)“最沒效率的語言獎(jiǎng)”,大概卡巴爾達(dá)語可以獲此殊榮?ò蜖栠_(dá)語也被稱為切爾克斯語,屬于高加索語言體系,主要在土耳其及中東的一些地方使用。它能力壓群雄成為最沒效率的語言的原因是一個(gè)單詞的意思會(huì)大量重復(fù)。
比如,英語里有個(gè)句子是“The men saw me”,鑒于卡巴爾達(dá)語表達(dá)這個(gè)意思的句子實(shí)在太長,我們僅挑選一個(gè)詞來做個(gè)比較。比如“saw”(看見了),對(duì)應(yīng)的卡巴爾達(dá)語是sǝq’ayǝƛaaɣwǝaɣhaś(大致發(fā)音像英語“SUCK-A-LAGH-A-HESH”)。我們知道語言的書寫都是千奇百怪的,世界上也可能有比卡巴達(dá)爾語更長的單詞,但為什么說它很沒效率呢?這個(gè)也是有原因的。
在解釋這個(gè)問題前,我們需要看看另外一個(gè)類似的英語單詞,supercalifragilisticexpiadocious,這個(gè)單詞由34個(gè)字母組成,出自1964年美國電影《歡樂滿人間》的插曲,實(shí)際上可以拆分成五個(gè)單詞:super(非常,超越),cali(美麗),fragilistic(易碎的),expiali(補(bǔ)償)和docious(可教育的),組合在一起的意思是“用易碎的美麗補(bǔ)償可教育性的缺失”。sǝq’ayǝƛaaɣwǝaɣhaś跟這個(gè)組合的原理很類似,也是由不同意思的字根組合起來的。然而,為什么英文中這個(gè)有34個(gè)字母的詞不能說是沒效率的呢?這是因?yàn)榭ò蜖栠_(dá)語這個(gè)單詞并沒有像這個(gè)英語單詞傳達(dá)那么多的意思,反而在一個(gè)問題上反復(fù)糾結(jié),實(shí)在像一個(gè)裹腳布又臭又長。
比如,“sǝq’ayǝƛaaɣwǝaɣhaś”,絕不是簡單的“看見”的意思,它的一些字根重點(diǎn)強(qiáng)調(diào)的是“我”被看見了,其實(shí)整句話里已經(jīng)有一個(gè)單獨(dú)的詞語表示“我”。然而,不止這一點(diǎn),還有其他的字根重點(diǎn)強(qiáng)調(diào)看見我的是那些男人而不是別的人,盡管整個(gè)句子會(huì)闡明是那些男人們(復(fù)數(shù))看見了我,還是有字根強(qiáng)調(diào)“我”是被多個(gè)人看見。另一些字根則強(qiáng)調(diào)這個(gè)事件發(fā)生在過去而不是現(xiàn)在或未來,然后還有的字根會(huì)暗示這個(gè)人沒有開玩笑,他真的在說他正在說的事情。
總之,一個(gè)簡單的英文單詞“saw”,換成說卡巴爾達(dá)語的高加索人表達(dá),他用了一個(gè)詞“sǝq’ayǝƛaaɣwǝaɣhaś”,他不僅表達(dá)看見了的意思,還在強(qiáng)調(diào)“看見的是“我”、是許多人看見的我,我沒有開玩笑”等等,是不是看得有點(diǎn)繞?很明顯,卡巴達(dá)爾語包含了太多重復(fù)的無意義的信息,很啰嗦,所以當(dāng)之無愧地被評(píng)選為最沒效率的語言。
最有效率的語言
見識(shí)了世界上最沒有效率的語言后,世界上最有效率的語言又是哪一種呢?
這個(gè)獎(jiǎng)項(xiàng)可以頒給印度尼西亞的某些方言,這些語言很少被書寫,但幾百萬人使用它來交流日常生活信息。例如,在印尼的蘇門答臘,一些方言就特別地省事,比如,“ayam”意思是“雞”,“makan”表示“吃”的意思,但“ayam makan”這句話,不僅僅可以表示“雞正在吃”的意思。根據(jù)上下文,“ayam makan”可以有幾十種意思,可能意味著“一只雞正在吃”,“一群雞正在吃”,“一群雞將正在吃”,“雞在吃”,“一群雞吃了”,“有人正在吃雞肉”,“有人正在等著吃雞肉”,“那只正在吃的雞”、“雞正在吃的地方”、“當(dāng)雞正在吃的時(shí)候”……可以看出,“ayam makan”這一句可以不分時(shí)態(tài)、不分單復(fù)數(shù),甚至連主語都可以不分,到哪兒都通用,確實(shí)簡潔又實(shí)用。
終極語言
這就說明印尼語就應(yīng)該是用于交流的最佳語言嗎?這倒不盡然,在人類語言中,語言學(xué)家們認(rèn)為任何一種語言其實(shí)都比實(shí)際需求所需要的都稍稍復(fù)雜點(diǎn),隨意性和多義詞無處不在。所以,如果要想尋找一種人類交流的最佳語言,我們應(yīng)該可以創(chuàng)建一個(gè)新的人工語言,宗旨是“邏輯、簡潔、信息量大”,同時(shí)最大限度地減少模糊性、不合邏輯、冗余性、多義詞和隨意性。
有趣的是,還有人真的發(fā)明了這種語言Ithkuil,由俄羅斯的一個(gè)語言博士創(chuàng)造,他發(fā)明語言的初衷是消除交流過程中的所有模糊性,歷經(jīng)30年完成。由于高度抽象性,Ithkuil被稱作是世界上最簡潔也最難的語言,比如Ithkuil語言的一個(gè)句子是這樣的:
Aukkras êqutta ogvëuļa tnou’elkwa pal-lši augwaikštülnàmbu。
翻譯成英文是這樣的:
An imaginary representation of a nude woman in the midst of descending a staircase in a step-by-step series of tightly-integrated ambulatory bodily movements which combine into a three-dimensional wake behind her, forming a timeless, emergent whole to be considered intellectually, emotionally and aesthetically。(在一幅假想圖上,一個(gè)裸體女人在下樓梯的過程中,一步一步行走時(shí),身體的模糊運(yùn)動(dòng)在身后組成了一個(gè)立體的虛構(gòu)軌跡,形成了一幅永恒的浮動(dòng)的畫面,兼具理性、感性和美感。)
很明顯,Ithkuil語信息密度更大,解讀意思更像是一個(gè)高級(jí)智慧生物的智力游戲,因?yàn)檎Z調(diào)、字形、哪怕是間隔符都已經(jīng)參與進(jìn)來制造意義,這種高度抽象性的語言也被視為目前為止最有效率的語言。然而,由于難度太大,即使發(fā)明者也沒法講流利。所以,目前這種語言實(shí)用性不大。
責(zé)編:微科普