當我告訴別人我在學習中文時,他們常常會問「連中國字都學嗎?那部分一定是最難的 」。這種信念看起來是很普遍的,似乎連有些中文老師也這樣想。比如: 中國文化叢談 (我的課本)第64頁:「 西方人學説中國語,不必學説別的外國話難,可是學讀中文,是比較難的 」 The Chinese Language: Fact and Fantasy (作者是一位中文教授) 第52頁:Overall, for a native speaker of English, learning to speak Chinese is not much more difficult than learning to speak French. It is in the traditional writing system that the greatest difficulty is encountered…Perhaps we can put things in perspective by suggesting, to make a rough guesstimate, that learning to speak Chinese is about 5 per cent more difficult than learning to speak French, whereas learning to read Chinese is about five times as hard as learning to read French. (這兩位作者的陳述似乎並不憑任何證據,仿佛是他們的個人意見而已) 我個人的意見是完全不一樣的,甚至是相反的:我認爲漢字其實是學習中文最容易的部分。這樣一説,你可能有兩個疑問。第一:爲什麽?第二:如果學中文最難的部分不是漢字, 那是什麽? 我現在解釋。首先, 我們得承認說漢語的歧義程度,跟寫漢語的比起來高得多。這是因爲從漢字到相對應聲音的函數是多對一的。説到這裏,你也許會反對:「每一個語言都是這樣!拿英文做例子,「red」和「read」有相同讀音,但是寫法卻不一樣 」。沒錯,每一個語言都有這種現象,有倒是有,差別在於多少。我認爲跟英文類型的語言相比,中文裏同音詞多很多,而且這正是學中文最難的部分。爲什麽這樣認爲呢?我們先來看幾個例子,然後再系統化的分析。第一個例子是一首詩。這首詩很有名,可能一些讀者已經很熟悉。我們先用寫下來的語言看: 施氏食獅史 石室詩士施氏,嗜獅,誓食十獅。氏時時適市視獅。十時,適十獅適市。是時,適施氏適市。氏視是十獅,恃矢勢,使是十獅逝世。氏拾是十獅屍,適石室。石室濕,氏使侍拭石室。石室拭,氏始試食是十獅屍。食時,始識是十獅,實十石獅屍。試釋是事。 這首詩是用文言文寫的,因此對文言文不太熟悉的讀者(這包括我)可能會覺得有點難看得懂。可是, 只要受過文言文的訓練,就能讀懂了。可是,朗讀出來的話,這首詩就變成: Shī Shì shí shī shǐ Shíshì shīshì Shī Shì, shì shī, shì shí shí shī. Shì shíshí shì shì shì shī. Shí shí, shì shí shī shì shì. Shì shí, shì Shī Shì shì shì. Shì shì shì shí shī, shì shǐ shì, shǐ shì shí shī shìshì. Shì shí shì shí shī shī, shì shíshì. Shíshì shī, Shì shǐ shì shì shíshì. Shíshì shì, Shì shǐ shì shí shì shí shī. Shí shí, shǐ shí shì shí shī shī, shí shí shí shī shī. Shì shì shì shì. 以上,我敢説,連文言文的大師都聽不懂。我也敢説,像這樣的現象在英文裏,簡直是不可能發生的。既然連聽力完美的中文母語者也聽不懂, 對聽力不太好的洋鬼子來説,問題更多。假如你是一位弄不清楚聲調的老外,這首詩就會是「shi」,這個聲音,重複了89次而已。 那,這個情況當然是極端的。普通的情況呢?按照我所有的經驗,説出來的中文的歧義的程度雖然沒有以上那麽極端,但是跟英文的比起來,還是比較高。我聽中文的時候,因爲同音詞太多,我沒辦法聽得懂一個一個的單詞,我得靠一個詞旁邊的詞才能猜出來是哪一個詞。我覺得這個現象跟別的語言很不一樣。比如説,幾年以前我曾經學過一點日語。開始學習不久,我就發現我看日本動畫的時候,我能聽得懂一些單詞。比方說: **&$&*##**** anata wa **** $&$^#^@ *** sayonara ****#E$_#### watashi wa &&&$&&$&$… 學中文的情況並不是這樣的。我開始聽得懂的時候,不是聽得懂一個一個的單詞,而是一整個詞群,比如說: @&*^$&*@&*@# 我今天要去 *#*$(Q*#&&*($*&(#*(&*$ 聽説他要 &*(*(#$&(#& 這個周末… 我是一個科學家,因此, 我想用科學方式來有系統地分析中文的歧義程度。上個周末,因爲我在準備給同學講一個關於語言學的演講,我就利用這個機會做了一個實驗。 解釋我的實驗之前,我得先要承認:説出來的中文的歧義程度取決於聽者的聽力和説者的口音。拿數字做例子: 如果説話者説得很標準,而聽者的聽力也完美 ,我們就會有以下的情況: 在這種情況之下,每個數字的差別都聽得出來,沒有什麽問題。那,假如聽者是一個弄不清楚聲調的洋鬼子: 這情況之下,每個數字的差別還是都聽得出來,仍然沒有什麽問題 。可是,最後假如我們有兩種問題:聽者仍然弄不清聲調的分別,而且説者的口音不標準,是臺灣口音,就是會把「shi」説成「si」的。 在這種情形之下,像我這種樣弄不清楚聲調的洋鬼子「十」跟「四」的分別是聽不清楚的。實際上,在臺灣很多人有這種口音,因此我也經歷過這樣的問題幾次(比方説,在7-11買東西時)。 現在我要說明我的實驗了。首先,我應該説明一下我實驗的目標。我試驗根本的目的就是量化説出來的中文的歧義程度,同時考慮到聽者和説者的缺點。聽者的聽力弱點除了弄不清楚聲調的分別,也有可能分不出來像「小」跟「少」,「出」跟「區」,「找」跟「腳」,「收」跟「修」,「上」跟「像」,「洲」跟「鳩」,這樣的詞。這就是説,分不出來「sh」跟「xi」,「chu」跟「qu」,「zh」跟「ji」,「ou」跟「iu」的聲音。從現在起,我會管這樣的詞叫「近音詞」。而且,如果兩個不同的詞是「同音詞」 或是「近音詞」,我會管它們兩個都叫做「同音詞」或是「近音詞」。 現在我要説明測試的過程。首先,我把 HSK 6 (一個標準中文考試)的詞彙下載到我的電腦裏,然後我寫了一個程式,用這個程式分析這些詞彙。怎麽分析呢?簡單的說,我想知道的是:這些詞彙裏面的「同音詞」和「近音詞」的數量有多少?換一句話來説, 在這些詞彙的裏面,有百分之多少不是同音詞,也不是近音詞? 現在我來談談我的結果。這些詞彙的數量,用漢字寫的話,是5011個。可是其中有337是同音詞。這就是説,在這個詞彙的裏面7%是同音詞。最麻煩的單字讀音是「wèi」,不知道是「位」,「喂」,「為」,「畏」,或是 「胃」。最麻煩的雙字讀音就是「xíngshì」:不知道是指著「刑事」, 「形勢」, 或是 「形式」。 那,假如你是一個聽不見聲調的洋鬼子。這些詞彙的數量,用漢字寫的話,是5011個。可是這樣一算,其中1071詞是「近音詞」。這就是説21%是「近音詞」。從這個統計我們可見要聽懂中文,注意聲調很重要!最麻煩的單字讀音是「zhi 」不知道是「之」,「指」, 「支」, 「枝」, 「直」,「只」,或是 「隻」。 最麻煩的雙字讀音就是 「yizhi」:不知道是指著 「一直」, 「一致」 , 「以至」, 「以致」, 「意志」, 或是 「抑制」。 現在假如我這個老外不但聽不見聲調的分別,而且還弄不清楚「小」跟「少」,「出」跟「區」,這類的聲音。這樣一算我們就有1128個「近音詞」,22%,跟以上的情形差不了多少。這樣的聽力缺點跟弄不清楚聲調比起來,好像不太重要。最麻煩的單字讀音是「xiang」不知道是「上」,「像」,「嚮」,「巷」,「想」,「響」,「項」,或是「香」。 最麻煩的雙字讀音就是仍然是「yizhi」。 最後假如聽者有以上的缺點,再加上説話者有臺灣口音,就是會把「shi」説成「si」的。這樣一算,1147詞是「近音詞」,23%,也差不了多少。最麻煩的雙字讀音 還是「yizhi」,但是最麻煩的單字讀音是變成「 si/shi」了。有9個可能:「使」,「十」,「四」,「 拾 」,「撕」,「是」,「死」,「試」,「詩」。 那,如果我真的要證明中文的同音詞比英文的多得多,我應該下載一個英文詞彙 ,然後做了一個像以上的測試。到目前爲止,我沒有時間做這個實驗。除此之外,我的實驗還有不少別的弱點。 第一: 我的詞彙範圍不夠大。 第二:我忽略詞頻率。 第三:我忽略了單詞上下文。 第四:我沒查有沒有任何別人做了這樣的實驗。 我要强調一下,這個實驗並不是一個詳細的分析。因爲以上的缺點,這個測試什麽都不證明。可是,我認爲這個測試的結果還可以讓我們了解大概的情形。其中,我們可見聲調的重要性:忽略聲調的話,同音詞就增大了三倍左右。 可是,就算你的聽力是完美的,那,同音詞還是太多了。我認爲這是爲什麽中文電影幾乎都有字幕。用漢字把中文寫下來,歧義才很低。因此,學中文的時候,你的敵人並不是漢字,而是同音詞和近音詞的歧義。跟這個敵人作戰時,最大的武器就是漢字。