1.11.2010

簡體字的歧義問題

有一些人說,跟繁體相比,簡體的劣勢之一是有比較多歧義字,例如簡體的「后」同時代表「后」跟「後」,這可能在語言使用上造成一些麻煩。

我不同意這種說法。

在所有的自然語言裡,文字的歧義都可以靠脈絡(上下文)來排除,所以一字多義本身不見得會造成任何困擾。如果你是一個語言設計師,你不會企圖排除所有一字多義,因為那代表你得將所有字義都對應到一個獨特的字,而如果你這樣做,你的語言裡將會有無法想像多的數量的字,這樣的語言根本就無法被學習和使用。所以,比較實際的策略應該是適當地允許一字多義,然後依靠脈絡來化解。例如,你可能會設計一個字「便」,讓它同時有「不麻煩」和「排泄物」的意思,它是個歧義字,不過沒關係,只要你為它跟其它字設計不同的搭配用法(例如「便利」、「大便」),就不會出問題。事實上,就算你忘了做這件事,也不用擔心︰自然語言是活的,如果值得注意的歧義問題常常出現,就會有人想到新的用法和搭配來解決它,而這個新用法也不見得包含藉由創造新的字來減少歧義。

換言之,在語言中,要有多少歧義字只是策略問題︰歧義字少的語言允許你用比較少的字構成一個句子,因為每個字都只有一個意思,不需要添加上下文來排除歧義。然而,這種語言同時也要求你記憶比較多個字。相對地,學習歧義字多的語言不需要記太多種字,但是就得在使用時適當地添加脈絡,排除歧義。

想像一下,你收集了所有可能的語言種類,依照歧義字的多寡排成一列,歧義字最多的語言排在最左邊,歧義字最少的語言排在最右邊︰

歧義字最多...........................歧義字最少
我們可以很確定,屬於最右邊「沒有歧義字」那一區的語言不是我們想用的,因為可能沒人有辦法學會它。我們也確定偏左邊「所有字都有20種以上的意思」那一區的語言也不是我們想用的,因為用起來太麻煩。值得注意的是,在這一長串語言的隊伍中,繁體和簡體中文會排得很近,因為它們之間歧義字的數量可能只相差500個,在這時候,要選擇哪種語言,就不見得有明顯的判準了。

歧義字最多..........簡體..繁體...........歧義字最少
或許,慣用繁體中文的人會說簡體是個爛語言,因為簡體「后」、「後」不分,會造成混淆。然而,這並不能算是簡體的缺點,因為慣用簡體字的人早就習慣了那些為「后」添加適當的脈絡以避免誤解的方法*1。不過,這樣的回答可能沒辦法滿足那些慣用繁體的人,因為他們可能會這樣講︰
必須要在句子裡多添加一些字,才能避免歧義造成的混淆,這就是簡體的缺點啊︰要達到精確的溝通,簡體在使用上比繁體更麻煩。
對於這種想法,我有幾個回應︰
  1. 如果一句話中使用的字的數量真的是語言使用的負擔,你應該早就放棄「蜻蜓」、「杯子」、「老虎」這些詞,並且用「蜓」、「杯」、「虎」取代它們。你沒有這樣作,就表示事實上你身為語言的使用者並不在意自己講的話是不是多了一些不必要的字,或者主觀習慣的爽度比簡約更重要。

  2. 事實上,語言的使用者似乎也並不是都很在意自己講出來的句子的意思是不是精確。要是他們真的都認為避免歧義很重要,網路上面(以及報紙上、大學生的報告上)就不會有那麼多文法、贅字和選字的錯誤。當然,這不是說容易發生歧義並不是語言的缺點,只是在說︰

    1. 這個缺點並沒有大多數以此反對簡體的人想像中那麼重要,以及
    2. (要是那些網路使用者、記者和大學生並不是不願意,而是沒有能力製造出精確的句子,那麼)要改善實際溝通中的歧義問題,加強語文教育很可能比改變語言更有效。

  3. 假設,在那一長串語言隊伍中,排在繁體右邊的是一個叫做「超繁體」的語言︰

    歧義字最多......簡體..繁體..超繁體......歧義字最少
    這個語言擁有比繁體更多的字,更少的歧義,例如說,在繁體裡「便」同時有「方便」、「糞便」、「隨便」三種意思,然而,在超繁體中,這三種意思分別被「玣」、「汳」和「苄」代表。

    要是你遇到一個超繁體的慣用者,問他覺得繁體如何,他很可能也會說繁體是個爛語言︰「在繁體裡,「玣」、「汳」、「苄」全都寫成「便」,用的時候還要多加字變成「方便」、「糞便」、「隨便」才能區分,多麻煩啊!」然而,作為繁體的使用者,你一點也不覺得寫成「方便」、「糞便」、「隨便」有什麼麻煩的,也不覺得「便」的一字多義會造成困擾,更不會因此承認繁體在任何客觀意義上比超繁體差。這就代表,這些關於麻不麻煩的抱怨,除了表現語言慣用者的偏見之外,根本無法證明這些自然語言在歧義上的小差異在實際使用上的影響程度。



註解︰
  1. 我私自猜測,在大多數情況下其實根本就不需要添加什麼脈絡,因為「后」、「後」這兩種概念差太多了,而且一個常作名詞一個常作介係詞,不太可能混淆。不過我還是假定在這裡添加脈絡是必須的,因為我相信你可以想到很多其它不添加脈絡就會出問題的簡體字的例子。

23 則留言:

  1. 說的不錯,
    在下也認為只要巧妙地把不同意義assign到不同的字詞,
    一字多義是不會引致太大的問題.

    其實對繁體字的使用者而言,
    真正的問題怕且是用的字突然少了, 感到不習慣, 不舒服吧.

    回覆刪除
  2. 1.你不能用根本不存在的超繁體--繁體來類比繁--簡。
    因為由簡入繁不是文字演變的方向,而且就算它曾經出現過,它也因為不合時宜或不為接受而消失了。但是繁體是歷史演變的結晶,就算它可能演變下去,也不會是簡體這種粗糙的改造。因此這個比喻沒有任何意義:使用存在性不合理的東西去類比已存在的事實。

    2.實際上就是簡體造成了更多歧義,所以我要浪費更多空間和能量來作完整的表達。

    3.口語和正式文章不同,口語不在乎的東西,不代表在正式文章中沒有意義。再者由網路用語次文化不能直接推論是語言教育的缺失,而且次文化本不是全體認同,次文化中不在乎的東西,也只能代表使用它的人的立場,不能推廣至整體文化(正式文字)的改造。

    回覆刪除
  3. 更正1
    超繁體也許可能存在,但它不會是和中文字同一個脈絡的
    若是,現存的繁體就是最好的了--自然演變的結果
    (而顯然簡體的出現並不自然)
    若不是,那何以能夠類比繁體字的意義呢

    回覆刪除
  4. 語言的自然演變應該是在這個語言隊伍中時而往左、時而往右。正體字也不乏筆畫複雜的字被簡單的字取代;反之,若一個歧義字形成太多困擾,可能就會用不同的字代替或是在句子中添加更多字。

    簡體中文雖然是從正體字而來,但那是基於政治或其他因素的考量而非自然演變。它應該被視為一套全新的語言文字,而不只是簡化的正體中文。

    就像我們不會因為日文或韓文中有不少漢字就拿它們來跟中文(不論是正體字或簡化字)作比較,或是硬要從中挑一個「優秀」的來用。

    回覆刪除
  5. 米︰

    1.你們似乎把自然演變當成一個語言具有效率的證明,但是這件事不是你們說說就算的欸。

    2.我覺得你在乎的不是簡體字真的造成了比較多麻煩的添字,而是只要是跟你現在慣用的語言不一樣的添字通通都是麻煩的添字。如果我們要討論的是「對一個繁體慣用者而言,哪種語言比較麻煩?」那我的意見當然跟你一樣。但是如果我們打算討論「不預設語言使用者原有的語言習慣,繁體和簡體哪一種會造成他學習和使用上比較大的麻煩?」你就不能再用這種有偏見的方式來區別麻煩的添字和不麻煩的添字。

    3.我也可以用國立大學生的期末考問答題答案,或者期末報告來舉例。我剛剛才改完一疊,我相信結果沒有好到哪去。

    WanCW︰

    老實說在用那個語言序列來說明的時候我從來都沒想過哪個語言是自然演變的哪個語言是政治製造的,我也沒有預設排在一起的語言們都有互相演變(或者任何其它)關係。只是想用那串隊伍說明,簡繁之間的歧義字差距,可能不是什麼大不了的事情。

    回覆刪除
  6. WanCW︰

    不過我的說法好像還滿容易造成誤解的,我看一下要怎麼補充...

    回覆刪除
  7. 先更正一下,我為了方便而直接沿用文章裡的隊伍比喻,不過我指的僅是語言在「歧義字多寡」這個維度上的變化。

    ----
    如果其他特性沒有明顯地改變,只把歧義字變多(例如:把台灣使用的中文全部改用簡化字書寫),我相信絕對是弊大於利。

    但是兩岸使用的中文絕對不是只有歧義字多寡的差距。就算能夠證明兩者的歧義字程度差距懸殊,也不足以說明其中一個是比較好的語言。(另一個問題是,有所謂「比較好的語言」這種事情嗎?)

    我之前一直沒弄清「正體中文改用簡化字書寫」跟「使用簡體中文」是兩件事情。我雖然反對前者,但是對後者也就只是不習慣而已。

    回覆刪除
  8. 隨著科技發達,字體幾乎已經不再【自然演化】了
    語意的話還有可能...

    回覆刪除
  9. WanCW︰

    啊,我同意你的看法。

    threetree︰

    哈,我這兩天也剛好想到同一件事。就算我們想要有新的字,電腦裡的字型檔也不允許我們那樣幹。

    不過我想我們都會同意,這並不代表字體演化受到了不可突破的限制,只代表字體演化的重要性還沒有大到讓我們願意為了它開發一個能讓大家自由創造新字,並且方便地同步所有連上線的電腦的字型檔的系統。並且,字體演化也不是語言演化的唯一方式,「囧」並不是新字體,但是一樣是個剛(大概可以歸類為你提到的語意)演化出來的好用的新字。

    回覆刪除
  10. 如果曾讀過「說文解字」(許慎著),就明白每字均有其字體來源,例如象形、注音等,繁體字能夠體現出中文的歷史文化,字義源流,能夠準確地認識中國漢字的來龍去脈,解釋字義就能做到科學歷史性,因而漢字將一直保持非常科學的字體系統。簡體字就破壞了這種邏輯,夾到詞典書籍等的作用,把已有條有素的中文搞亂,因只注重節省筆劃,刪除了許多中文字裡的實際涵義,雖然表面上使中文能更簡便的寫出來,但學生們變成盲盲從從不知就裡的學中文,只把中文當作一種符號而已,失掉了中文原有的本性。

    回覆刪除
  11. 1. 我很好奇你如何去界定語言和文字的之間的關係?

    你操作「繁體中文 ←→簡體中文」的方法能不能用到「閩南語 ←→ 客家話」上?

    2. 預設簡體中文/繁體中文之間可以在「歧義性」上作比較似乎不怎麼合理。

    假設你比較的是作為文字單元的「字」的話,那麼英文只有26個字,每一個都沒有特別的意指,所以它一種歧義性最低的文字嗎?

    如果是比較「詞語」的歧義性的話,似乎就和文字本身的幾何形狀無關了。

    3.
    「如果你是一個語言設計師,你不會企圖排除所有一字多義,因為那代表你得將所有字義都對應到一個獨特的字,而如果你這樣做,你的語言裡將會有無法想像多的數量的字,這樣的語言根本就無法被學習和使用。」

    但數字也包含在文字裡,而顯然可以用有限的數字符號去描述無限制數量的數學概念,比方說自然數,所以這個宣稱似乎沒什麼基礎。
    (還是我弄錯了你的意思?你可以說一下"1000"是一個字,還是四個字嗎?)


    ↑我主要是覺得,你沒有把文字、字句、語言之間的關係表達清楚。

    回覆刪除
  12. LiYu︰

    中國文字的科學性和系統性真的對學生學中文有幫助嗎?(我猜你應該有想要講這個,如果我猜錯了,請直接看第二段)至少我是到了高中才知道文字有那些結構(指事、會意...)而我得說從那之後一直到現在我並沒有多學到什麼字。如果你想宣稱繁體字獨有的這些結構區分有助於學習,得提出經驗證據才行。

    而如果你想說的並不是繁體字獨有的這些結構區分有助於學習,而是繁體字獨有的這些結構是中文的「本性」,而簡體喪失了中文的「本性」,那麼,我覺得這就跟你說你主觀上喜歡繁體字、覺得繁體字比較有價值差不多,只是用了其它詞包裝,讓它看起來像是個客觀宣稱而已。

    Anonymous︰

    1. 只要有辦法identify閩南語和客家話裡的「字」,我想應該就可以。

    2. 有道理。我想可不可以這樣補充︰當我們在談中文「字」的歧義的時候,事實上,我們談的應該是那些作為承載意義的最小單位的「字」的歧義。英文裡承載意義的最小單位是詞,因為字母通常沒有意義,但是中文裡承載意義的最小單位是字。

    3. 我應該會說「1000」是四個字。如果我得說「1000」是一個字,我會回頭修改一下那句話,排除數學這類可以依靠有限的規則指定無限個字的意義的語言。

    我同意你大致上的意見,不過我也不知道要怎樣把那些東西講清楚...

    回覆刪除
  13. 或許,慣用繁體中文的人會說簡體是個爛語言,因為簡體「后」、「後」不分,會造成混淆。然而,這並不能算是簡體的缺點,因為慣用簡體字的人早就習慣了那些為「后」添加適當的脈絡以避免誤解的方法*1。
    用簡體字後:或许,惯用繁体中文的人会说简体是个烂语言,因为简体「后」、「后」不分,会造成混淆。然而,这并不能算是简体的缺点,因为惯用简体字的人早就习惯了那些为「后」添加适当的脉络以避免误解的方法*1。
    在你的文字中,已有經驗證據。
    *我純粹分享意見,知識亦不充足,若說錯了,請不要介懷!

    回覆刪除
  14. 1)超繁體使用者說:繁體使用者"玣" "芐" "汳" 不分,會造成混淆...

    2)或许,惯用繁体中文的人会说简体是个烂语言,因为简体”后面的后“ “王后的后“不分 ...

    回覆刪除
  15. timothychen︰

    哈哈,那個例子很好。

    LiYu︰

    這個反駁很不錯,我想了一下才想到問題在哪。

    我們討論的「混淆」應該是指,在一個語言中有兩個互不相同的字,基於某些原因,讓人搞不清楚哪個是哪個。然而,在簡體中,「后」和「后」這兩個字的確沒有區分,它們是同一個字,所以這裡無所謂混淆。我們不能責怪他們無法區分「后」和「後」,因為「後」並不在他們的語言裡。

    沿用timothychen想到的推論方法,如果我們可以抱怨使用簡體的人「后」、「后」不分,會造成困擾,那麼使用超繁體的人也可以抱怨我們「便」、「便」、「便」不分,造成困擾。

    回覆刪除
  16. 1.繁體字結構有助於學習的經驗證據:
    相信你小學就學過了"部首"的概念,而部首提供了你字義上的理解方向、此外,長得像的字你會企圖把它唸成類似的音;早在你學過六書前,你就已經在標準的字體下自行去理解運用其內涵了。

    2.由從頭開始學習"字"及其使用方法的角度,我想確實難以比較簡體與繁體的優劣,但這種優劣比較隱含了一個前提:字只有其使用價值而無其他歷史與文化價值,但這個前提並非所有人都同意,是吧。我想繁體字在這方面具有較多價值並不只是一個主觀認定,一如簡體字書寫較快速也是無庸置疑的,這不只是單純的個人喜好與文字包裝。簡體字遭攻擊的原因主要由於它短間內人工捨棄了許多原本中文字所具有的內涵,顯然反對者不願意為書寫快速的優點而承受這些損失。至於這些損失是不是可以被接受或捍衛,我想就是有權力或者強勢文化的一方的決定了。

    3.歧義的問題取決於使用習慣,對慣用者而言永遠有方法可以去辨別。因此歧義的問題確實只存在於在不同系統間轉換時的不習慣而已,簡繁皆然。繁的使用者要去辨別同字的不同義,而簡的使用者要去記得同音的不同語詞要用不同的字。

    回覆刪除
  17. 米︰

    1.我覺得你說的滿有道理的。

    2.我的說法沒有隱含那種前提啦,至少我沒有那個意思。看一下原文︰「但是如果我們打算討論「不預設語言使用者原有的語言習慣,繁體和簡體哪一種會造成他學習和使用上比較大的麻煩?」你就不能再用這種有偏見的方式來區別麻煩的添字和不麻煩的添字」那時候我們是在討論添字麻不麻煩,不是在比較其它面向的價值。

    3.我同意。

    回覆刪除
  18. (幫朋友轉貼他的看法)

    大陸人把干(乾)貨翻成Fuck Good(幹貨)
    首先就是簡體字是大陸建國之後人造的產物
    繁體字是幾千年使用下來的結果
    比較符合自然使用的需要

    另外就是大陸使用的簡體字
    使用上確實存在著別義上的問題(雖然不是全面性)
    這幾年他們也有將部份字改成繁體
    我從國中開始就有看大陸書籍
    之前姓蕭的一律是做「肖」
    如今你在某些文章上已經可以看到「蕭」
    而在中文古書上
    簡體造成別義問題的情況更嚴重
    也就是跟自漢代以來的文化銜接時
    容易造成斷層
    大陸重刊中文古書
    若是要做研究都是印繁體的
    比如「谷」這個字,在簡體中有榖、谷的意思
    (所以google不是『谷』歌,是『榖』歌,你看
    光現代使用上就出現別義問題了)
    《老子》中有句「谷神不死,是謂玄牝」
    以簡體來看,究竟是「榖神不死,是謂玄牝」還是「谷神不死,是謂玄牝」?
    真要做解釋的話兩者都說得通
    所以歧義問題是確實存在的

    這篇文章有談到一些簡體字的問題,可以參考看看:
    http://blog.udn.com/panwh/2893552

    我的看法是,要對岸全面恢復使用繁體是不可能的
    (就如要台灣現在改用簡體,同樣會引發反彈)
    使用簡體字是一個趨勢
    因為它是現在最多人使用的中文字體,以多就少難如登天
    並且外國人學習中文學的也多是簡體
    但簡體字確實有問題,必須做部分的改進
    以減少在別義上產生的困擾

    回覆刪除
  19. 人造人類十七號2010年1月15日 下午2:02

    英文的歧異字應該比超繁體還要多很多。

    回覆刪除
  20. 我認為你們是在某種程度上的雞同鴨講,簡體字做為一個有效可運用的語言這件事板主已經講得很清楚了,而且在實際經驗上也沒有問題。但是各位爭論的我整理出主要有兩點:
    1. 漢字本來有系統的演變被跳躍式地簡化
    2. 繁簡轉換造成的困擾

    關於1. 我認為這種轉換和中國文字歷次的改變並沒有很大的差別,如果我們完全抗拒這種轉變的話,為什麼我們不是幾千年來都寫象形字就好了呢,為什麼要轉變成甲骨文,小篆等等…要想爬梳的話請文字學者編表就好了。而部首幫助學習的部分,我認為這是一種後設的學習,我們是先學會字型的相似,別人再教我們部首的意義的,要不是人家教我,我也不會覺得"性"字左邊的豎心旁,和"心"字以及象形字中長得很像男性生殖器的"心"字有什麼關聯。故這並不會影響使用簡體字的人從部首去學習中文,除非是"后""後"或是"干""幹"這種完全改掉的字。但是我想這對於學習語言所造成的困擾應該也不大。

    關於2. 我認為的確在繁體古文翻成簡體之後,的確會造成理解上的困擾,因此研究古文的人的確應該用繁體來研究。但是這並不妨礙到一般民眾閱讀二手資料和使用日常語言。因為只要學者在二手資料上注釋即可。不能認同這點的人請試想,我們在讀古文的時候,不也遇到很多歧異字嗎?此時我們也是從課本的注釋去了解他的原意。例如我們在用繁體中文閱讀道德經若沒有注釋時也同樣是困難重重,因為其中的語句實在可以有太多種解釋了。更何況有時候歧異字還是古人故意玩的文字遊戲,這些還不是要經過詮釋我們才會了解的嗎?

    回覆刪除
  21. 我們已經有超簡體了阿…不就是注音文嗎?
    注音完全簡化了我們日常用語以及把現在的檢提提昇至一個極限了
    但是....就是看不懂阿

    回覆刪除
  22. 米提到: "因為由簡入繁不是文字演變的方向..."
    從 原作 从, 眾 原作 众; 這應該算是由簡而繁吧 ?
    還有兩點: "實際上就是簡體造成了更多歧義..." "口語和正式文章不同..."
    我覺得 對一個從小生長在使用簡體漢字社會的人 本來就同一個字 怎麼會有歧義? 對外人來說 (習慣傳統漢字的) 應該只是習慣問題吧 ?
    而且 臺灣目前使用的正體/繁體/傳統漢字 就沒有歧義? 才 跟 纔 就是個例子...

    LiYu提到的"說文解字"
    我想到 在法國 知道某個字是從哪個拉丁文來的的人 也不多...

    最後 想說一件事
    語言與文字 分開討論 會比較清楚...

    回覆刪除
  23. 我認為你們是在某種程度上的雞同鴨講,簡體字做為一個有效可運用的語言這件事板主已經講得很清楚了,而且在實際經驗上也沒有問題。但是各位爭論的我整理出主要有兩點:
    1. 漢字本來有系統的演變被跳躍式地簡化
    2. 繁簡轉換造成的困擾

    關於1. 我認為這種轉換和中國文字歷次的改變並沒有很大的差別,如果我們完全抗拒這種轉變的話,為什麼我們不是幾千年來都寫象形字就好了呢,為什麼要轉變成甲骨文,小篆等等…要想爬梳的話請文字學者編表就好了。而部首幫助學習的部分,我認為這是一種後設的學習,我們是先學會字型的相似,別人再教我們部首的意義的,要不是人家教我,我也不會覺得"性"字左邊的豎心旁,和"心"字以及象形字中長得很像男性生殖器的"心"字有什麼關聯。故這並不會影響使用簡體字的人從部首去學習中文,除非是"后""後"或是"干""幹"這種完全改掉的字。但是我想這對於學習語言所造成的困擾應該也不大。

    關於2. 我認為的確在繁體古文翻成簡體之後,的確會造成理解上的困擾,因此研究古文的人的確應該用繁體來研究。但是這並不妨礙到一般民眾閱讀二手資料和使用日常語言。因為只要學者在二手資料上注釋即可。不能認同這點的人請試想,我們在讀古文的時候,不也遇到很多歧異字嗎?此時我們也是從課本的注釋去了解他的原意。例如我們在用繁體中文閱讀道德經若沒有注釋時也同樣是困難重重,因為其中的語句實在可以有太多種解釋了。更何況有時候歧異字還是古人故意玩的文字遊戲,這些還不是要經過詮釋我們才會了解的嗎?

    回覆刪除