閱讀文章

bbin电子游戏注册入口:語義互聯網世代迫切需要漢語的詞式文本

三、漢語信息傳播的詞式文本改革已經具備實踐條件

[日期:2014-10-12] 來源:語言文字網  作者:彭澤潤、陸丙甫、黃昌寧 [字體: ]

三、漢語信息傳播的詞式文本改革已經具備實踐條件

澳门bbin电子游戏 www.aqkkw.icu 要發揮詞在語義理解中的基礎作用,就應該在書面語言中明確顯示詞的界線。詞的界線的確定應該先大膽實踐,不應該在理論上空談或者等候一套完美的詞式文本規則出現以后再實踐。因此,養成詞式文本新習慣,不是一蹴而就的事情。我們一定要從根本上改變這種情況,出路就是要改變國民書寫和閱讀的習慣。這是當前我國語言生活的一件大事!

胡明揚(2006)說:“漢語長期使用漢字,沒有使用拼音文字,所以什么是的問題就不容易解決了。但是這并不等于漢語中沒有相當于英語的word……那樣的語言單位……什么是實際上存在一個共同的認識,盡管在理論上可以爭論不休。“世界上所有區分詞連寫的拼音文字,都是先有約定俗成的區分詞連寫的文字,后有正詞法的規范,古今中外還沒有先由專家制定了正詞法規則,然后老百姓遵照專家的規定去區分詞連寫的先例”。因此,我們不能指望在全民能夠接受的統一的正詞法出現以后,再來討論漢語的詞式文本問題。國民的漢語詞意識本來是存在的,但是由于傳統的字式文本使人們淡化了詞意識。中國長期使用文言文這樣的書面語,字和詞基本重合,所以一直不存在詞意識淡化的問題。但是廢除文言文以后,字和詞不再基本重合,才有先知先覺的學者重視從“字”的多義術語中分離出“詞”的術語,突顯詞意識問題。(彭澤潤、季凡,2010

雖然客觀存在的詞,是母語使用者能夠感受到的,不必完全靠外在刺激培養,但是外在的強化無疑可以提高語言處理效率,正如古代漢語書面語沒有標點符號古人照樣能夠理解語言,但是現代漢語書面語加了標點符號,無疑可以提高人們對句子停頓等客觀存在的現象的認識和利用。因此,詞式文本能夠強化漢語詞意識,提高語言書面處理效率。

應該承認詞界有一定的模糊性,各人對詞的處理可能不同。詞界的模糊性在世界各國語言中都是存在的,只是程度差別不同而已。實際上目前語言學界還沒有一個關于詞的普遍適用的明確定義。因此,詞式文本實踐的開始階段,難免有相當的分歧,但是這總比不實踐要好。標點符號到現在,各人的使用習慣也不同,有人句號用得多些,有人甚至逗號到底,但是這仍然比看沒有標點的文本效率高得多。

我們相信在實踐過程中,會逐漸減少分歧,因為某些寫法更容易理解,實踐的群眾會逐漸淘汰那些讀起來不利于理解的劃分,逐漸趨向統一。這也是世界各國文字在走向詞式文本的道路上經歷過的。英語文本在這方面至今還有分歧,主要是一些復合詞的內部是否使用連詞號(hyphen,過去有人翻譯成連字號,是把英語的詞錯誤當做字理解的結果)的差異。

因此提倡詞式文本從長遠來說是實現上述目標的基礎工程。沒有詞式文本的實踐,哪兒來的國民對詞的認同率呢?

詞可以分成語法詞、詞典詞、書寫詞。(彭澤潤2008:236)它們基本重合,沒有大的沖突,其中語法詞是根本?;褂小霸下紗省?,“輸入詞”等說法。但是這些說法如同認為動物也有語言一樣,只是一個比喻。

韻律詞包括詞也包括不是詞的單位,因為韻律單位不一定是詞,關鍵是看聽覺節奏。在快速的語流中,人們感覺的韻律單位往往是詞組;在慢速的語流中,人們感覺到的韻律單位可以是音節甚至音素,形式上不足一個詞。當然韻律可以成為處理一些書寫詞的輔助依據。對于形式很短小而且經常整體成為一個韻律單位的語法上的詞組,也可以考慮做書寫詞處理。

韻律的感知有時產生錯覺,會違背語法,甚至違背語義。例如,《中醫藥學》這本教材的拼音名稱錯誤拼寫成“ZHONGYI YAOXUE”,“桃子湖路”這個長沙的道路名稱錯誤拼寫成“TAOZI HULU”,這樣是講究了雙音節的韻律,可是完全違背了要表達的意思。區分書寫詞不必在語法詞的概念上過多糾纏,雖然多數書寫詞會跟語法詞一致。分布在中亞國家的東干語其實是漢語西北方言,它采用斯拉夫字母構成音素文字記錄,而且是詞式文本格式,使用了半個世紀。(彭澤潤2008:160)可見詞式文本對于漢語來說只是一個觀念的解放問題。

“輸入詞”也包括詞和非詞,關鍵是看輸入效率。如果經常要輸入,無論這個單位有多長,甚至是一篇文章,甚至是一批電子郵件地址,人們都可能把它當做一個“詞”來輸入。如果我在“中華人民共和國教育部語言文字應用管理司”工作,我就可以把這個單位的名稱通過輸入代碼的定義,當做一個詞來輸入。但是如果我不是這個單位的,偶爾用一次,不如分解成一個一個語法詞輸入效率還高一些。

語法詞的理論分歧其實很少,因為漢語跟所有語言一樣,詞是客觀存在的。但是局部的認識分歧會長期存在。不過,“文字寫出來總要讓人念起來方便才好。順口才便于理解,念起來不順口必然會嚴重影響理解?!保獎?/SPAN>1985a)。也就是說,口語的停頓單位反映了人對語言的認知單位。古人花很多時間學習“句讀”,認為“句讀”讀對了就懂了。今天我們有了標點符號,學“句讀”的時間就可以大大節約。標點符號實際上也是一種指示讀法的標記。拼音文字的連寫法也必須有指示讀法的功能(陸丙甫1985b)。語法詞其實占據了口語停頓最基本位置。在正常語速中,特別是像國家領導人做工作報告的語速中,我們可以明顯地感覺到詞這個最基本的停頓。除非是結巴或者語感沒有建立好的外國孩子,不會在“爸爸,我要買玩具”中做這樣的停頓:“爸——爸我——要——買玩——具”。

視覺單位應該跟聽覺通道的單位(口語停頓單位)和認知單位一致,才便于閱讀理解。例如漢語的數目表達在口語中是“四進位”的,但是書面上用阿拉伯數字書寫,采用英語等語言的“三進位”的習慣寫法。這嚴重影響了中國人閱讀和記憶大數目的效率(陸丙甫2005)。

詞式文本只是把人們心中和聽覺感知的語法詞轉換成視覺可見的書寫詞,適當照顧其他要素變通處理。雖然漢語使用者在漢字文本中總覺得不習慣,但是在拼音文本中已經有很多人已經習慣,國家也頒布《漢語拼音正詞法基本規則》20多年了。不過,要真正實踐漢字詞式文本,也不是那么難。

彭澤潤(2007,2008)在自己的著作中已經全面試用詞式文本。大學教材(彭澤潤、李葆嘉主編2009)也開始試用詞式文本。根據彭澤潤通過郵件獲得的讀者信息,試用教材的讀者一開始都覺得不習慣,但是習慣了以后很多人認為有利于閱讀效率的提高。

事實上,我們的國民已經普遍悄悄地實踐著詞式文本。漢語在電腦上處理已經有將近40年歷史,但是漢字因為的字的總數太多,決定了書面漢語無法在小鍵盤上直接輸入,必須進行編碼輸入。但是最初的編碼輸入主要針對單個的字編碼,后來把注意力集中到詞的編碼上面。用詞的編碼輸入漢語就是在實踐漢語詞式文本。

多少年來漢字編碼輸入的發展就是從五筆字型為代表的形碼過渡到以拼音輸入為主流的音碼的歷史,同時從字式輸入走向詞式輸入的歷史。當年拼音輸入方法的價值沒有得到社會及時重視,其實說明設計者當時詞意識比較弱,只知道按照字或者音節來設計拼音輸入方法(彭澤潤1996)。現在的事實表明,按照詞的單位輸入的漢語拼音輸入方法已經得到全面普及,而且多數用戶在輸入漢語的時候,對于多數詞都有基本一致的認識,對現代漢語書寫詞的確定規則(彭澤潤,彭建國2009)有基本一致的認同。

呂淑湘(1995)說:“我想到的是三十多年前我主編《現代漢語詞典》初稿的時候曾經試著做而沒有做成的兩件事:一件事是區別單字能不能單用,也就是分別詞和非詞。趙元任、楊聯陛兩位先生在他們編的《國語字典》(1947)里邊已經用FB來表示一個字能或者不能單用,我們也打算采取某種形式表示。另一件事是在一個詞或者一個詞的一個義項之后標明詞類?!衷詘讜諼頤敲媲暗摹斷執河镅按實洹費謇銼?,對于一個字或這個字的某一個義項,能夠單用的都直接標明詞類;對于不能單用的字或義項分別注明‘素’(實義語素)、‘綴’(前綴、后綴)、‘字’(非語素的字)?!甭朗逑媾甕齙納廈媼郊慮樵凇斷執河锎實洹返?/SPAN>5版(2005)中基本實現。從這里可以看出,雖然《現代漢語詞典》詞意識的完善從設想到實現花費了40年,但是漢語詞典的詞意識在21世紀已經得到很大的強化。我們認為,在詞典詞意識進步的同時,大學“語言學概論”和“現代漢語”等課程,中小學的“語文”課程都應該在教學內容上,尊重漢語客觀存在的詞這個事實,加強漢語詞意識的教育,因為缺乏詞意識就無法在全社會實現書面語格式從字式文本到詞式文本的重大改革。因此我們呼吁語言學領域的學者,無論從事基礎理論研究還是從事應用實踐研究,都來關心詞意識的強化和普及問題。

我們應該充份意識到采用漢語詞式文本從觀念到技術上的阻力和困難。浪費紙張等問題要說服大家不容易。其實,如果把字距壓縮,剩余的空間做詞距,可以在不浪費紙張的前提下實現字式文本向詞式文本轉換。更何況在電子文本日益擴大使用的情況下,紙張問題已經不那么重要。在電子文本中實現詞式文本也特別方便。我們的題目就是主張從容易的領域互聯網開始嘗試。

對離合詞這樣的漢語特殊的詞也不好處理。離合詞就是被簡短的成份隔離的合成詞。我們建議在詞式文本中還是當做一個詞書寫,例如“理了發”、“考完試”、“鞠3個躬”、“睡了一個大覺”。其中”考完試”等有些不合理,因為“考+試”是聯合關系,“完”插入以后使它被迫變成中補關系。但是,如果把“考試”當做一個動詞整體,認為是插入一個中綴也可以得到合理的解釋。大家習慣了就只好將錯就錯。當然如果說“理發了”、“考試完”、“鞠躬3次”、“睡了很久很久”就可以按照詞組書寫。到底最后怎么書寫,我們可以對一些有習慣性分歧的放寬標準(陸丙甫,謝天蔚,2014),例如允許長度不大的詞組連寫,不允許不成詞語素單獨寫。

雖然漢語詞式文本改革具有長期性和艱巨性,但是網絡漢字文本率先實行詞式文本已經具有可行性,而且迫在眉睫。

目前按照詞的單位輸入的漢語拼音輸入方法,已經得到普及。人們無論用手機寫短信還是用電腦寫文章,都在按照輸入詞書寫,而且輸入詞多數就是語法詞。現在的漢語文本的原始文本基本上是電子文本?;チ纖械奈謀徑際塹繾游謀?。因此,在互聯網上率先推廣詞式文本會比在整個新聞出版領域的紙張文本中推廣詞式文本容易一些。

如果這樣,在億萬用戶輸入漢字的時候就把詞的邊界和人名、地名、機構名等專有名稱的信息記錄下來,這樣不僅輕而易舉地實現了網絡文本的詞式處理,而且可以避免國人在輸入漢字的時候區分詞的信息得到以后又失去,產生巨大浪費。

為了循序漸進地推行漢語詞式文本,我們還可以靈活設計自由選擇顯示出來的文本類型,滿足不適應新文本的人的需要,因為XML標注的信息是網絡文本的一種背景信息,既可以顯示,也可以不顯示。同理,漢語網頁帶上區分詞的信息之后,是否顯示詞式文本格式,仍然可以由用戶選擇。但是從互聯網的語義搜索和其他網絡服務來說,區分詞就是一種語義信息,決不是可有可無的東西(黃昌寧、李玉梅、周強2009)。

為了盡快實現這個目標,我們建議漢語電子輸入系統的研究人員,盡快解決詞式文本輸入的技術問題,自動記錄下詞界信息。根據目前有些人還不習慣閱讀漢語詞式文本的現狀,在技術上應該設計一個可以自由選擇詞式文本和字式文本的按鈕,并且應該有選擇詞間空隙大小的功能,因為這個空隙的大小對于閱讀效率和閱讀心理上的舒適效果也有相當大的影響。

總之,語義互聯網時代迫切要求推廣漢語的詞式文本。而當代飛速發展的信息技術,已經為漢語詞式文本的實現提供了堅實的平臺。


【內容導航】
第1頁:修改說明
第2頁:【正文】
第3頁:一、漢語詞界信息和詞式文本是語義互聯網信息傳播的基礎
第4頁:二、用詞式文本取代字式文本是人類書面語信息傳播的共同趨勢
第5頁:三、漢語信息傳播的詞式文本改革已經具備實踐條件
第6頁:參考文獻


閱讀:
錄入:湘里伢子

語網特別申明:各專欄專輯作者文責自負,對自己的作品享有完整版權,在語網的發布不影響其再版權,即作者還可另行投稿或出版。任何人均可在本站發布或轉載文章,但這并不意味著本站贊同其觀點或證實其內容的真實性,如涉及版權等問題,請作者來函聯系。

評論 】 【 推薦 】 【 打印
上一篇:【專題】拼音和漢字發展筆談

下一篇:論“詞調 模式化”
相關文章      
發表評論


點評:
 
字數(限500字,建議200字以內):
姓名:

  • 尊重網上道德,遵守中華人民共和國的有關法律法規
  • 承擔一切因您的行為而導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
站內查詢



 
最新文章