閱讀文章

BBIN电子游艺:周南祥:漢字書同文與漢字新排序

[日期:2013-02-26] 來源:澳门bbin电子游戏  作者:周南祥 [字體: ]

澳门bbin电子游戏 www.aqkkw.icu 文字為了檢索方便都需要排序。文字有形有音,形數量多,音數量少。按形排序,數量多,排序復雜,難以學習掌握,按音排序,數量少,排序簡單,易于學習掌握。故世界上大多數文字都按音排序。

表音文字數量極少,排序法比較簡單,幾十個字按音排序即成字表--字母表,詞典即根據字母表順序排列詞序。表音文字本身就是一種表音符號,即音符,按音排序就是按音符排序。一般只編寫字表,不需要編寫字典。

表義文字數量極多,排序法比較復雜。漢字是表義文字,數萬漢字可以按字形、字義、字音排字序,而且無論按字形,還是按字義、字音排序,都有許多種排序法,既編寫字表,也編寫字典。詞典根據字表、字典順序排詞序。漢字不是表音符號,漢字與漢字音符很多是不等同的。漢字音符又比較復雜,因此雖然漢字在現代也出現按音排序的字表、字典,但是至今只出現按整字拼音排序的字表、字典,還沒有出現按音符排序的字表、字典。

目前常用的漢字排序法有部首筆數排序法、筆數筆形排序法、筆形編碼排序法、形音編碼排序法、整字拼音排序法。這些排序法都有不少缺點??吹揭桓鱟?,人們最先想知道的是字音,然后是字義。記得一個字形以后,人們最先想記得的是字音,然后是字義。因此,人們特別需要知道字與字在音方面的聯系,特別需要知道識讀和記憶字音的規律。上述排序法不能充分顯示字與字之間在音方面的聯系與規律,使數萬漢字從字音上看像是一盤散沙,而且有些排序法要記許多規則,使用起來也很不方便。

部首筆數排序法,把漢字的一部分(意符或音符或筆畫)作為部首,先按部首筆數多寡再按剩余筆數多寡排序,筆數相同時按筆形序(丶一丨丿乛或一丨丿丶乛)排序。部首位置可在字左部或字右部或字上部或字下部或字外圍或字中部或左上部。如(1)丶部:義、丫、丸、之、為、頭、主、半、州、農、良、舉、判、爲,(2)一部,一畫:一,一畫至二畫:七、丁、三、千、于、下、上、丈、兀、萬、與、才,三畫:豐、天、夫、開、井、無、專、丐、不、卅、冇、丑、屯、互、牙。

筆數筆形排序法,先按組成漢字的筆數多寡再按起筆筆形排序。筆數相同時按筆形序排序,筆形序依次分為一、丨、丿、丶、乛及其復合形式一一、一丨、一丿、一、、一乛等等。如一畫:一、乙,二畫,一部:二、十、廠、丁、七,丨部:卜,丿部:八、人、入、乂、匕、兒、幾、九、乃,乛部:刁、刀、力、又、厶、了、乜。

筆形編碼排序法,把筆形編成號碼,取漢字各個(個)位置的筆形號碼組成數字或字母,按數字大小順序和字母順序排序,取碼方法又有多種:

依漢字左上角、右上角、左下角、右下角順序取的筆形號碼稱四角號碼(1、2、3、4、5、6、7、8、9、0分別代表橫、豎、點、叉、串、方、角、八、小、頭,同碼字取右下角上方一個筆形作附號,即第5號),如彎0002-7、主0010-4、童0010-5、亶0010-6、立0010-8、鑾0010-9、癥0011-1。

依漢字上邊、右邊、下邊順序取的筆形代碼稱三邊號碼(1、2、3、4、5、6、7、8、9、0分別代表橫、豎、撇、點、折、一交叉、二交叉、八字形、端點相接形、口形),如乙5、止2211、新4918、語4110、算8807、摔2446。

取漢字起筆的筆形代碼稱起筆號碼。

取漢字尾筆的筆形代碼稱尾筆號碼。

取漢字第一筆和第二筆的筆形代碼稱前二筆號碼。

取漢字第一、第二筆和尾筆的筆形代碼稱為頭尾三筆號碼(1、2、3、4、5、6、7、8、9、10、11分別代表橫、豎、折等等),如三111、漲858。

取漢字前三筆的筆形代碼稱前三筆號碼(1、2、3、4、5、6、7分別指橫、豎、撇、點、順折、反折、方匡),如元113、丫432、乂430、廠130、阝520、幾350、又540。

取漢字前四筆的筆形代碼稱前四筆號碼。

筆形用筆形名稱的拼音字母首字母表示,每種筆形的筆數用數字表示的稱為筆形筆數號碼,橫為H,丨為s,丿為p,點為D,乛為z,如“丶”的筆形號碼為D,筆形數是2筆,即標為D2,“大”字編為h1s1d1。

筆形編碼排序法中比較流行的是四角號碼排序法,其他排序法只有少數人使用。

形音編碼排序法,以拉丁字母作為漢字首、尾部件和字音的代碼,部件象什么字母即用什么字母代表部件,以字音的首音字母代表字音,如“合”,首筆像A,尾筆像O,字音首字母是H,此字編碼就是AOH。

部首筆數排序法的優點是很多部首相當于漢字意符,部首排序相當于按意符排序,只要會數筆畫,熟悉筆順,就可檢索漢字,便于查檢不知讀音的生字,缺點是部首的位置不固定,有些字難以確定部首,同筆畫的部首字及同部首內的字,排列次序會有多種,同一字的繁簡異形排在不同位置,不合理,筆數要反復數,比較繁瑣,容易數錯,有些字的筆順難以確定,影響查字速度。

筆數筆形排序法的優點是只要會數筆畫,熟悉筆順,就可檢索漢字,缺點是數筆畫比較繁瑣,筆數相同的字排序時會有多種,有些字或者部件的筆順有不同排法,影響正確排序,筆數和筆順都相同的字的排序會有多種。

筆形編碼排序法的優點是可以直接根據筆形編碼查字,避免了數筆畫的繁瑣,采用阿拉伯數字或拉丁字母編碼,查找起來比較方便,缺點是規則比較復雜,初學者不易掌握,重碼字較多,需要增加區別碼。

形音編碼排序法的優點是可以直接根據直覺象形和字音查字,避免了數筆畫的繁瑣,缺點是字或部件象什么字母難以確定。

無論部首筆數排序法、筆數筆形排序法、筆形編碼排序法還是形音編碼排序法主要都是根據字形排序,說明歷來人們較重視漢字字形方面的規律,重視表義規律,不太重視字音方面的規律。古代有過韻書,按漢字音韻排序,但只用于詩歌音韻,沒有普遍使用。

世界上多數文字都是按音排序的,只有漢字歷來偏重按筆形、筆數排序。按筆形、筆數排序,要辯筆形,數筆畫,記規則,麻煩較多。按音排序,只要記住表示字音的字母表即可(字母表是進過小學的人都熟悉的),異常簡便。故而,漢語拼音方案出現以后,漢字也開始按音排序,但主要使用整字拼音排序法。

整字拼音排序法,按漢字拼音的字母順序排列音節(先按首字母,再按次字母,余類推),同音節漢字按聲調1、2、3、4聲的順序排列漢字,如a音節:ā阿?。ê牽╋閨?,á嗄?。ê牽?,ǎ?。ê牽?,à?。ê牽?,a?。ò?、呵),ai音節:āi哀锿哎(噯)埃挨唉欸娭,ái癌皚(皚)挨(捱)騃,ǎi靄藹毐噯(噯)矮欸,ài嗌隘(戹)阸艾砹硋礙(礙)唉愛(愛)璦(璦)叆(靉)薆噯(噯)曖(曖)嬡(嬡)。

整字拼音排序法的優點是只要知道字的讀音,會拼音就能迅速排檢漢字,準確率高,不受簡、繁字形的影響,符合國際上大都按音序檢索的習慣,缺點是讀不出或讀不準音的字難以排檢,同音字的排序會有多種。這種排序法雖然注意按漢字字音排序,但并沒有注意字與字在音方面的聯系和規律,同音節同音符漢字處于分散狀態。因此,需要發展和改進,進一步探索按音排序的新方法。

從漢字實際看,大部分漢字是義音字,通過音符表音,很多非義音字本身充當音符(只有極少漢字不能充當音符又缺少明確的音符)。根據漢字表音規律,漢字也完全可以按音符排序。

漢字音符排序法,先按漢字音符的拼音字母順序排列音節序,同音節按音符筆數多寡從少到多順序排列音符序,同音符漢字按意符筆數多寡從少到多順序排列字序,其余孤字(沒有第二個同音符字的漢字)按漢字筆數多寡從少到多順序排序。例如A、Ai兩音節的漢字可排序如下(音符和散字后面的數字表示筆畫數):A  5-呵阿啊錒   孤字:吖6腌12嗄13   Ai  厄4-伌阨  戹5-阸呝  5-艾哎砹    5-矣唉埃挨娭欸騃疑懝礙譺  厓8-啀捱娾崖嘊  委8-矮躷  9-哀锿  9-堨餲馤藹靄藹靄譪  豈10-凒溰嵦隑敱敳磑皚  10-隘嗌塧賹  10-愛噯嬡璦叆曖  14-愛僾噯嬡璦璦靉曖曖薆  孤字:毐7111113噫16癌17(破折號前為音符,破折號后為以該音符為統帥的系列漢字)。漢字書同文和完善化后,孤字全部納入音符系統。

漢字音符排序法兼有整字拼音排序法的優點,只要知道字的讀音,會拼音會數筆畫就會查字,速度快,準確率高,符合國際上大都按音序檢索的習慣,至于讀不出或讀不準音的字難以查找的缺陷可附以筆形筆數排序法解決。這種排序法可以避免整字拼音排序法同音字的排序會有多種的缺陷,因為同音字,雖然字音相同,但是如果音符相同,義符不會相同,如果義符相同,音符不會相同,因此同音字的排序可以固定為一種。這種排序法還具有整字拼音排序法所沒有的優點:根據拼音可以很容易地查到音符(因為音符數量比漢字數量少得多),查到音符即可以很容易地查到漢字(查到音符后只要數意符筆畫,意符筆畫比整字筆畫少得多)。

在漢字沒有書同文和完善化之前,按音符拼音排檢,還有不少不便:音符有簡形、繁形,不統一,同音音符過多,同形音符也過多,多音字過多造成一字多排等等。因此,要使漢字音符拼音排序法真正科學實用,必須實現漢字書同文和漢字完善化。

漢字實現書同文并且完善化后,漢字字形的統一和完善,將促使義符、音符的統一和完善,音符排序法,將發揮更大的作用,為漢字學習者帶來更多便利。如果實現書同文和完善化,繁簡字統一,簡形音符、繁形音符,如“愛\愛”“豈\豈”,將合而為一,互為異形的音符,如“厄\戹”,也合而為一,互為異形的字如“礙\礙\硋”的音符也合而為一(定一字為正字,其余異形字都置于括號內備考),其他音符也進行篩選歸并,異形同音音符盡量同化,孤字的音符與同音節音符同化,異音同形音符盡量異化,音符將更加精干,易記,音符排序將更為完善有效。

現在漢字尚未書同文,尚未完善化,我們只能從漢字中抽取相當于聲旁的部分權作音符或類音符。這只能算不完善的音符。完善的音符應該一符一形,一符一音,需要大眾討論專家研究政府審定。

現將以“A”“B”為拼音首字母的部分漢字按音符排序法進行排序,制成字表作為樣品附錄于后,有興趣的研究者可以將所有8萬多漢字都按音符排序。此字表的所有漢字按音符拼音的音節順序排列,以音符所在音節的音作為音符的音。音符置于破折號前,以該音符為統帥的系列漢字(包括零意符的漢字)排列破折號后(不論是否屬于同一字種)。非意音字、部分意音字和音符不明確的漢字暫以共同部件作為類音符(有些字的音符與《說文解字》所劃分的聲旁不盡相同),沒有成字的音符用漢字去除或加添一些筆畫或部件表示,以括號注明,沒有共同音符的漢字作為孤字,同形字符疊加的漢字不拆分音符、意符。在音符尚未整治前,由于同音異形音符未曾歸并,異音同形音符未曾別異,一符多音、一音多符現象較為嚴重,排序表使用價值尚小,因此,系列漢字和孤字除“A”“Ai”兩音節外都暫不進行正式排序。異形字不管有沒有經過整理,都排入字表,可以更多了解漢字的音符系統。



[1] [2] 下一頁   


閱讀:
錄入:周南祥

語網特別申明:各專欄專輯作者文責自負,對自己的作品享有完整版權,在語網的發布不影響其再版權,即作者還可另行投稿或出版。任何人均可在本站發布或轉載文章,但這并不意味著本站贊同其觀點或證實其內容的真實性,如涉及版權等問題,請作者來函聯系。

評論 】 【 推薦 】 【 打印
上一篇:大眾燈語-2(試行)

下一篇:一種手機漢語拼音鍵盤——1agb鍵盤
相關文章       周南祥 
本文評論
  中國新拼是對漢字和漢語統一編碼,可以在1-3碼范疇內表達全部漢字和漢語的標準讀音和口語聲音而不必另加聲調符號;新拼矩陣形成三維立體縱橫多向智能有聲編碼結構,可以將全部漢字和漢語進行有序排列,并可以新拼數學公式進行推導和運算,從而準確反映任何語言文字在時間和空間中的確切位置?;隊寫杞渙?!   (曲振興 ,2013-09-17 )
發表評論


點評:
 
字數(限500字,建議200字以內):
姓名:

  • 尊重網上道德,遵守中華人民共和國的有關法律法規
  • 承擔一切因您的行為而導致的民事或刑事法律責任
  • 本站管理人員有權保留或刪除其管轄留言中的任意內容
  • 本站有權在網站內轉載或引用您的評論
  • 參與本評論即表明您已經閱讀并接受上述條款
站內查詢



 
最新文章