当前位置:五笔输入法网 >> 五笔字型 >> 浏览文章

五笔字型汉字编码

    五笔字型编码的码法是从汉字中拆分出1~4个字根,再根据字根所属的码键来给汉字编英文字母代码的一种码法。而汉字的结构比较复杂:在有的汉字中字根很多(多于4个),而在有的汉字中字根又很少(仅1个)。多了怎么办?少了又如何处置?从汉字或汉字的一部分中拆分字根,往往因拆分方法不同会导致所拆取的字根及其字根的个数不相同。而且,组成汉字的各字根有时是交织在一起难以截然分开,某一笔画归属于前一字根与归属于后一字根其编码结果会不相同。所以说五笔字型编码要制定的一些“码法规则”是必需的。编码的编制者要遵循这些“码法规则”来编制打字软件;编码的使用者在使用该软件时也要遵循这些“码法规则”才能以该软件进行电脑打字。
    五笔字型编码所制定的码法规则有:“编码规则”、“取码规则”及“补码规则”。全部汉字皆需用到“编码规则”,大部分汉字还要加用“取码规则”,有一部分汉字还要再加用“补码规则”。
   第一节 汉字的分类与码法规则
   一.汉字的分类
  1.一根汉字:字根个数为1的汉字称作“一根汉字”。一根汉字又分“键名汉字”、“字根汉字(加附)”及“单笔汉字”三种。
     (1)键名汉字:代表码键键名的“一根汉字”称作“键名汉字”;它们就是“键名字根”,其数量是25个。在讲五笔字根时称其为“键名字根”;在讲输入“汉字”时称其为“键名汉字”。
     (2)字根汉字:除键名汉字之外,由两个及两个以上单笔画组成的“一根汉字”称作“字根汉字(加附)”; “字根汉字(加附)”又分为“字根汉字”及“字根部首”两部分。
    注:“字根汉字(加附)”这个名称很别扭,这是没有办法的,知其是“字根汉字”还要附加“字根部首”就行了。在以往的五笔教材中被称作“成字字根”,则连理解都有困难:“成字字根”中竟包含有“不成汉字”的“部首字根”;且“字根”与“汉字”在阐述上也分不开。
    A.字根汉字
   在“字根汉字”中有68个其本身是汉字,称之为“字根汉字”;它们就是“汉字字根”。在讲五笔字根时称其为“汉字字根”;在讲输入“汉字”时称其为“字根汉字”。
    B.字根部首
    在“字根汉字”中有32个其本身不是汉字(它们是“汉字的偏旁部首”),称之为“字根部首”;它们就是“部首字根”。在讲五笔字根时称其为“部首字根”;在讲输入“汉字”时称其为“字根部首”。
    注:在表1中把“字根部首”划归于“汉字”的范畴内。这不好理解,但可这样来理解:从正常意义上讲“部首”不是“汉字”,但从能以五笔打字软件打出“字符”这一角度上讲,在五笔编码中我们把这些“字根部首”视同为“汉字”。
   (3)单笔汉字:仅由一个单笔画组成的“一根汉字”称作“单笔汉字”;它们就是“一”、“丨”、“丿”、“丶”、“乙”这五个字。
   2.非一根汉字:字根个数多于1的汉字称作“非一根汉字”,又称“一般汉字”。非一根汉字又分“够根汉字”
二.汉字的类型与码法规则之间的关系

  汉字的类型与码法规则之间的关系如表2所示。

              表2 汉字的类型与码法规则之间的关系表

  ——————————————————————————————————                    1 键名汉字               需 无需取码规则 一根汉字 < 2 字根汉字(加附) 无 需     编               3 单笔汉字             码 ————————————————————      补码规则    规               1 够根汉字               则 需取码规则  非一根汉字 <  ————————————————                    2 少根汉字      需补码规则   ——————————————————————————————————   
    由表2可见,全部汉字皆需要用到编码规则;一根汉字既不需要用到取码规则,又不需要用到补码规则;一般汉字(非一根汉字)需要用到取码规则,其中的少根汉字除需要用到取码规则之外还需要用到补码规则。现对“编码规则”、“取码规则”及“补码规则”作个概要的说明。
    1.什么是编码规则
   “编码规则”是指依据汉字类别而定的给汉字编上代码的规则,也就是按汉字类别而定的汉字的输入方法。在“码法规则”的三个规则中,这个规则最简单,全是些硬性规定。学习编码规则,主要的是要把表1中各类汉字的分类搞清楚,就会不难学、也不难记了。
    2.什么是取码规则
   “取码规则”是指依据汉字结构而定的从汉字中拆取字根的规则,所以“取码规则”也可以称作“从汉字中拆分字根的规则”或称“拆分规则”。除了130个“一根汉字”(其中有98个是汉字,有32个是汉字部首)之外,全部汉字都要用到此规则来编码(见表2)。它对汉字的覆盖面大,概念和规则内容也比较多,而且对五笔字型编码来说是至关重要的(道理很简单:只有取码无误,才能编码正确)。
    仅从学会打字这个角度上讲,熟记五笔字根表就等于学会了五笔打字的60%;但从学精五笔编码这个角度上讲,“取码规则”的重要性要占60%以上,因为仅掌握字根,而对取码规则掌握得不够,就有可能出现这种情况:发现拆分取码不对(与打出的字不符),只好再换一种方法去拆分(且还不一定能打得出字),结果就影响了打字速度。至于五笔字型编码其他方面的一些内容,如:“补码规则”、“汉字的全码”、“词组”、“汉字的三级简码”等相对来说比较容易掌握一些。
    3.什么是补码规则
   “补码规则”是指在汉字为少根汉字(“三根汉字”或“二根汉字”)时为该汉字加补一码的规则。该规则不难学,只是用起来使人觉得有点烦琐。 

下一篇:五笔键盘图片

最新文章

推荐文章

管理登录- 站长:ccss 站长信箱:
中国五笔网版权所有:站内所有五笔字型教程文章禁止采集,违者追究法律责任!