掌握汉字的编码规则,熟悉每个汉字的编码,是五笔字型输入的基础,下面提供的单个字的五笔字型编码规则口诀:
五笔字型均直观,依照笔顺把码编;
键名汉字打四下,基本字根请照搬;
一二三末取四码,顺序拆分大优先;
不足四码要注意,交叉识别补后边。
从这歌诀就可以看出五笔字型编码规则的大致面貌,同时口诀也概括了五笔字型拆字取码的五项原则:
1、从形取其顺序按书写规则,即从左到右、从上到下、从外到内;
2、以130多个字根为基本单位;
3、对于字根数超过四个的汉字,按一二三末字根的顺序,最多只取四码;
4、单体结构拆分取大优先;
5、末笔与字型交叉识别。
二、键名汉字的编码规则
五笔字型中规定的键名汉字共有25个,"王土大木工目日口田山禾白月人金言立水火之已子女又纟"25个键名汉字与25个字母键相应,这些字的编码相当简单,它们的编码就是4个所在字母键字母,如:"言"字的编码为"YYYY","纟"字的编码为"XXXX",等等。输入键名汉字时,只要连续击四次该字所在的字母键即可。
国标GB2312-80中,上述的键名和成字字根这样的键面字总共才有一百多个,绝大部分汉字都不是成字字根,这些才是我们在使用当中用得最多的。
五笔字型汉字编码主要是键外字的编码,编码可以分为两类,纯字根码和识别码。如果一个汉字的字根是四个或超过四个,就用前三后一总共四个字根码组成编码。
不足四个字根的汉字需补一个字型结构识别码,以增加区分汉字的信息量。
1、字根码
每个字根都分派在一个字母键上,其所在键上的英文就是该字根的"字根码"。
凡含四个或超过四个字根的汉字,取其第一、二、三、末四个字根码组成键外字的输入编码。
第一字根编码+第二字根编码+第三字根编码+最末一个字根编码,这里一、二、三、末应按正常书写顺序,先左后右,先上后下,先外后内。
2、交叉识别码
一个字的字根不足四个时,依次击入字根码后,最后需要补一个识别码。为什么需要这个识别码呢,这里可以举例说明:如"沐"和"汀"字,这两个字都是由两个字根组成的,且这两个字的字根码都是IS。虽然也可以让输入者选择的方式来确定到底需要输入哪一个字,但这对汉字输入速度极为不利,重码率要越低越好,所以五笔编码中才引入了识别码这个概念来对这类汉字进行区分。