新世纪五笔基础知识新世纪五笔基础知识
基础知识
5种笔画
字根是由笔画写成。笔画、字根(部件)、整字,是汉字结构的三个层次[4]。
1984年王永民教授给笔画定义为:书写汉字时,一次写成的一个连续不断的线段。按照书写方向划分笔画的类型,如下图所示,则只有5种——横、竖、撇、捺、折。前4种是单方向的笔画,“折”则代表一切带转折、拐弯的笔画。为了便于记忆和排序,我们分别用1、2、3、4、5命名5种笔画的代号。
以下例子可作为这张表的补充说明:[4]
(1)“提笔”等于“横”:王 现
(2)“点”等于“捺”:木 村
(3)“竖左钩”...
新世纪五笔基础知识
基础知识
5种笔画
字根是由笔画写成。笔画、字根(部件)、整字,是汉字结构的三个层次[4]。
1984年王永民教授给笔画定义为:书写汉字时,一次写成的一个连续不断的线段。按照书写方向划分笔画的类型,如下图所示,则只有5种——横、竖、撇、捺、折。前4种是单方向的笔画,“折”则代表一切带转折、拐弯的笔画。为了便于记忆和排序,我们分别用1、2、3、4、5命名5种笔画的代号。
以下例子可作为这张表的补充
:[4]
(1)“提笔”等于“横”:王 现
(2)“点”等于“捺”:木 村
(3)“竖左钩”等于“竖”: 禾
(4)所有带转折的笔画都算作“折”。
为便于书面表示,以后所有的“折”笔,不管怎么“折”,怎么“弯”,怎么“拐”,一律都有“乙”来表示,其笔画代号都是5。
王永民对笔画的以上分类法及代号,现在已经被正式写入了代号为GB/T18031-2000的国家标准中。
给笔画分类,并命名以数字代号,是学习王码输入法时最重要的基础知识。在实践中,许多人之所以编码出现错误,或对键盘上码元排列的规律性“视而不见”,其根本原因,常是因为没有掌握好五种单笔画的分类及其数字代号。[4]
3种字型
习惯上,我们把构成汉字的基本笔画结构,称作“字根”或“部件”。而当“字根”或“部件”用于编码的时候,又可以把它们叫做“码元”,意思是编码的“元素”。
汉字是一种平面文字,同样几个字根,同样的先后顺序,摆放[4]的位置不同,就是不同的字。如:
叭——只 吧——邑
呐——呙 岂——屺
可见,字根相互间的位置关系,也是汉字图形的一个特征,在汉字编码中,用数字代表这个特征,就成为很有用的、用以分区“重码”的“识别”信息。
根据构成汉字的各个字根之间的位置关系,我们可以把成千上万的方块汉字,分为三种字型:
左右型:字根左右排列。
上下型:字根上下排列。
杂合型:字根互相周围或交叉套迭。
根据各种字型拥有汉字的多少,顺序将字型命以数字代号,如下表所示。
我们便约定:[4]
1型字,即指“左右型”汉字,其代号为1;
2型字,即指“上下型”汉字,其代号为2;
3型字,即指“杂合型”汉字,其代号为3。
将来,我们给汉字编码时,字型及其代号将非常有用。 这里应当说明,在王码中,仅仅对于那些由2个或3个字根组成的字,
我们才关心它的“字型”。如果一个字由4个或4个以上的字根组成,例如:编码中,我们就不再计较是什么“型”了。[4]
键位分布
五笔字型键盘
五笔字型采用标准英文键盘的26个字母键输入汉字。每个汉字,每条词汇最多打4下键。汉字是由字根构成的。我们将构成汉字的字根,优选归纳为125种,也称作“码元”,分配在除Z键以外的25个英文字母键上,形成了五笔字型的“字根键盘”。新世纪版五笔字型字根键位图:
新世纪五笔字型字根键位图(2 张)
字根助记歌
为保持技术的连续性,第三代五笔字型(新世纪版)的25个“键名”没
有变动。新设计的字根体系更加符合分区划位规律,更加科学易记而
实用,按规范笔顺写汉字的人,取码输入将得心应手。新世纪版的《字
根助记歌》如下[7]: 1区横起笔
11 G 王旁青头五一提 12 F 土士二干十寸雨 13 D 大三肆头古石厂 14 S 木丁西边要无女 15 A 工戈草头右框七 2区竖起笔
21 H 目止具头卜虎皮 22 J 日曰两竖与虫依 23 K 口中两川三个竖 24 L 田框四车甲单底 25 M 山由贝骨下框里 3区撇起笔
31 T 禾竹牛旁卧人立 32 R 白斤气头叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭风头几 35 Q 金夕犭儿包头鱼 4区点起笔
41 Y 言文方点在四一
42 U 立带两点病门里
43 I 水边一族三点小
44 O 火变三态广二米
45 P 之字宝盖补示衣
5区折起笔
51 N 已类左框心尸羽
52 B 子耳了也乃齿底
53 V 女刀九巡录无水
54 C 又巴甬矣马失蹄
55 X 幺母绞丝弓三匕
记忆规律
在五笔字型键盘上,多数字根(码元)的安排都是有规律的。字根键盘分为5个区,区号为1,5;每一个区,各有5个键位,位号也是1,5,从键盘中部向外端排列;区号与位号组合,共形成5×5=25个代码,即区位码:11…15,21…51…55。其规律性如下[8]:
1、字根所在的“区号”与“首笔代码”一致[8]
? 横起笔的字根,在第1区——“王土大木工”的首笔代号为1; ? 竖起笔的字根,在第2区——“目日口田山”的首笔代号为2; ? 撇起笔的字根,在第3区——“禾白月人金”的首笔代号为3; ? 点起笔的字根,在第4区——“言立水火之”的首笔代号为4; ? 折起笔的字根,在第5区——“已子女又幺”的首笔代号为5。 2、位号基本上与码元的次笔代码一致[8]
位码与码元次笔关系
3、单笔画的“个数”,与所在的“位号”一致[8]
一、丨、丿、丶、乙 都在相应区的第1位;
二、刂、丿丿、丶丶、巜 都在各区的第2位;
三、彡、氵、巛 都在各区的第3位;
四、灬 在相应区的第4位。
4、从字根上“直读”区位号[8]
依照以上3条规律,根据字根的“前两个笔画”,可立即“直读”出“字根”的区位号(即:前2个笔画的代号连在一起念,就是区位号~): 例:参—— 厶 大 彡
?厶:首笔为折(5),次笔为点(4),故“厶”在第5区第4位(54、C)
?大:首笔为横(1),次笔为撇(3),故“大”在第1区第3位(13、D)
?彡:首笔为撇(3),次笔为撇(3),故“彡”在第3区第3位(33、E)
单字输入
编辑
编码流程图
五笔字型将成千上万个汉字首先分成两大类:键面上有的“键面字”和键面上没有的“键外字”。两类汉字的取码法按以下流程图分别取码。 [9]
编码流程图
编码输入
五笔字型字根键盘上,本身是汉字的字根,叫“键面字”。“键面字”分为三类,其输入法分别是[9]:
1、键名字的输入
每一个键位上,最左上角的那个黑体字的码元,叫键名字,它是“一键之名”。以G键为例,其左上角的字根“王”便是“键名字”或“键名”。 “键名字”的输入法是:把所在的键连打4下。例如[9]:
1区1位键名:王 11 11 11 11 (GGGG)
3区2位键名:白 32 32 32 32 (RRRR)
4区5位键名:之 45 45 45 45 (PPPP)
5区3位键名:女 53 53 53 53 (VVVV)
在王码五笔字型中,键名码元有25个。
1区:王土大木工(对应键位:GFDSA)
2区:目日口田山(对应键位:HJKLM)
3区:禾白月人金(对应键位:TREWQ)
4区:言立水火之(对应键位:YUIOP)
5区:已子女又纟(对应键位:NBVCX)
2、成字字根的输入
键面上除键名外,凡本身是汉字的码元,叫“成字字根”或“成字码元”。其输入法是:先打一下它所在的键(这一下俗称“报户口”),再打第一个、第二个,以及它的最末一个单笔画,最多4下,不足4下,补一个空格键[9]。例如:
成字字根输入
当输入十、七、九、二、几、儿、乃、刀……这一类只有2个笔画的字根时,“报户口”之后就只能有两个笔画了,不足4个码,笔画打完,要再补打一下“空格键”表示结束。
3、补码码元及其输入
在字根表中,用方圆框“框住”的4个字根,是“补码码元”,它们作为字根参与编码时,像姓氏中的复姓诸葛、司马一样,要编2个码:“主码
(即码元所在键位)+补码(规定取该码元最后的笔画结构)[9]。如”下表所示:
补码码元
注 :表中带圆圈的笔画丶、氵等,是“补码”的笔画表示形式,作为一个符号,用以提示编码。
这4个补码码元中的“犭、礻、衤”等三个字根,本身也是汉字,这三个汉字的编码规则是,要先“报户口”(主码+补码)(已占用2个码)、再打该字的第1笔和最后1笔,共取4码。即:
圆圈中的补码码元
注:键位上只有有的成字的字根可以打出来,而本身并不是汉字字根不能打出来。
“键外字”拆分法
凡是“字根总表”上没有的汉字,都是“键外字”。它们都是由几个码元(字根)组合而成的,我们也把这类字称为“多元字”。 对于“多元字”,只有一个字——拆分。科学、实用又没有“二义性”的“拆”法,共有以下5项规则[9]:
1、书写顺序
“合体字”拆成“字根”,一般情况下,要按照正确书写顺序进行。例如: 新:立 木 斤(顺序正确)
立 斤 木(顺序错误)
2、取大优先
要“拆”出“笔画尽可能多”的“字根”。要以“再添一个笔画,便不能构成为笔画更多的字根”为限度。例如:
估:亻 古 (正确)
亻 十 口(错误,因为“口”可添到前面的“十”上,“凑”成更多笔画的字根“古”)
注:“取大优先”,俗称“尽量往前凑”。因为“向前凑”总是有限度的,要凑成字根表中笔画更多(更大)的一个~否则,便没有“章法”了,势必有许多种“拆法”甚至都要拆成单笔画~在汉字拆分中,这是一个最常用到的、保证拆分唯一性的基本原则。
3、兼顾直观
在编码时,为了使码元特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成个别例外的情况。
例:“国”字
按“书写顺序”,其码元应是:“冂王丶一”,但这样编码,不但有悖于该字的字源,也不能使码元“囗”直观易辨。我们只好违背“书写顺序”,按“囗王丶”的顺序编码。
4、能连不交
请看以下取码实例:
天:一 大 (正确,“一”与“大”是相连接的关系,比较直观)
二 人 (错误,“二”与“人”交叉在一起了)
生:丿 (正确,“丿”与“ ”是相连的,直观可取)
土 (错误,“丿”与“ ”是相连的,直观可取)
一般来说,“连”比“交”更为“直观”,更能显现码元的笔画结构特征,更易于辨认。
5、能散不连
有时候,一个汉字的几个码元,都不是单笔画,这些码元之间的关系,常常在“散”和“连”之间模棱两可。如:
矢: 大,两个码元按“连”处理,“矢”便是杂合型(3型)字;两个码元如果按“散”处理,“矢”便是上下型(2型)字。
午: 、十(两个字根,可视为散,也可当作连)
都是既可“连”,又可“散”的关系。
当遇到这种既能“散”,又能“连”的情况时,我们规定:只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系。
四元及多元字
1、“四元字”的编码规则
键外字中的“四元字”,是指刚好由四个字根构成的字。其拆分之后的取码方法是“依照书写顺序输入字根[9]。例如:”
照:日刀口灬
22 53 23 44
J V K O
重:丿 一日土
31 11 22 12
T G J F
2、“多元字”的取码规则 —— “前三末一”(一二三末) 键外字中的“多元字”,是指由4个以上的字根构成的字。这种字,不管实际上能“拆”成几个字根,我们只需“按书写顺序,取拆分结果的第一 二 三及最末一个字根”便可,俗称“一二三末”,共输入四个[9]。码例如:
暨:彐厶匚儿日一
53 54 15 11
V C A G
攀:木乂乂木大手
14 32 32 32
S R R R
识别码
汉字编码输入法的设计,要尽量减少重码,以提高输入的唯一性。但从以下两种情形我们看到,仅仅输入字根,很容易产生[9]: 重码1、因构字的字根相同,字型不同引起重码:
叭:口 八(23 34 KW)
只:口 八(23 34 KW)
这个例子说明,编码中丢失了字型信息,才产生了重码。 2、因几个字根同一键位引起重码:
沐:氵 木(43 14 IS)
汀:氵 丁(43 14 IS)
洒:氵 西(43 14 IS)
这个例子说明,编码没有将“木、丁、西”加以区分,才产生了重码。 由以上两类例子可知,当遇到2-3个字根构成的汉字时,为了避免编码相同(重码),既有必要提取“字型信息”,又有必要从字根上“提取笔画特征信息”用于编码。复合这两种信息的一个附加码,就是“末笔字型识别码”简称“识别码”,“识别码”只追加在由2-3个字根构成的汉字编码中(见下节)。
“识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。1、2、3型汉字的识别码共有15个(各有3种形式),其构成如下:
末笔识别码
例:红:末笔1,字型1, 识别码为11(即 “一”);
华:末笔2,字型2, 识别码为22(即“刂”);
团:末笔3,字型3, 识别码为33(即“彡”)。
二三元字取码
“键外字”中,只有2个字根的字,叫“二元字”;只有3个字根的字,叫“三元字”。输入时,键外字毫无例外地都要“拆”。
“二元字”或“三元字”的输入法是:
先“拆”成字根,输入字根后,再追加一个“末笔字型识别码”(简称“识别码”)。有了识别码可以大量减少重码。[9]
“识别码”的简易直观表示法——用带圆圈的笔画表示“识别码”: 1、左右型(1型)字的“识别码”
对于1型(左右型)字,字根输入之后,补打“1个末笔画”,就等同于添加了“识别码”,用“一丨丿丶乙”表示。例如:
红:纟工 一(字根打完,补打1个末笔画“一”,相当于11:G) 55 15 11
X A G
2、上下型(2型)字的“识别码
对于2型(上下型)字,码元输入之后,补打“2个末笔画”的字根,就等同于添加了“识别码”,用“二 刂 丿丿 丶丶 巜”表示之。例如: 字 :宀 子 二(字根打完,补打2个末笔画“二”相当于12:F) 45 52 12
P B F
复: 日 夂(字根打完,补打2个末笔画“丶丶”,相当于42:U) 31 22 31 42
T J T U
花:艹 亻 匕 巜 (字根打完,补打2个末笔画“巜”,相当于52:B) 15 34 55 52
A W X B
3、杂合型(3型)字的“识别码”
对于3型(杂合型)字,码元输完之后,补打“3个末笔画”的字根,就等同于添加了“识别码”,用“三 川 彡 氵 巛”表示之。例如: 同:冂 一 口 三(字根打完,补打3个末笔画“三”,相当于13:D) 25 11 23 13
M G K D
远:二 儿 辶 巛(字根打完,补打3个末笔画“巛”,相当于53:V) 12 35 45 53
F Q P V
注1:凡是“包围型”的字,如全包围字“国、团”等,半包围字“这、庆”等,均以被包围的那个部分的“末笔”作为整个字的“末笔”来构成“识别码”,如“远”字,要以被包围的“儿”的末笔来构成“识别码”(53:V)。 注2:识别码一共有3种表示法,其编码的效果完全相同,都是同一个码。可以按照下面的方法打“识别码”,例如:
末笔横的1型字:打11键,就是G键,就是“一”(一个横)键。 末笔撇的3型字:打33键,就是E键,就是“彡”(三个撇)键。 其所以如此,道理很简单:1区1位(G)上有1个横“一”,3区3位(E)上有3个撇“彡”……
简码和容错码
1、简码输入
一些常用的字,除按它的“全码”可输入外,为减少打键次数,只输入其全码的最前边的1个、2个或3个码,再加打空格键,也可以输入,这就是一、二、三级简码。简码可以提高输入效率[9] 。
(1)一级简码(又称“高频字”)
将各键打一下,再打一下空格键,即可打出25个最常用的汉字(每键一个):
一地在要工 上是中国同 和的有人我 主产不为这 民了发以经 如:一:11(G) 的:32(R) 和:31(T)
具体如下表:
一级简码
(2)二级简码(只输入“全码”的前2个码) 化:亻 匕(34 55 WX)
李:木 子(14 52 SB)
二级简码表
(3)三级简码(只输入“全码”的前3个码) 想:木 目 心(14 21 51 SHN)
巍:山 禾 女 (25 31 53 MTV) 2、容错码
“容错码”的涵义是:“容易”编错,但“容许”按错码输入。例如: 面:丆冂三DMJD(正确,按笔顺取大优先)丆囗二DMJF(拆分容
错)
万能键Z
输入汉字时,如果一时不知道某些字的编码,便可以用“万能键Z”来代替“不知道的那个码”。Z键的用途主要可分以下三种情况: 1(当不知道某个字的拆分时,用Z代替不知道的字根,例: 键:钅 Z Z 廴
2(当不知道字根在哪个键位上时,用Z代替,例:
论:讠 人 Z Z
3(当不知道字的“识别码”时,可用Z代替,例:
花:艹 亻 匕 Z
万能键Z也叫学习键。一旦使用Z键,提示行中便会有比较多的字显示出来,其中会有你要的那个字,而且,字的后边还有正确码的提示。
词汇输入
编辑
在字母键上,打4个键,不用换档,既能打单字,又能打词汇,字、词之间没有界限,这是发明人1983年的一项重大创造——字词兼容。 在输入词汇时,不管多长的词汇,一律只打4下键,单字和词汇可以混合输入,字词之间不用任何换档或其它附加操作。词汇输入法[9]: 为
二字词
取每个字“全码”的前两个码组成,共4码。 例如:
生产:丿 立 丿
31 11 42 31(TGUT)
建设:彐 二 讠 几
53 12 41 34(VGYW)
三字词
前两个字,各取第一个码,最后一字取前两个码,共4码。
例如:
电视机:日 礻木 几
22 45 14 25(JPSW)
四字或以上词
对于4个字或超过4个字的词,取第一、二、三及最后一个汉字的第一
码,共4码。
例如:
中华人民共和国: 口 亻人 囗
23 34 34 24 (KWWL)
本文档为【新世纪五笔基础知识】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。