为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

新世纪五笔基础知识

2017-11-29 16页 doc 138KB 21阅读

用户头像

is_005190

暂无简介

举报
新世纪五笔基础知识新世纪五笔基础知识 基础知识 5种笔画 字根是由笔画写成。笔画、字根(部件)、整字,是汉字结构的三个层次[4]。 1984年王永民教授给笔画定义为:书写汉字时,一次写成的一个连续不断的线段。按照书写方向划分笔画的类型,如下图所示,则只有5种——横、竖、撇、捺、折。前4种是单方向的笔画,“折”则代表一切带转折、拐弯的笔画。为了便于记忆和排序,我们分别用1、2、3、4、5命名5种笔画的代号。 以下例子可作为这张表的补充说明:[4] (1)“提笔”等于“横”:王 现 (2)“点”等于“捺”:木 村 (3)“竖左钩”...
新世纪五笔基础知识
新世纪五笔基础知识 基础知识 5种笔画 字根是由笔画写成。笔画、字根(部件)、整字,是汉字结构的三个层次[4]。 1984年王永民教授给笔画定义为:书写汉字时,一次写成的一个连续不断的线段。按照书写方向划分笔画的类型,如下图所示,则只有5种——横、竖、撇、捺、折。前4种是单方向的笔画,“折”则代表一切带转折、拐弯的笔画。为了便于记忆和排序,我们分别用1、2、3、4、5命名5种笔画的代号。 以下例子可作为这张表的补充:[4] (1)“提笔”等于“横”:王 现 (2)“点”等于“捺”:木 村 (3)“竖左钩”等于“竖”: 禾 (4)所有带转折的笔画都算作“折”。 为便于书面表示,以后所有的“折”笔,不管怎么“折”,怎么“弯”,怎么“拐”,一律都有“乙”来表示,其笔画代号都是5。 王永民对笔画的以上分类法及代号,现在已经被正式写入了代号为GB/T18031-2000的国家标准中。 给笔画分类,并命名以数字代号,是学习王码输入法时最重要的基础知识。在实践中,许多人之所以编码出现错误,或对键盘上码元排列的规律性“视而不见”,其根本原因,常是因为没有掌握好五种单笔画的分类及其数字代号。[4] 3种字型 习惯上,我们把构成汉字的基本笔画结构,称作“字根”或“部件”。而当“字根”或“部件”用于编码的时候,又可以把它们叫做“码元”,意思是编码的“元素”。 汉字是一种平面文字,同样几个字根,同样的先后顺序,摆放[4]的位置不同,就是不同的字。如: 叭——只 吧——邑 呐——呙 岂——屺 可见,字根相互间的位置关系,也是汉字图形的一个特征,在汉字编码中,用数字代表这个特征,就成为很有用的、用以分区“重码”的“识别”信息。 根据构成汉字的各个字根之间的位置关系,我们可以把成千上万的方块汉字,分为三种字型: 左右型:字根左右排列。 上下型:字根上下排列。 杂合型:字根互相周围或交叉套迭。 根据各种字型拥有汉字的多少,顺序将字型命以数字代号,如下表所示。 我们便约定:[4] 1型字,即指“左右型”汉字,其代号为1; 2型字,即指“上下型”汉字,其代号为2; 3型字,即指“杂合型”汉字,其代号为3。 将来,我们给汉字编码时,字型及其代号将非常有用。 这里应当说明,在王码中,仅仅对于那些由2个或3个字根组成的字, 我们才关心它的“字型”。如果一个字由4个或4个以上的字根组成,例如:编码中,我们就不再计较是什么“型”了。[4] 键位分布 五笔字型键盘 五笔字型采用标准英文键盘的26个字母键输入汉字。每个汉字,每条词汇最多打4下键。汉字是由字根构成的。我们将构成汉字的字根,优选归纳为125种,也称作“码元”,分配在除Z键以外的25个英文字母键上,形成了五笔字型的“字根键盘”。新世纪版五笔字型字根键位图: 新世纪五笔字型字根键位图(2 张) 字根助记歌 为保持技术的连续性,第三代五笔字型(新世纪版)的25个“键名”没 有变动。新设计的字根体系更加符合分区划位规律,更加科学易记而 实用,按规范笔顺写汉字的人,取码输入将得心应手。新世纪版的《字 根助记歌》如下[7]: 1区横起笔 11 G 王旁青头五一提 12 F 土士二干十寸雨 13 D 大三肆头古石厂 14 S 木丁西边要无女 15 A 工戈草头右框七 2区竖起笔 21 H 目止具头卜虎皮 22 J 日曰两竖与虫依 23 K 口中两川三个竖 24 L 田框四车甲单底 25 M 山由贝骨下框里 3区撇起笔 31 T 禾竹牛旁卧人立 32 R 白斤气头叉手提 33 E 月舟衣力豕豸臼 34 W 人八登祭风头几 35 Q 金夕犭儿包头鱼 4区点起笔 41 Y 言文方点在四一 42 U 立带两点病门里 43 I 水边一族三点小 44 O 火变三态广二米 45 P 之字宝盖补示衣 5区折起笔 51 N 已类左框心尸羽 52 B 子耳了也乃齿底 53 V 女刀九巡录无水 54 C 又巴甬矣马失蹄 55 X 幺母绞丝弓三匕 记忆规律 在五笔字型键盘上,多数字根(码元)的安排都是有规律的。字根键盘分为5个区,区号为1,5;每一个区,各有5个键位,位号也是1,5,从键盘中部向外端排列;区号与位号组合,共形成5×5=25个代码,即区位码:11…15,21…51…55。其规律性如下[8]: 1、字根所在的“区号”与“首笔代码”一致[8] ? 横起笔的字根,在第1区——“王土大木工”的首笔代号为1; ? 竖起笔的字根,在第2区——“目日口田山”的首笔代号为2; ? 撇起笔的字根,在第3区——“禾白月人金”的首笔代号为3; ? 点起笔的字根,在第4区——“言立水火之”的首笔代号为4; ? 折起笔的字根,在第5区——“已子女又幺”的首笔代号为5。 2、位号基本上与码元的次笔代码一致[8] 位码与码元次笔关系 3、单笔画的“个数”,与所在的“位号”一致[8] 一、丨、丿、丶、乙 都在相应区的第1位; 二、刂、丿丿、丶丶、巜 都在各区的第2位; 三、彡、氵、巛 都在各区的第3位; 四、灬 在相应区的第4位。 4、从字根上“直读”区位号[8] 依照以上3条规律,根据字根的“前两个笔画”,可立即“直读”出“字根”的区位号(即:前2个笔画的代号连在一起念,就是区位号~): 例:参—— 厶 大 彡 ?厶:首笔为折(5),次笔为点(4),故“厶”在第5区第4位(54、C) ?大:首笔为横(1),次笔为撇(3),故“大”在第1区第3位(13、D) ?彡:首笔为撇(3),次笔为撇(3),故“彡”在第3区第3位(33、E) 单字输入 编辑 编码流程图 五笔字型将成千上万个汉字首先分成两大类:键面上有的“键面字”和键面上没有的“键外字”。两类汉字的取码法按以下流程图分别取码。 [9] 编码流程图 编码输入 五笔字型字根键盘上,本身是汉字的字根,叫“键面字”。“键面字”分为三类,其输入法分别是[9]: 1、键名字的输入 每一个键位上,最左上角的那个黑体字的码元,叫键名字,它是“一键之名”。以G键为例,其左上角的字根“王”便是“键名字”或“键名”。 “键名字”的输入法是:把所在的键连打4下。例如[9]: 1区1位键名:王 11 11 11 11 (GGGG) 3区2位键名:白 32 32 32 32 (RRRR) 4区5位键名:之 45 45 45 45 (PPPP) 5区3位键名:女 53 53 53 53 (VVVV) 在王码五笔字型中,键名码元有25个。 1区:王土大木工(对应键位:GFDSA) 2区:目日口田山(对应键位:HJKLM) 3区:禾白月人金(对应键位:TREWQ) 4区:言立水火之(对应键位:YUIOP) 5区:已子女又纟(对应键位:NBVCX) 2、成字字根的输入 键面上除键名外,凡本身是汉字的码元,叫“成字字根”或“成字码元”。其输入法是:先打一下它所在的键(这一下俗称“报户口”),再打第一个、第二个,以及它的最末一个单笔画,最多4下,不足4下,补一个空格键[9]。例如: 成字字根输入 当输入十、七、九、二、几、儿、乃、刀……这一类只有2个笔画的字根时,“报户口”之后就只能有两个笔画了,不足4个码,笔画打完,要再补打一下“空格键”表示结束。 3、补码码元及其输入 在字根表中,用方圆框“框住”的4个字根,是“补码码元”,它们作为字根参与编码时,像姓氏中的复姓诸葛、司马一样,要编2个码:“主码 (即码元所在键位)+补码(规定取该码元最后的笔画结构)[9]。如”下表所示: 补码码元 注 :表中带圆圈的笔画丶、氵等,是“补码”的笔画表示形式,作为一个符号,用以提示编码。 这4个补码码元中的“犭、礻、衤”等三个字根,本身也是汉字,这三个汉字的编码规则是,要先“报户口”(主码+补码)(已占用2个码)、再打该字的第1笔和最后1笔,共取4码。即: 圆圈中的补码码元 注:键位上只有有的成字的字根可以打出来,而本身并不是汉字字根不能打出来。 “键外字”拆分法 凡是“字根总表”上没有的汉字,都是“键外字”。它们都是由几个码元(字根)组合而成的,我们也把这类字称为“多元字”。 对于“多元字”,只有一个字——拆分。科学、实用又没有“二义性”的“拆”法,共有以下5项规则[9]: 1、书写顺序 “合体字”拆成“字根”,一般情况下,要按照正确书写顺序进行。例如: 新:立 木 斤(顺序正确) 立 斤 木(顺序错误) 2、取大优先 要“拆”出“笔画尽可能多”的“字根”。要以“再添一个笔画,便不能构成为笔画更多的字根”为限度。例如: 估:亻 古 (正确) 亻 十 口(错误,因为“口”可添到前面的“十”上,“凑”成更多笔画的字根“古”) 注:“取大优先”,俗称“尽量往前凑”。因为“向前凑”总是有限度的,要凑成字根表中笔画更多(更大)的一个~否则,便没有“章法”了,势必有许多种“拆法”甚至都要拆成单笔画~在汉字拆分中,这是一个最常用到的、保证拆分唯一性的基本原则。 3、兼顾直观 在编码时,为了使码元特征明显易辨,有时就要暂时牺牲“书写顺序”和“取大优先”的原则,形成个别例外的情况。 例:“国”字 按“书写顺序”,其码元应是:“冂王丶一”,但这样编码,不但有悖于该字的字源,也不能使码元“囗”直观易辨。我们只好违背“书写顺序”,按“囗王丶”的顺序编码。 4、能连不交 请看以下取码实例: 天:一 大 (正确,“一”与“大”是相连接的关系,比较直观) 二 人 (错误,“二”与“人”交叉在一起了) 生:丿 (正确,“丿”与“ ”是相连的,直观可取) 土 (错误,“丿”与“ ”是相连的,直观可取) 一般来说,“连”比“交”更为“直观”,更能显现码元的笔画结构特征,更易于辨认。 5、能散不连 有时候,一个汉字的几个码元,都不是单笔画,这些码元之间的关系,常常在“散”和“连”之间模棱两可。如: 矢: 大,两个码元按“连”处理,“矢”便是杂合型(3型)字;两个码元如果按“散”处理,“矢”便是上下型(2型)字。 午: 、十(两个字根,可视为散,也可当作连) 都是既可“连”,又可“散”的关系。 当遇到这种既能“散”,又能“连”的情况时,我们规定:只要不是单笔画,一律按“能散不连”判别,即优先确定为“散”的关系。 四元及多元字 1、“四元字”的编码规则 键外字中的“四元字”,是指刚好由四个字根构成的字。其拆分之后的取码方法是“依照书写顺序输入字根[9]。例如:” 照:日刀口灬 22 53 23 44 J V K O 重:丿 一日土 31 11 22 12 T G J F 2、“多元字”的取码规则 —— “前三末一”(一二三末) 键外字中的“多元字”,是指由4个以上的字根构成的字。这种字,不管实际上能“拆”成几个字根,我们只需“按书写顺序,取拆分结果的第一 二 三及最末一个字根”便可,俗称“一二三末”,共输入四个[9]。码例如: 暨:彐厶匚儿日一 53 54 15 11 V C A G 攀:木乂乂木大手 14 32 32 32 S R R R 识别码 汉字编码输入法的设计,要尽量减少重码,以提高输入的唯一性。但从以下两种情形我们看到,仅仅输入字根,很容易产生[9]: 重码1、因构字的字根相同,字型不同引起重码: 叭:口 八(23 34 KW) 只:口 八(23 34 KW) 这个例子说明,编码中丢失了字型信息,才产生了重码。 2、因几个字根同一键位引起重码: 沐:氵 木(43 14 IS) 汀:氵 丁(43 14 IS) 洒:氵 西(43 14 IS) 这个例子说明,编码没有将“木、丁、西”加以区分,才产生了重码。 由以上两类例子可知,当遇到2-3个字根构成的汉字时,为了避免编码相同(重码),既有必要提取“字型信息”,又有必要从字根上“提取笔画特征信息”用于编码。复合这两种信息的一个附加码,就是“末笔字型识别码”简称“识别码”,“识别码”只追加在由2-3个字根构成的汉字编码中(见下节)。 “识别码”是由“末笔”代号加“字型”代号构成的一个“复合附加码”。1、2、3型汉字的识别码共有15个(各有3种形式),其构成如下: 末笔识别码 例:红:末笔1,字型1, 识别码为11(即 “一”); 华:末笔2,字型2, 识别码为22(即“刂”); 团:末笔3,字型3, 识别码为33(即“彡”)。 二三元字取码 “键外字”中,只有2个字根的字,叫“二元字”;只有3个字根的字,叫“三元字”。输入时,键外字毫无例外地都要“拆”。 “二元字”或“三元字”的输入法是: 先“拆”成字根,输入字根后,再追加一个“末笔字型识别码”(简称“识别码”)。有了识别码可以大量减少重码。[9] “识别码”的简易直观表示法——用带圆圈的笔画表示“识别码”: 1、左右型(1型)字的“识别码” 对于1型(左右型)字,字根输入之后,补打“1个末笔画”,就等同于添加了“识别码”,用“一丨丿丶乙”表示。例如: 红:纟工 一(字根打完,补打1个末笔画“一”,相当于11:G) 55 15 11 X A G 2、上下型(2型)字的“识别码 对于2型(上下型)字,码元输入之后,补打“2个末笔画”的字根,就等同于添加了“识别码”,用“二 刂 丿丿 丶丶 巜”表示之。例如: 字 :宀 子 二(字根打完,补打2个末笔画“二”相当于12:F) 45 52 12 P B F 复: 日 夂(字根打完,补打2个末笔画“丶丶”,相当于42:U) 31 22 31 42 T J T U 花:艹 亻 匕 巜 (字根打完,补打2个末笔画“巜”,相当于52:B) 15 34 55 52 A W X B 3、杂合型(3型)字的“识别码” 对于3型(杂合型)字,码元输完之后,补打“3个末笔画”的字根,就等同于添加了“识别码”,用“三 川 彡 氵 巛”表示之。例如: 同:冂 一 口 三(字根打完,补打3个末笔画“三”,相当于13:D) 25 11 23 13 M G K D 远:二 儿 辶 巛(字根打完,补打3个末笔画“巛”,相当于53:V) 12 35 45 53 F Q P V 注1:凡是“包围型”的字,如全包围字“国、团”等,半包围字“这、庆”等,均以被包围的那个部分的“末笔”作为整个字的“末笔”来构成“识别码”,如“远”字,要以被包围的“儿”的末笔来构成“识别码”(53:V)。 注2:识别码一共有3种表示法,其编码的效果完全相同,都是同一个码。可以按照下面的方法打“识别码”,例如: 末笔横的1型字:打11键,就是G键,就是“一”(一个横)键。 末笔撇的3型字:打33键,就是E键,就是“彡”(三个撇)键。 其所以如此,道理很简单:1区1位(G)上有1个横“一”,3区3位(E)上有3个撇“彡”…… 简码和容错码 1、简码输入 一些常用的字,除按它的“全码”可输入外,为减少打键次数,只输入其全码的最前边的1个、2个或3个码,再加打空格键,也可以输入,这就是一、二、三级简码。简码可以提高输入效率[9] 。 (1)一级简码(又称“高频字”) 将各键打一下,再打一下空格键,即可打出25个最常用的汉字(每键一个): 一地在要工 上是中国同 和的有人我 主产不为这 民了发以经 如:一:11(G) 的:32(R) 和:31(T) 具体如下表: 一级简码 (2)二级简码(只输入“全码”的前2个码) 化:亻 匕(34 55 WX) 李:木 子(14 52 SB) 二级简码表 (3)三级简码(只输入“全码”的前3个码) 想:木 目 心(14 21 51 SHN) 巍:山 禾 女 (25 31 53 MTV) 2、容错码 “容错码”的涵义是:“容易”编错,但“容许”按错码输入。例如: 面:丆冂三DMJD(正确,按笔顺取大优先)丆囗二DMJF(拆分容 错) 万能键Z 输入汉字时,如果一时不知道某些字的编码,便可以用“万能键Z”来代替“不知道的那个码”。Z键的用途主要可分以下三种情况: 1(当不知道某个字的拆分时,用Z代替不知道的字根,例: 键:钅 Z Z 廴 2(当不知道字根在哪个键位上时,用Z代替,例: 论:讠 人 Z Z 3(当不知道字的“识别码”时,可用Z代替,例: 花:艹 亻 匕 Z 万能键Z也叫学习键。一旦使用Z键,提示行中便会有比较多的字显示出来,其中会有你要的那个字,而且,字的后边还有正确码的提示。 词汇输入 编辑 在字母键上,打4个键,不用换档,既能打单字,又能打词汇,字、词之间没有界限,这是发明人1983年的一项重大创造——字词兼容。 在输入词汇时,不管多长的词汇,一律只打4下键,单字和词汇可以混合输入,字词之间不用任何换档或其它附加操作。词汇输入法[9]: 为 二字词 取每个字“全码”的前两个码组成,共4码。 例如: 生产:丿 立 丿 31 11 42 31(TGUT) 建设:彐 二 讠 几 53 12 41 34(VGYW) 三字词 前两个字,各取第一个码,最后一字取前两个码,共4码。 例如: 电视机:日 礻木 几 22 45 14 25(JPSW) 四字或以上词 对于4个字或超过4个字的词,取第一、二、三及最后一个汉字的第一 码,共4码。 例如: 中华人民共和国: 口 亻人 囗 23 34 34 24 (KWWL)
/
本文档为【新世纪五笔基础知识】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索