三一代码汉语计算机语音输入法
1 200510077021.4 说 明 书
说 明 书 第1/21页
本发明涉及计算机语言、语音和汉语拼音的交叉学科。
在已开发的“一种三一代码汉语计算机输入法”(专利号96 100728-1的基础上,为进一步对汉语输入计算机技术的升级,实现在汉语输入的同时,开发出汉语语音的输入法。 目前计算机输入的语言都是用输入字符来
达的。它只能通过视觉的阅读来理解,而不能象人的语
言通过听觉来接收,是计算机语言和人类语言存在的差异。
本发明的任务:提供一种三一代码汉语计算机语音输入法,在用字符输入表达汉语(三一
代码)的同时,还可输入语音用听觉来接收,取得计算机的汉语(字符)和语音双输的创新。 三一代码(简称汉码)在输入计算机汉语的同时,要达到语音输入的条件,必须创建汉语音调库。
但是我国的语言尚未拼音化,就没有条件提供开发此项信息语音技术的数据!当前是等待我国
实现拼音化之后再来开发信息技术呢?还是响应号召开展“交叉学科”的研究,把汉语拼音学科作为实现信息学科的一项“阶梯工程”来研发?这属于没有条件创造条件也要上的开发路线,
无疑后者是符合加速振兴中华的战略。
本发明的技术
是:
1、由一个三一代码信息语音的阶梯
工程的、汉语拼音系统工程的设计,取得汉语语音技术的全部材料;26个声母的排序;汉语
60音素;884音节;3536个调节;从而完成四调的语音库和同步输入法,完成汉语和语音的
同输法。
2、同步输入的标音的双发音法、无
符大写标调法和汉语标符法。
3、每敲两键输入两个字母,表达一
1
2 说 明 书 200510077021.4
200510077021.4 说 明 书 第2/21页
个音节,同时输入语音的一个调节,连续构成语词、语句和普通话。
一, 系统性开发阶梯工程:汉语是一种以调为主体的四调语言,在语音输入上是要创
建;语调库的数据是出自完整的汉语拼音系统工程,做为信息语音的
前提;要实现语音输入必须把它作为信息语音技术“阶梯工程”而设计。要从表
达音素的符号设计、符号的排序、符号的标音、符号音素的划分;声、韵字母数额
的标定、声韵音素的计算,才能取得汉语实际音节的数据和音调的数据,构成语
调库的数据条件。
二, :是以现行“汉语拼音方案”(简称“汉拼”)为基础,通过以下
的程序,把“汉语拼音学科”系统化;取得语调库的各项数据,完成信息技术的
阶梯工程,从而使我国在未实现拼音化之前通过阶梯工程的26个符号即可主宰计
算机语言,攀登信息技术的高峰。
:根据1958年周总理在“当前文字改革的任务”
中指出:“汉语决定采用拉
丁字母为拼音字母”应当确定这样一条原则”;本发明遵守这一原则,采用拉丁字母。 ,: 根据我国现行汉语拼音和近百年来的拼音历史的习惯,都是以声母为主体
的b p m f,- - 为序列,因为它符合汉语声母在前排列的规律。为进一步提高其科学性、在
单元组合上作了对称性、压韵性的必要的调整,构成拼音系统骨架结构的排序:
(zh)(ch) (sh)
音素是由语言自然形成的基本语音元素,它划分声母和韵母两类。以“汉语拼
音方案”(以下简称“汉拼”)为例:设定为21个,韵母34个(共)。经本案的研发,实际的声母是26个,韵母是34个共计 “汉拼”短缺音素的标定:是把 5个中性音素的字母仅列入韵母行列,并未列入声母行列。它是双重任务的符
号,就必须双方列入,否则声母方缺少了5个音素,将造成总音节数,短缺(5×34) = 短缺不能表达全部汉语音调数,因此必须补充列入5个声母,达到原26个声母的实际
用26个符号进行承载60个音素,叫做符号标音。“汉拼”采用一音多符制(复
合韵母)的标音法。与本发明的 “汉语输入法“一符多音制的标音(采用双发音方法取代“汉
2
3 200510077021.4 说 明 书
拼”一音多符制的标音 )相比,不仅取得语音双输入的同步性,同时也把符号的标音效率提高
一倍。
( 1959 -1998 )
"汉拼"是由声、韵、调三种元素用三种码符来表达的。"三一代码"是经过优化把三种元素用一种码符来完成。每个代码都是声码,把它放在韵码位置上代替韵码,又都是韵码。把大写代码代入字间标示四调,它还是调码,故叫“”(简称)。
(一).双发音法则:每个代码在单独或声码位置发声码音.在韵码位置,发韵码音,如下:
玻-耶 坡-腰 摸-烟 佛-英 哥-昂 克-亨 喝-翁,佣
b-ie p-iao m-ian f-ing g-ang k-eng h-ong.iong
ㄅ-ㄝ ㄆ-ㄧㄠ ㄇ-ㄧㄢ ㄈ-ㄧㄥ ㄍ-ㄤ ㄎ-ㄥ ㄏ-ㄨㄥ.ㄩㄥ
资-安 疵-恩 思-优 一-一 乌-乌 迂-迂,歪
z-an c-en s-iu i-i u-u y-y.uai
ㄗ-ㄢ ㄘ-ㄣ ㄙ-ㄧㄡ ㄧ-ㄧ ㄨ-ㄨ ㄩ-ㄩ.ㄨㄞ
得-因 特-威,约 讷-弯,冤 勒-温,晕 基-哀 其-诶 西-奥
d-in t-ui.ve n-uan.van l-un.vn j-ai q-ei x-ao
ㄉ-ㄧㄣ ㄊ-ㄨㄟ.ㄩㄝ ㄋ-ㄨㄢ.ㄩㄢ ㄌ-ㄨㄣ.ㄩㄣㄐ-ㄞ ㄑ-ㄟ ㄒ-ㄠ
知-央,汪 吃-阿 尸-挖,呀 窝 恶 日-儿,欧
zh-iang.uang ch-a sh-ua.ia o-uo e-e •r-er.ou
ㄓ-ㄧㄤ.ㄨㄤ ㄔ-ㄚ ㄕ-ㄨㄚ.ㄧㄚ ㄛ-ㄛ ㄜ-ㄜ ㄖ-ㄦ.ㄡ
(二).大写标调法: 把大写代码,按规则写在声,韵码的位置,标示四调。单独小写读一调,单独大写读四调。规则如下:
1调 2调 3调 4调
— / ? •\
ma (妈) m(麻) (马) a(骂)
小小 小大 大大 大小
(三).汉语标符法:
1.韵符:”o” ,每个代码单独使用发声母音。如需发韵母亲音时,则在代码前加[O]
例如: (安全) "ozqN".
2.点符:“‘”,在音节之前标示须省目的人、地名。如(北京) “ 'BQjf。(一般不标注)。两个代码,在相拼
位置而不应相拼时,则在两码之间上部,用[']隔开,例如: (哥哥) "g'g" (此规定为手写时使用)。点符在音节之尾,标示 "轻声",如:(东西)指物件 “ dhxi’”[轻声]。
3.空符:书写语言以词组为原则,每一个词组之间加空格符以示划分。如:
举例: ( 从此 中国人 有了 自己 语言 主宰 的 电脑 ) (16字) 汉拼: cóngcǐzhònggǘorén yǒule zījǐ yǚián zhǚzǎi dē diǎnnǎo(45+16=61符) 汉码: 32符 )
3
4 200510077021.4 说 明 书
200510077021.4 说 明 书 第4/21页
()
声码单音符:
bo po mo fo ge ke he zi ci si ii uu yy (uj)
de te ne le ji qi xi vi ai wi oo ee ri
韵码单音符:
ib ip im if og ok oh 'yh oz oc os
(ie)(ix)(iz) (hk) (uk) (ir)
id uq yt uz yn uc yl oj oq ox og ig oa ow ia oo ee er or
注: ( 7个括弧的音节码,是3-1代码输入汉字软件的专用码)
,:声母×韵母=音节( 26×34 = 音节)。: 音节× 4 = 调节 (884 × 4 = )见音节表。(四调拼音课表附最后)
???????????????????????????????
b p m f g k h h' z c s i u y y' d t t' n n' l l' j q x v v' a w w' o •e r r' ( 34)
ie iao ian ing ang eng ong iog an en iou i u y uai in ui ve uan van un vn ai ei ao iag uag a • ua ia o e er ou (75)
椰 要 烟 英 昂 亨 翁 拥 安 恩 优 衣 乌 迂 歪 音 威 约 弯 冤 温 晕 埃 诶 奥 央 汪 阿 挖 压 窝 额 儿 欧 汉字
?????????????????????????????????????????????????????? 音节数 b 玻> bb bp bm bf bg bk bz bc bi bu bd bj bq bx ba bo
pb pp pm pf pg pk pz pc pi pu pd pj pq px pa po pr mb mp mm mf mg mk mz mc ms mi mu md mj mq mx ma mo me mr fg fk fz fc fu fq fa fo fr gg gk gh gz gc gu gy gt gn gl gj gq gx gv ga gw go ge gr kg kk kh kz kc ku ky kt kn kl kj kx kv ka kw ko ke kr hg hk hh hz hc hu hy ht hn hl hj hq hx hv ha hw ho he hr zg zk zh zz zc zi zu zt zn zl zj zq zx za zo ze zr cg ck ch cz cc ci cu ct cn cl cj cx ca co ce cr sg sk sh sz sc si su st sn sl sj sx sa so se sr if ig ih iz ii id in il ix ia io ie ir ug uk uz uc uu uj uq ua uo yz yy yt yn yl db dp dm df dg dk dh dz ds di du dt dn dl dj dx da dw do de dr tb tp tm tf tg tk th tz ti tu tt tn tl tj tx ta to te tr nb np nm nf ng nk nh nz nc ns ni nu ny nd nt nn nj nq nx nv na no ne nr lb lp lm lf lg lk lh lz ls li lu ly ld lt ln ll lj lq lx lv la lw lo le lr jb jp jm jf jh js ji jy jd jt jn jl jv jw qb qp qm qf qh qs qi qy qd qt qn ql qx qv qw xb xp xm xf xh xs xi xy xd xt xn xl xv xw vg vk vh vz vc vi vu vy vt vn vl vj vx vv va vw vo ve vr ag ak ah az ac ai au ay at an al aj ax av aa ao ae ar wg wk wz wc wi wu wy wt wn wl wj wx wv wa ww wo we wr og oz oc oj ox oa oo oe eg ez ec eu ej eq ex ea eo ee er rg rk rh rz rc ri ru rt rn rl rx ro re rr