方言的Excel处理
1.基本材料-Excel《方言调查字
》
2.基本方法-排序
3.基本目标-方音与古音对照表
1.Excel《方言调查字表》
来 源:本表由中国社会科学院语言研究所《古今字音对照手册》、《方言调查字表》和北京大学《汉语方音字汇》综合而成。
取 字:依据《方言调查字表》(修订本),参照北京大学《汉语方音字汇》(第二版)及实际应用有所增删,《汉语方音字汇》的2961字全部在内,合计3980字。
字 形:使用通用的简化字,少数音韵用字和需要区分的调查字,改用繁体。电脑未备的字临时拼造(以图片显示)。
字 音:据中国社会科学院语言研究所《古今字音对照手册》(修订本)注明反切、中古音韵地位和北京音,参照《字表》、《字汇》和《广韵》、《集韵》作了修订。以批注形式全部收录《汉语方音字汇》的"又音"材料。
音 标:用汉语拼音
,稍有变通。变通情况有:
①韵母一律用完全式,以方便作"韵"的统计。不用字头w、y。
②用ī表示舌尖前不圆唇元音(平舌),用ǐ表示舌尖后不圆唇元音(翘舌)。
③ 用y表示ü,无论是韵头还是韵腹。iong来自古合口细音,改为撮口的yong。
④用数码表示今声调。
编 排:从左到右:序号,字目,今音,反切,中古音。能够分开的项目,例如今音的声韵调、反切的上下字等,都分配到格子中,每个单元格只容纳一项内容。为了电脑检索的方便,后面增加了等呼、四声、“赅韵”(举平赅仄)、古声母的清浊。所用代码的意义是:
呼A——开口呼 呼B——合口呼 (后面的阿拉伯数码表示“等” )
调1——平声 调2——上声 调3——去声 调4——入声
清A——全清 清B——次清 浊A——全浊 浊B——次浊
序号B(表)维持语言所《方音调查字表》的顺序,序号H(字汇)标明北大《汉语方音字汇》的顺序。
(图01)
文 件 (《方言的Excel处理》文件包的构成)
几个文件的说明
《方言调查4千字》是《方言调查字表》的简化本,仅有字目,编排保持原书顺序,供调查记音和过录材料之用。
北大《汉语方音字汇》分页版按原书分页,可作成各地字音对照表。
《造字法》有Windows造字和CorelDRAW造字两种,前者造的字可以调节字号,可以检索,但不能转移到别的电脑;后者造的字可以转移到别的电脑显示,但不能检索,调节大小靠手工进行,不规范。两者都可以打印。有些字可以在GBK字库中找到,不需要另造,附《GBK字库通检》供查阅。
《自定义序列》是为了解决声韵排序准备的。电脑对于阿拉伯数字、英文字母、汉字等,有默认的顺序,研究汉语语音需要的是b p m f、帮滂並明、平上去入等等顺序。本件按声韵研究的专门需要编排各类顺序,届时按照一定的步骤导入电脑即可使用。您也可以将方音的声母和韵母排出特定的序列,依此法导入电脑,供方言排序使用。
《古今字音对照手册》是语言所《手册》的Excel版,收字7303,照原书使用繁体字,并将异体字立为字目,可供查阅《方音调查字表》未收的字。
《〈古今字音对照手册〉校订》是对原书的勘误,这里收的手册字已经作了订正。
2.排序操作
将工作表的“行”排成符合要求的顺序。每一行都包括许多属性或特征,如果需要将各行共有的某一属性(特征)找出来,便以这个属性所在的“列”为依据(称为“主要关键字”)排序,只要几个键的操作,相同属性的“行”就集中在一起了。Excel处理方言的核心技术就是排序,在“方音与古音对照表”的基本平台上,可以分别按古声母、北京韵母、方言声调、古音清浊等等项目排序,成为单项的古今对照。
⑴常规方法:全选,【数据/排序】,指定“主要关键字”,确定。
(图02)
(图03)
⑵自定义序列。先导入,后使用。打开附件《自定义序列》,选中某项自定义,例如韵部,点【工具/选项】。
(图04)
在“选项”的展开卡中选中“自定义序列”。点击右下方的“导入”,确定。
(图05)
如果要按自定义序列排序,在“排序”的对话框中点击“选项”,屏幕左上方出现“排序选项”框。
(图06)
点中“排序次序”的黑三角,在展开的备选框中直接点击所需要的序列,确定,回到“排序”框,再选关键字所在的“列”。
⑶多级排序。有时需要用几个
分层次排序,例如,首先按摄分,摄下面分等呼、四声,这样就要用到“第二关键字”和“第三关键字”。同时选3个关键字排序,它们的关系是,首先按“主要关键字”排序,同时按 “第二关键字”排列第二层,在第二层下面,又按“第三关键字”排列第三层:三层排序一次完成。
⑷注意事项
1 确定关键字时要指明有没有标题行。标题行是在每列开头的地方,也就是全表第1
行,有时有“列标题”,例如“姓名”、“年龄”、“声母”、“韵母”之类。如果有这类列标题而选了“无标题行”,就会连列的标题一起排序。
2 每次排序只能使用一种自定义序列,如果选中两种,就有一种不起作用。使用不同
的自定义序列排序,要分几次进行。我们把等呼、四声分别合并,另用普通字符编码,就是为了避免同时使用几种自定义序列。
3.制作方音与古音对照表
⑴在《方音调查字表》的副本上(不要动原件)标注方言字音的声韵调。两种办法:直
录法、拷入法。
如果调查所得的方音材料尚未输入电脑,宜用直录法,将方音直接输入到相应字的最后。如果方音材料已经输入电脑,宜用拷入法,将录好的材料稍加整理,涂成红色,复制到《方言调查字表》末尾,再用排序等办法将方音加到各字目后面。如果已经制成
式同音字表,转换起来反倒麻烦,不如直录法来得方便。注意:
①把握字的音义关系,用字与本表取得一致。参看《区分字》。
②音标符号暂用英文字母代替。Excel不接受国际音标,会出乱码,因此要用系统能够识别的英文字母(或加阿拉伯数码)代替国际音标,待处理完毕转入Word以后,再替换成国际音标。
③将声韵调分开,每个单元格只填一项内容。
④使用拷入法之前,要按《方音调查字表》的Excel格式对方音字表进行整理。将文件保存为纯文本格式,然后用Excel打开,使字目对字目(处在同一列),方音对准古音后面的空格。以字目为“主要关键字”排序,将同形字(多音多义字)排在一起,在同形字的声母前面的空格中填★号,全文涂成红色。
⑵将方音移到古音后面。直录法已经直接录在后面了,拷入法才需要这样处理。
①字目对位。方音材料拷入之后,全选、排序,将两表(红黑两色)相同的字目调到一起。假设方音字表是从后面粘贴上去的,那么,红色的字(方言)就在黑色字(古音)下面。
②音义配对。检查多音多义字,务必让红黑音义一致的字相邻,且黑上红下。例如,上
面两个黑“长”,下面两个红“长”,都是长短的“长”在前面,生长的“长”在后面,用剪切办法把第一个红“长”(长短)整行调到第一个黑“长”(长短)下面,第二个红“长”(生长)自然处在第二个黑“长” (生长)下面,如此一一相配。我们已经在同形字后面加了★号,两表的★号处在同一列,以★号为“主要关键字”排序,可以把所有同形字调到一起,集中处理。
3 移动方音。在全表第一行方音声韵调上面,删除三个空的单元格,让这三列其他的
单元格依次上移一行,方音正好接到古音后面。如果方言字(红)在上而古音字(黑)在下,就要在第一行插入一个空行(三个单元格),把方言声韵调往下面推一行。
4 删除无用字。以方音声调为“主要关键字”排序,没有方音的字条统统集中到后面,
一起删除。排序之后,应仔细检查方音所在行有没有红色的方言字,如果有,说明配对工作有疏漏,要退回去重新检查。调整无误后,再次排序,才能将没有方音的字条删除。
⑤保存新文件,取名《某方音与古音对照表》。此表应当作为母本以“只读”方式保存,
复制副本使用。
⑶参考意见
1 如果调查的方言字不超过3千,可以用《汉语方音字汇3千字表》。字表未收的字,
可以从《方音调查字表》或《古今字音对照手册》中复制过来。
②在配对过程中,应把握“来历”,例如“编”字许多地方念送气声母,如果对应卑连切的帮母,算例外。其实送气音来自纰延切的滂母,应当把批注中纰延切的古音地位调出来,取代卑连切。配对这道工序是整个工作成败的关键,一字之差,全盘皆乱,一定要认真做好。
③英文字母暂代国际音标,纯属处理过程中的技术问题,用什么字母代替什么音标,也
不必有统一规定,这里提供一个可以参考的做法(见下页)。
④行列转换。有时需要将行转换成列,或者反过来,将列转换成行。Excel中行(横)转成列(纵)的做法是:
步骤A,选取将要转换的行(涂黑),“编辑/复制”。
步骤B,选取将要存放的列,单元格的数目必须与行的单元格数目相等。
(图07)
步骤C,“编辑/选择性粘贴/转置/确定”。
(图08)
结果成为:
(图09)
如果要将列转换成行,只须将步骤A、B中的“行”与“列”互换即可。
5 相同字符的快速输入。在把条目式同音字表转换成字目行(一个字目占一行)的时
候,要把同一个声母(或韵母或声调)输入到第二个以下的许多字目上,有3种快速办法可供选择。
A 拖动法。点击声母(或韵母或声调),左键按住,拖到需要这个声母(或韵母或声调)
的最后一个单元格,放开即成。
B 填充法。点击声母(或韵母或声调),按住Shift键点击最后一个单元格,将所有要填写的单元格涂黑,“编辑/填充/向下填充”。
C 公式法。此法得在另外的空列操作,如果原来声韵调分在3格单元格,每次只能做其中一项。零声母也要有符号,否则会承袭前面的声母。下图字目在D列,声韵调分别在A、B、C3列,预备将填充的声韵调放在E、F、G3列。先在英文输入状态下,在E2中写出公式
=IF(A2=“”,E1,A2) 〔如果A2是空格(用空引号表示),那么此处填E1的内容,否则仍然保持A2的内容。列标的字母不分大小写,一律有效。〕
然后点击E2,出现黑方框,将鼠标指向黑方框的右下角,自然出现黑十字。按住黑十字拖到最后一个单元格,就会出现预想的结果。
就这个例子来说,做韵母的公式是:=IF(B2=“”,F1,B2),做声调的公式是:=IF(C2=“”,G1,C2)。3项做完的结果如下面图10的右图。
(图10)
这时的结果是依赖源信息而存在的,如果把A、B、C三列删除,这里就成了乱码,因此要用特殊粘贴的办法把它们固定下来。办法:“编辑/复制/选择性粘贴/数值”,确定。然后才能把A、B、C三列删除,同时也把第一行删掉。
国际音标的英文字母代码 方括号里面是国际音标,外面是替代码。
与汉语拼音字母相同的:і e a o u b[p] p[ph] m f d[t] t[th] n l z[ts] c[tsh] s r[] g[] k[kh] ng[]
【元音】
舌尖前不圆唇元音:[]ī
舌尖后不圆唇元音:[]ǐ
舌尖前圆唇元音:[]ǖ
舌尖后圆唇元音:[]ǚ
舌面前高圆唇元音:[y]
舌面前半高圆唇元音:[]2y
舌面前半低圆唇元音:[ƿ]oe
舌面前半低不圆唇元音:[]ε(希腊)
舌面前次半低不圆唇元音:[]ae
舌面中次半低不圆唇元音:[]aa
央元音:[]ə(希腊)
舌面后低不圆唇元音:[]α(希腊)
舌面后半低不圆唇元音:[]Λ(希腊)
舌面后半低圆唇元音:[]oo
舌面后半高圆唇元音:[]7e
舌面后高不圆唇元音:[]uu
零声母:[Ʒ]Ø (拉丁扩展)
【辅音】
双唇不送气浊塞音:[b]bb
双唇清擦音:[]φ(希腊)
双唇浊擦音:[]β(希腊)
唇耻不送气浊塞擦音:[] mv
齿间清擦音:[]θ(希腊)
齿间浊擦音:[]ð(拉丁扩展)
舌尖前不送气浊塞擦音:[dz]
舌尖前清边擦音:[]lc
舌尖前浊擦音:[z]zz
舌尖后不送气浊塞擦音:[d]dr
舌叶不送气清塞擦音:[t]dss
舌叶送气清塞擦音:[th]tss
舌叶不送气浊塞擦音:[d]d3z
舌叶清擦音:[]ss
舌叶浊擦音:[]3z
舌面前不送气浊塞擦音:[d]dj
舌面前浊鼻音:[Ƥ]nj
舌面前浊擦音:[]jj
舌面后不送气浊塞音:[]gg
舌面后浊鼻音:[]ng
舌面后浊擦音:[]γ(希腊)
喉不送气清塞音:[ ]?
喉清擦音:[h]xh
喉浊擦音:[]hhh
▲αβγεθφΛ(希腊)——可以编码。“插入”到Word文件,复制到剪切板,右击输入法图标,选“手工造词”,粘贴到“词语”栏,在“外码”栏输入代码,“添加、关闭”。
▲Ø ð(拉丁)——不可编码,“插入”到Word文件再拷贝到工作表。
4.从对照表到文本
⑴单项对照(以声母为例)。在《某方音与古音对照表》的副本上,以方言声母为“主要关键字”
(自定义序列)排序,再以方言声母为选取范围,在一个声母以内,以古声纽为“主要关键字”排序,逐一进行。结果就是某方言与中古声母对照表,显示出该方言声母的历史来由。其余各项,依此类推。
⑵单字集中。在《某方音与古音对照表》的副本上,将序号和其他不必要的列删除,留下方言
声母、古声纽和字目,再把方言声母调到左面开头,把字目放在最右面,设法将字目连起来横排。方法是:
①先横排,再合并。如果方言的一个声母主要来自某个古声纽,那么这个声纽管的单字一定很多,要把它们集中起来,通过“行列转换”分若干次进行。每次从第二字开始选中20来个单字,涂黑,【复制】,选中刚才留下的第一字后面的空格,再点【编辑/选择性粘贴/转置/确定】,竖行就变成了横行。顺手把已变横行的哪些单字所在的行删除。照这样一直作完。这时的横行单字仍然分居于各个单元格,在该行后面的空格中引用一个合并单元格公式,就可以把他们集中到一个单元格里。公式在英文输入法里填写。假设要合并的字在第1行,第一个字在F列,公式为:
=f1&g1&h1&i1&j1&k1&…
就是各个字所在的单元格,中间加上&连接起来,一直连到最后一个字,最后回车即可。列标的字母不分大小写,一律有效。
②一次性集中。合并单元格公式不仅可以集中同一横行的单元格,也可以集中不同行的单元格。这样就可以不经过竖行转横行,直接由竖行各单元格集中到同一个单元格。要注意的是列标和行标即单字的位置不能弄错。
(图11)
合并单元格之后,相同的声母都只留下一个,其余统统删除。
合并单元格的工作也可以转到Word中做。
3.⑶文本转换
在文件打开状态下,点【文件/ 另存为】,将"文件类型"换成"文本文件",关闭之后,用Word打开。也可以将表格内容(不是整个表格)复制到Word文档,再将表格转换为文本格式。Word的“表格”菜单中有【转换/表格转换成文字】。
(图12)
转换之后删除空格和多余部分,成为文本格式:
(图13)
造字法
汉语方音字汇
字汇说明
字汇3千字(用于处理)
字汇分页表(用于对照)
汉字库-GBK汉字通检、插入符号字库(含说明、目录)
Windows的造字
科座造字法
电脑所缺的表册用字
手册校订
手册原组(备查)
手册单字(备查、备补充)
手册双音词
古今字音对照手册
方言调查字表
方言调查4千字(用于调查)
方言调查字表(用于处理)
关系字(同形或可能同形)
无音韵地位的字
自定义序列
方言的Excel处理
附录
比较音韵举例
关于语言地图