为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

用统计的力“法看“京派”与“海派”小说语言风格差异

2018-02-04 9页 doc 23KB 26阅读

用户头像

is_624976

暂无简介

举报
用统计的力“法看“京派”与“海派”小说语言风格差异用统计的力“法看“京派”与“海派”小说语言风格差异 用统计的力“法看“京派”与“海派”小说语言风格差异 摘 要:本文通过统计的方法对“京派”、“海派”这两个相互依存的文学派别的艺术风格进行探寻。从数量关系上求证这两个截然不同的文学派别在小说创作中的描述对象、语言风格、审美取向的不同,并通过具体分析语料显示的特征来对数据结果进行验证。 关键词:统计 京派 海派 语言风格 上世纪70、80年代计算方法开始被引入汉语语言风格学研究,现今主要应用于两方面:一是从特色词汇分布和句子长度等对作者的考证与风格的分析,如1980年陈炳...
用统计的力“法看“京派”与“海派”小说语言风格差异
用统计的力“法看“京派”与“海派”小说语言风格差异 用统计的力“法看“京派”与“海派”小说语言风格差异 摘 要:本文通过统计的方法对“京派”、“海派”这两个相互依存的文学派别的艺术风格进行探寻。从数量关系上求证这两个截然不同的文学派别在小说创作中的描述对象、语言风格、审美取向的不同,并通过具体语料显示的特征来对数据结果进行验证。 关键词:统计 京派 海派 语言风格 上世纪70、80年代计算方法开始被引入汉语语言风格学研究,现今主要应用于两方面:一是从特色词汇分布和句子长度等对作者的考证与风格的分析,如1980年陈炳藻在首届国际《红楼梦》研讨会上发表关于《红楼梦》后40回作者的考证的论文,金明哲于2003年在澳门举办的第二届中国社会语言学国际学术研讨会暨中国社会语言学会成立大会上的《中文文章的作者识别》[1],王景丹《从句频分析看八位剧作家的风格异同》一文对曹禺等8位剧作家的风格所作的比较研究;二是对修辞风格的研究,如吴礼权《从统计分析看“简约”与“繁丰”的修辞特征》[2]。 “京派”与“海派”是上世纪30年代中国现代文坛两个相互依存的术语,这两个派别在左翼文学的冲击下都体现出了时代的寂寞感与对社会、人生的特殊眼光,独立的艺术追求,强烈的流派意识及对小说文体创新的自觉程度,但在文章风格上却是大相径庭。本文统计的语料选取这两个派别从早期到晚期的代表作家的代表小说,试着从用字与描绘对象的角度对两者进行艺术风格上的比较。 本文统计使用软件为华中师范大学语言学系余一骄开发的Cici:中文文本N-gram串统计与检索软件V1.0。该软件支持对多个TXT文档指定字串、指定长度字串、特定格式汉字串进行统计,其出现频次从高到低排序,为汉语词汇研究、语料查询、个性化语料库定制提供技术支持。 一、京派海派汉字使用总体情况 京派小说选取了早期代表人物凌叔华《绣枕》、《酒后》,废名《莫须有先生传》、《桥》、《竹林的故事》、《桃园》、《菱荡》以及沈从文《边城》、《萧萧》、《丈夫》、《月下小景》,萧乾《篱下》,后期代表汪曾祺《大淖记事》、《异秉》、《受戒》,共5人14篇,总240377字。海派选取早期代表张资平《苔莉》与叶灵凤《姊嫁之夜》,中期“新感觉派”穆时英《白金的女体塑像》、《公墓》、《上海的狐舞步》、《夜总会里的五个人》,施蛰存《梅雨之夕》、《鸠摩罗什》、《石秀》、《将军的头》,以及后期代表张爱玲《沉香屑第一炉香》、《沉香屑第二炉香》、《茉莉香片》、《倾城之恋》、《金锁记》,共5人15篇,总273684字。京派海派小说家共10人29篇,总514061字。 语料选取方面力求覆盖两个派别在早、中、晚三个时期的代表人物的代表作,语篇上,长、中、短篇小说混杂,京派方面,长篇小说如《桥》,中篇小说如《月下小景》,短篇小说如《绣枕》等;海派方面,长篇小说如《茉莉香片》,中篇小说如《金锁记》,短篇小说如《梅雨之夕》等。 其用字总体情况统计如下表: 如表1所示,京派总字数为240377字,比海派的273684字少33307字,字种数方面,京派为3687种,也比海派的3956种少了269种,自然京派每个字种的使用频次也会少于海派,但相差并不大,只有4次/字种。这种成正比递减的趋势是再正常不过的了。 二、高频字比较 通过把京派海派小说作品中出现频次最多的前35个字列出来,进行对比分析,从中寻找两派描写对象与语言风格上的特色。具体情况如下表: 据上表,排名前五的字是一样的,除“的”字之外,另外四个的使用频率相差无几。而“的”在海派作品中出现频率比京派高1.2%。我们知道“的”是一个结构助词,往往用在定语与中心语或状语与中心语之间,是定语和状语的标记,它可以出现在“adj.+的+NP”、“代+的+NP”、“N的V”等格式中。“的”还可以是语气助词,附在句末表陈述,比如“是的”。另外,“的”可以构成“的”字短语,表示一类人或东西,如“卖菜的”、“吃的”。一般而言,“的”的功能主要 ”的频率比京派大很多,这是相对于其他用字的频还是作为结构助词使用。海派作家用到“的 率而言。这一点体现了海派作家在描绘事物的时候,倾向于加定语或状语,而京派则多为光杆名词。这就是说海派作家多加修饰成分,语言会比较纷繁复杂,而京派少用到作为结构助词的“的”,语言显得比较明净。 将前25个高频字比较,发现两者一致性高达88%,有22个字是共用的,属于共用高频字。不同的有:京派——“说”(0.8%)、“大”(0.7%)、“也”(0.6%);海派——“她”(1.3%)、“道”(0.8%)、“地”(0.6%)。 关于人称代词,不妨列出一个序列(括号里前为位序,后为频率): 京派:他(7/1.2)——我(14/0.9)——你(18/0.7)——她(28/0.5) 海派:他(6/1.4)——她(8/1.3)——我(9/1.2)——你(14/0.9) 对比发现,最特别的是“她”,京派中“她”排在28位比海派低20位,频率也低了0.8%,这说明京派小说家相较于海派小说家不太使用“她”。这一点的原因可能有二:一是海派小说中多写灯红酒绿的都市生活,女性则是他们描绘的重要对象。虽然京派小说也有很多以女性为主角,却少用到“她”,这又是什么原因呢,因此,第二种原因可能是京派小说家语言选择上的倾向和海派小说家叙事视角不同。 一般指称前面出现的人我们多用人称代词再现,而许多京派小说则依然使用女性角色的名字来指称,如《边城》里的翠翠,《萧萧》里面的萧萧,常常再现时不用“她”而用“翠翠”、“萧萧”。这点也导致了京派小说家“她”字少用的结果。另一边,海派作家选取的叙事视角多第三人称,或者没必要提及名字的时候,说到女性时自然会用人称代词“她”。 单看京派前35个高频字,只有“大”、“小”、“好”、“翠”四个具有形容词性的词,海派压根没有。但要注意“大”、“小”、“好”不单单只能做形容词,“大”、“小”都可以做词缀,“好”还可以是程度副词,更可以是表应答或赞扬单独成句。它们之所以使用频率这么高除上述外,还因出现在地名、角色名或称呼里,如《大淖记事》里的“大淖”,《桃园》里的“王老大”,《绣枕》里的“大小姐”,《边城》里的“大老”、“翠翠”。 单看海派,前35个主要有两个独异的单字:“道”和“太”。“道”除了“道路”、“知道”义,多是“说”义。常见搭配有“说道”、“笑道”等,这个具有文言色彩的“道”出现在了追求时髦的写大都市的海派的前35个字里,而非偏保守的写梦幻乡土的京派的前35字里,看似与审美取向有悖,实则符合语言风格。语言简练的京派能删字则删,自然少有“V道”的格式,而直接用“说”即可。这点在数据中也有所体现:京派“说”使用频率为0.8%,排名16,“道”则35名开外;海派“说”使用频率0.5%,排名28,“道”则排名17,使用频率为0.8%。“太”字频次之高是与“太太”这个二字串分不开的,在后文成词单位部分有具体论述。 三、低频字使用情况对比 统计出现频次?10的字种数,计算出所占总字种数的比例,对比数据如下表: 相较数据,京派低频字字种数略多于海派,加之表一中京派本身字种数就少于海派,所以其低频字字种数占总字种比例高于海派。这说明京派小说在汉字使用上基本字较多,用字范围更广,更分散。相对而言,海派用字方面则范围较窄,用字集中,基本字少于京派。 四、共用字与独用字 考虑到字种数中两派均未超过4000,所以,分别取使用频率排名前25、50、100、200、300、400、500的字作比较,手工统计,找到共用字与独用字,试分析其异同。 在第二部分的论述中,曾对前25个字做出比较,结论是两者一致性高达88%,有22个字是共用的,属于共用高频字。不同的是京派:“说”、“大”、“也”;海派:“她”、“道”、“地”。 前50个字中,共用字有40个,一致性达到80%,京派独用字为“家”、“生”、“翠”、“头”、 ”、“把”、“都”、“先”;海派独用字为“道”、“太”、“儿”、“自”、“没”、“只”、“好”、“老”、“为 “样”、“笑”、“又”、“可”。 前100字中,共用字为79个,一致性为79%,独用字各有21个,京派独用字为“翠”、“老”、“先”、“而”、“船”、“同”、“很”、“水”、“之”、“三”、“莫”、“须”、“明”、“花”、“意”、“十”、“二”、“边”、“声”、“听”、“做”;海派独用字为“太”、“和”、“会”、“对”、“己”、“前”、“克”、“觉”、“将”、“身”、“欧”、“些”、“但”、“女”、“苔”、“石”、“气”、“像”、“呢”、“住”、“亲”。 前200字中,有152个共用字,一致性为76%,独用字各占48个。 前300字中,有220个共用字,一致性为73%,各有80个独用字。 前400字中,有312个共用字,一致性为78%,独用字各占88个。 前500字中,有378个共用字,一致性为76%,各有122个独用字。 在500字统计完毕后,京派独用字的高频前四位是“翠”、“船”、“莫”、“须”,海派独用字的高频前四位是“克”、“欧”、“苔”、“莉”,这里面和小说主人公的名字有很大关系。前500的独用字情况列表如下: 不难发现京派小说在独用的语气词上明显比海派丰富,诸如“呀”、“哩”、“呵”,海派的语气词高频独用的只有一个“啊”。这一点说明京派小说多用北方土语里的语气助词,充满了北方民间,尤其是乡村里的对话氛围。在书写语言中,“呀”、“哩”、“呵”都是“啊”的语流音变,京派小说家之所以改变句末语气词,将普通的“啊”同化、增音为“呀”、“哩”、“呵”是为了符合语用要求,符合说话人的身份和性格,口语色彩更浓,充满意趣。 从表事物的名词上看,剔除人名,语义分布上京派有“船”、“河”、“竹”、“画”、“字”、“歌”、“草”、“梦”、“桃”、“牛”、“桥”、“溪”、“鱼”、“茶”、“岸”、“弟”、“庙”、“鸡”、“庵”、“墙”、“村”、“舅”、“菜”等;海派有“兰”、“婚”、“电”、“叔”、“港”、“窗”、“妹”、“钟”、“市”、“店”、“唇”等。从这一序列的单字就可以看出二者热衷于表现的对象不同,前者是以“船”、“河”、“竹”为代表的农村田园,后者是以“电”、“钟”、“市”、“店”为代表的都市,前者代表的是乡土文化,后者代表的是商业文化。在基本的描述对象上,两者就有着本质的不同,这也直接决定了双方在审美取向的各异。 五、双音节高频成词单位对比下的风格体现 文学史上认为,所谓京派是指20年代末到30年代中期活动在以北平为中心的北方城市并保持民主、自由主义立场的作家群,创作风格:梦幻乡土、悲悯人生、诗意抒写。所谓海派是指站在现代都市文明和商业文化的立场上来打量上海,用现代人的口气讲述都市故事的文学流派。 文学是语言的艺术,语言是构成文学作品的物质材料。故分别摘取京海两派前150个双音节的高频成词单位(剔除人名): 在虚词上,两派选取的词语差不多,实词方面,尤其是名词上,呈现出两个不同的世界,两种不同的文明。京派代表乡土文明,它描绘的对象是自然,例如“船夫”、“渡船”;海派代表都市文明,站在商业文化的角度写十里洋场的灯红酒绿,如“上海”、“玻璃”;形容词上,海派用的形容词比京派更绮丽,如“愫细”,京派对形容词的选择十分简单,不过“高兴”、“欢 喜”而已;海派相对于京派在语言上更追求时尚,好用当时的新词新语,如“态度”、“结婚”;词藻上,海派追求驳杂新奇,而京派则追求纯清蕴藉。 在第二节高频字比较中,海派独用字中的“太”缘何之多,我们从成词单位角度可以有一个很好地把握。“太”单字看上去是一个表程度的副词,但从二字串的统计结果看,“太太”这个词出现了452次,排名11,也就是说单字的“太”光在“太太”这个字串中就出现两次,“太”的1164次出现就有452*2=904次是在“太太”这个词中的,这就无怪乎“太”的出现次数如此多了。可出现这么多次“太太”是与海派爱描写人物对象是相关的。“太太”一般指的是有一定社会地位的贵妇人,海派小说多写大都市里的人与事,写大都会的五光十色,写人们对城市文明憎恶却愈发依恋,须臾都离不开都市文明的心理,在十里洋场的都市里,贵妇们也是描写的对象之一。反观京派,写乡土,写民间,关注自然美、人性美、人情美,眷恋乡土,憎恶都市,他们是决然不会把这些代表城市的贵妇当成描写对象的。 当指称女性时,京派、海派作家都会用到“姑娘”、“太太”、“女人”,不同之处在于京派作家还会用到“女孩”,而海派作家则倾向用“小姐”和“妇人”。单拿两者不同的用法,我们不难看出在描写女性对象时,首先两方选择的年龄段有不同,京派是年纪偏小的“女孩”,而海派则是已婚的年纪相对较大的“妇人”;再者,身份阶级上也有明显的不同,“小姐”在古代俗语词中是有一定社会地位人家的女儿,即使使用“小姐”也不一定就是有钱人家里的女儿,也有可能是一种尊称,一种当时社会中,尤其是都市里对女性的尊称,这也是和京派的普通名词“女孩”大不一样的地方。最后,双方用词给人的联想色彩也不一样,京派的“女孩”是纯真可爱的,海派的“小姐”、“妇人”是具有一定地位的或年纪的对象,往往更有社会经验。所以,“女孩”的使用契合京派清新蕴藉的语言风格,“小姐”和“妇人”不仅是海派乐于描绘的对象而且整体气质也是符合其绮丽语言风格的。 六、结语 引入了计算分析的方法之后,我们可以用具体、实在的数据来验证关于作家风格的比较虚的体悟,用数据事实说话,有助于科学性的大大增强。正如丁金国先生所论述,从数量关系上把握语体风格特征,主张将内省体验式的无形分析与有标记的数量分析相结合,建立一个科学的语言风格学体系。 通过统计对京派海派的艺术特色进行验证,表事物的名词或名词性的语素所显示的描写对象上,两者就有根本的不同,京派代表乡土文明,写乡土,写自然美,海派代表都市文明,写都市,写商业文化;在用词的选择上,包括用什么样的形容词,什么样的语气词,修饰成分的繁杂与否,都能直接显现两者在语言风格上的或简洁或繁冗,京派在语言上追求纯清蕴藉,讲究清丽,静态描绘,海派在语言上追求驳杂绮丽,讲究新奇,动态描绘。 注释: [1]年洪东,陈小荷,王东波:《现当代文学作品的作者身份识别研究》,计算机工程与应用,2010年,第4期。 [2]曾毅平,朱晓文:《计算方法在汉语风格学研究中的应用》,福建师范大学学报(哲学社会科学版),2006年,第1期。 参考文献: [1]丁金国.语言风格分析中的定性与定量[A].修辞学论文集(第四集)[C].福州:福建人民出版社,1987. [2]李向农,王宇波.网络媒体监测语料库汉字使用的性别差异[J].华中师范大学学报(人文社会科学版),2011,(3). [3]年洪东,陈小荷,王东波.现当代文学作品的作者身份识别研究[J].计算机工程与应用,2010,(4). [4]吴福辉.京派海派小说比较研究[J].学术月刊,1987,(7). [5]曾毅平,朱晓文.计算方法在汉语风格学研究中的应用[J].福建师范大学学报(哲学社会科学版),2006,(1). [6]周晓明,王又平.现代中国文学史[M].武汉:湖北教育出版社,2004. (罗琭昕 湖北武汉 华中师范大学文学院 430079)
/
本文档为【用统计的力“法看“京派”与“海派”小说语言风格差异】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索