为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

一种新的情感词汇语义倾向计算方法

2011-05-23 9页 pdf 573KB 85阅读

用户头像

is_971375

暂无简介

举报
一种新的情感词汇语义倾向计算方法 计算机研究与发展 ISSN1000—12391CN11—17771TP JournalofComputerResearchandDevelopment 46(10):1713—1720,2009 一种新的情感词汇语义倾向计算方法 杜伟夫1’2 谭松波2 云晓春2 程学旗2 1(哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001) z(中国科学院计算技术研究所北京 100190) (duweifu@software.ict.ac.cn) ANewMethodtoComputemanticOrientation ...
一种新的情感词汇语义倾向计算方法
计算机研究与发展 ISSN1000—12391CN11—17771TP JournalofComputerResearchandDevelopment 46(10):1713—1720,2009 一种新的情感词汇语义倾向计算方法 杜伟夫1’2 谭松波2 云晓春2 程学旗2 1(哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001) z(中国科学院计算技术研究所北京 100190) (duweifu@software.ict.ac.cn) ANewMethodtoComputemanticOrientation DuWeiful”,TanSongb02,YunXiaochunz,andChengXueqi2 1(SchoolofComputerScience,HarbinInstituteofTechnology。Harbin150001) 2(InstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100190) AbstractAtpresent,peoplehaveever-increasingpreferencefortheInternetforexpressingtheir personalexperiencesandopinionsonalmostanythingatreviewsites,forums,discussiongroups, blogs,etc.Thoseuser-generatedcontentcontainsveryvaluableemotionalinformation.Howtomine thoseemotionalinformationautomaticallyandefficientlywillhencebeaverychallengingquestion,as wellasbepromisinginapplicationsanddevelopmentofenterprisebusinessintelligenceandpublic opinionsurveyandSOon.Text-leveledsentimentanalysistechnologyisconsideredasfinextensionand enhancementoftraditionaltopicdetectingandtracking(TDT)technologybyaddingsomenew approachesandideas,whichisbasedonwordsemanticorientationcomputing.Inthispaper,anovel scalablewordsemanticorientationcomputingframeworkisproposed,inwhichthewordsemantic orientationcomputingistransformedintothefunctionoptimization.Asaninstanceoftheproposed framework,theauthorsbuildanundirectedgraphintheuseofwordsimilaritycomputingtechnology first,andthenpartitiontheword—to-wordgraphbytheideaof‘minimum-cut’,therebyfunction optimizationisadoptedinthiswordsemanticorientationcomputingframeworkandresolvedbyusing simulatedannealingalgorithm;Theexperimentalresultsprovethattheproposedframeworkis reasonableandthealgorithmperformsbetterthanthoseexistingcounterparts. Keywordscomputerapplication;Chineseinformationprocessing;sentimentclassification;semantic orientation;simulatedannealingalgorithm 摘要 当前,人们越来越倾向于通过互联网(论坛、讨论组、博客)达自己对事物的观点、意见.如何利 用计算机自动、有效地挖掘这些信息是一个具有挑战性的问,并且在企业智能分析、政府舆情分析等 领域具有广阔的应用空间和发展前景.文本倾向分析就是以挖掘、分析文本中所包含的情感信息为目的 的一种技术,它是传统的话题发现与跟踪研究的拓展和深化,并为其提供了新的思路和方法.文本倾向 分析的基础是词语语义倾向计算.提出一个可扩展的词汇语义倾向计算框架,将词语语义倾向计算问题 归结为优化问题.在算法实现上,首先利用多种词语相似度计算方法构建词语无向图;然后利用以“最小 切分”为目标的目标函数对该图进行划分,并利用模拟退火算法进行求解.实验证明了该框架的合理性 以及求解方法的有效性. 收稿日期:2008—04-16;修回日期:2009—0818 基金项目:国家“九七三”重点基础研究发展基金项目(2004CB318109);国家自然科学基金项目(60803085) 万方数据 计算机研究与发展2009,46(10) 关键词计算机应用;中文信息处理;态度分类;语义倾向;模拟退火算法 中圈法分类号TP391 随着互联网的快速发展以及Web2.0时代的 到来,网络逐渐从单纯的静态信息载体变成了人们 发表言论、展现个性的平台.面对如此海量的富含情 感信息的文本,人们迫切地需要找到一种快速对大 规模文本进行态度分析的方法.文本倾向性分析研 究D-z]就是在这样的背景下开展起来的.通常而言,词 语语义倾向计算凹]是段落或篇章级语气分析的基础. 计算词汇的语义倾向目的就是要对每个未标注 的词语赋予一个一1至+1之间的一个实数.其中, 正负号用来表明语气的褒贬;实数的绝对值表明了 褒贬的强烈程度.为简单起见,通常将词语的倾向性 标为一1或+1. 该研究始于1997年[4],通常利用词语相似度以 及一些被人工标注语气的基准词来确定其余未标注 词语的语义倾向. 在现有方法中,一部分方法【5创只利用未标注词 语与基准词之间的局部信息,而忽略了未标注词语 之间的全局信息,致使算法性能仍存在提升空间. 针对该问题,~些学者尝试利用基于图的方法 进行词语语义倾向计算L7刮.Kamps等人利用 WordNet提供的词语相似度进行词语语义倾向计 算L!”,但该方法只针对形容词,并只考虑了词语间的 同义关系. 为了获得更高的词汇语义倾向计算精度,并减 少基准词数量对实验结果的影响,本文提出一个新 的求解词语语义倾向问题的通用框架:首先,利用词 语相似度构建词语无向图,将词语语义倾向计算问 题转化为图划分问题;然后设计对该图进行有效划 分的目标函数,并进行求解. 根据这个框架,本文分别实验了由基于词典的 词语相似度计算方法和基于词语共现率的相似度计 算方法构建的词语无向网络.然后,以“最小切分”为 目标函数,并利用模拟退火算法进行求解.实验结果 表明,该方法具有较高的准确率;并且对于基准词的 数量变化相对不敏感. 1词汇语义倾向计算 1.1 问题定义及求解框架 如果这样设想,用一个无向图来表示字典中所 有词语的关系.构建无向图G一{V,E),其中,V为 图中的节点集合,代表字典中的每个单词;E为图中 的连边集合,代表词语两两之间的相似度. 本文基于这样的假设:具有较大的相似度的两 个词语更有可能具有相同的语义倾向.这样,词语的 语义倾向计算问题可以归结为对图G进行划分,使 得符号相同的节点子图相似度之和最大;同时,使符 号相异的节点子图相似度之和最小.这样,就确定了 图中每个词语的语义倾向. 基于这样的假设,我们将问题形式化描述如下; 定义1.彤为包含所有语义倾向待定的词语的 集合,所包含词语的个数为N=1wI. f1,ifthereisanedgejoiningverticesi,_『, Wi一{ 。 。 。 10,otherwise. (1) 定义2.Cl和c2为Ⅳ的划分,即ClcW,c2c w,C。UCz=Ⅳ,ClnC2=a. 同时,为了便于说明,定义两个指示函数: 西一f1’讧挺Cl’ (2) 12,ifi∈C2. 艿c西,∞,={。19。。if。ho,e,=wiasie,. c3, 本文以“最小切分”为目标对图进行划分,目标 函数需满足以下几个条件; 1)奖励子类内部的连边; 2)惩罚子类内部的非连边; 3)惩罚子类间的连边; 4)奖励子类间的非连边,即 H({盯))一一∑口i型型+ 1≠’ intn:“h出 ∑6。!!二里!!壁鱼!互!+ ‘≠o inI而一二m一点Hb ∑Cii坚!!!二璺堕:垒∑一 ‘≠』E订fmY“f稚‘ ∑d“!!二里!!!!二鱼鱼:垒当(4) ‘≠J dmⅡf二m一☆以‘ 其中,口#,b。,白,d“代表这4个条件的权重.对于 本问题,令口d=%,b#一九. 同时,可以将目标函数所满足的条件归为两类t 条件1和条件2用于增加子类的内聚性;条件3和 条件4用于减少子类之间的耦合性. 这样,我们得到了一个可扩展性较好的词语语 义倾向计算框架; 万方数据 杜伟夫等:一种新的情感词汇语义倾向计算方法 1)利用词语间关系构建词语无向网络图(本文 分别使用基于词典和基于语料两种方法); 2)将词语语义倾向计算问题转化为图划分问 题,并进一步转化为函数优化问题(本文以“最小切 分”思想设计目标函数); 3)构建求解算法对目标函数进行求解(本文使 用模拟退火算法进行求解). 在下面小节中,将分别介绍该框架的几个组成 部分. 1.2词汇相似度计算 词汇相似度计算是自然语言处理、信息检索和 信息抽取等领域的一项重要且基础的工作[10。,目的 是度量词语之间的相似程度.通常,相似度值被定义 为o~l的一个实数,绝对值越大相似度越高. 之前主要有两种思路,一种是利用统计方法,通 过分析大规模语料中的词语分布规律,得出词语的 相似度;另一种是基于词典的方法,比如英文词典 WordNet和中文词典知网(英文名称为HowNet)[¨]. 本文分别采用了基于语料统计的相似度计算方法和 HowNet提供的词语相似度计算方法作为构建词语 无向网络图的基础. 1.2.1基于共现率的词语相似度 互联网作为一个巨大的语料库,其价值已被越 来越多的人认识.本文将传统的基于词语共现率计 算相似度的方法进行适当变化,使其可以应用于互 联网语料. 在下面各公式中,H(P)代表在搜索引擎中输 入查询P所得到的返回页面数.PnQ代表词语P 与词语Q的联合查询(即“P和Q”).并且,由于网 络数据中存在噪声,在某些网页中共现的两个词也 许只是出于偶然,为减少这样的影响,我们定义阈值 一,如果联合查询PnQ所返回的页面数H(PNQ) 小于该阈值,则将词语P,Q之间的相似度设为0. 各公式定义如下: PCJaccard(P,Q)一 f0,ifH(PNQ)≤C,1丽矸黑壮‰,otherwiH H PN se.【 (P)+(Q)一H(Q)⋯ ⋯ (5) PCOverlaP(P,Q)一 f0,ifH(PNQ)≤c,1J淼‰,otherwimin P H se. ‘6’【 (H(),(Q))⋯⋯ ①在本文实验中,将f设为5. PC,Dice(P,Q)一 r0,ifH(POQ)≤f,1鼎编'otherwit se. ¨’H(P)+H(Q)⋯⋯ PCPMI(P,Q)= f0,ifH(PnQ)≤C, fH(P0Q)1.{.I——广1.,. (8) 11092I雨万厂_丽yl’0协盯州跎·【【可可J 在这里,N代表搜索引擎所有索引的网页数 量.我们使用google提供的数字1010作为N的估计 值.然后,我们利用上述各种方法得到的两两词语之 间的相似度,构造词语无向网络图. 1.2.2基于HowNet的词语相似度 《知网》是一个以汉语和英语词语所代表的概念 为描述对象,以揭示概念与概念之间以及概念所具 有的属性之间的关系为基本内容的常识知识库[11】. 本文使用了HowNet提供的语义相似度的计算功 能.语义相似度的计算功能是根据文献[12]中的原 理编写的词汇语义相似度计算程序,实现了词语之 间语义相似度的计算. 1.3问题求解 由于该问题是一个NP完全问题Ll引,本文引入 模拟退火的思想。将解决问题的过程转化为在目标 函数的解空间中搜索最优解的过程. 模拟退火算法是局部搜索算法的扩展,它不同 于局部搜索之处是以一定的概率选择领域中的最优 值状态,理论上已经证明它是一个全局最优算法并 且以概率1接近最优值. 基于模拟退火的词语语义倾向判定算法 (SoSA算法)首先将网络随机初始化,并设定一个 高的初始“温度”T(1).模拟退火算法能否找到全局 最优解,取决于初始温度丁(1)是否足够高以及温度 下降得是否足够慢,而这些正好与程序收敛时间相 矛盾.为了平衡解的质量与收敛速度,我们通过后面 的实验(参见图2和图3),将算法的这些调整 为比较合适的值. 然后随机地选择一个节点i,假定其现在的状 态是叫;一+1,计算在这种构型下的系统总能量 Ed,接着,再计算如果改变到候选状态,即铆;一一1 时,对应的系统能量E6,如果候选状态的能量E< E,则接受这个状态改变;如果能量E6反而更高,则 万方数据 计算机研究与发展2009,46(10) 以概率exp{一A既/T(k)}接受这个状态的改变.其 中,△既=Eb一.巴. SoSA算法持续多次随机轮询(选择并测试)节 点,并根据以上方式进行状态改变.然后,逐渐将温 度下降,重复下一轮操作.接受能量增加的候选状态 的概率也逐步下降.算法继续进行,直到每个节点都 被访问多次后温度进一步下降,查询过程也重复进 行.当温度非常低时,接受能量增加的状态转移的概 率非常小,此时系统的行为类似贪心算法.算法伪代 码如下所示: 算法1.SOSA算法. ①begininitializeT(是),志。。,s(1),础“i, _『一1,⋯,N ② 忌一O ③ do愚一忌+1 ④ do随机地选择节点i;假设它的状态为 5i ⑤ 根据式(4)计算系统当前能量E4 ⑥ E一一E ⑦ ifE Rand[O,1) ⑩thensi=一si ⑩ until所有节点轮询多次 ⑥ until七一是。。或停止准则满足 ⑩ returnE,sf,i一1,⋯,N ⑩end 2实验及分析 2.1生成测试集 本文实验使用了情感博客、电影评论和笔记本 电脑3个主题的中文评论数据,所有数据都是我们 从互联网的相关中文评论网站采集获得的.由于同 一主题的评论可能出现在不同的评论网站,为防止 数据集中出现重复的样本,对于特定的URL地址 我们指定了特定的采集者.语料采集后,经过抽取, 转换成统一的文本格式,并经人工标注极性(正面评 论或负面评论),最终得到实验使用的数据集.数据 集中的样本情况如表1所示. 文档集中包括情感博客1003篇、电影评论988 篇和笔记本电脑评论901篇,总计2892篇. Table1 CompositionoftheDocument-LeveledTestData 表1实验用文档测试集构成情况 .词语的语义倾向判断具有不确定性,表现在两个 方面:首先,部分词语在不同的语用环境下具有不同 的语义倾向.比如,通常来说,“轻薄”是一个贬义词; 而在笔记本领域,它却是一个褒义词.其次,对于同一 个词,比如“彪悍”,不同的人的判断也是有差异的. 为减少上述因素产生的影响,本文在从文档测 试集生成词语测试集时,采用多人共同标注的方法, 并在构建通用领域测试集时尽量避免选择语义倾向 与语用领域相关的词语. 最终,本文共生成3个词语测试集,构成情况如 表2所示;测试集中的部分词语如表3所示. Table2 Comp鸺itionoftheWord-LeveledTestData 表2实验用词语测试集构成情况 Tahie3 PartoftheTestSets 表3部分测试集中的词语 2.2实验设计 2.2.1生成词语无向网络图 建立词语无向图网络之前,需要首先度量词语 之间的相似度.本文采用了5种方法度量词语之间 万方数据 杜伟夫等:一种薪的情感词汇语义倾向计算方法 的相似度. 首先,如第1.2.2节所述,我们使用了基于 HowNet的词语相似度计算方法. 由于基于HowNer的词语相似度的度量方法 的结果很大程度上依赖于领域专家的背景知识,为 减少度量词语相似度时人为的差异.本文还分别基 于式(5)~(8),度量两个词语P,Q之间的相似度. 之后,本文利用这5种词语相似度,分别构建了 词语无向网络图. 2.2.2验证目标函数的合理性 另外,我们也通过实验验证了该目标函数与准 确率之间的关系.在模拟退火算法的迭代过程中,我 们截取其中的一部分解,为了便于观察,我们将这些 解按照能量进行排序,绘制了目标函数值与语义倾 向判断准确率的关系图.该实验结果如图1所示: 、÷-一、 一兰 Fig.1Correlationbetweenenergyandaccuracy(on Testsetl). 图1能置值与准确率的关系曲线(测试集1) 当排除一些噪声之后,可以看出,目标函数与准 确率是负相关的,随着能量值的逐渐降低,结果的准 确率在逐渐下降.这说明了以词语相似度构建的词 语网络的聚团性,也从实验角度验证了本文所选取 的目标函数的合理性. 2.2.3调整算法参数 在SOSA算法中,初始温度、温度的下降速度 以及在每个温度值时程序的内层循环次数对于收敛 速度与结果准确率有较大的影响.在使用该算法时 需要调整参数,以在结果精度与收敛时间之间作出 权衡.本文分别实验了迭代次数对结果准确率和收 敛时间的影响,如图2、图3所示. 根据上述实验,本文将初始温度设为词网中所 有词语的两两相似度之和;温度下降速度设为 98%;同时,为保证算法在每个温度值时能尝试更多 ①在第2.2.5节中对该方法进行详细介绍. 100 芝80 喜∞ 40 : Z /i , 奠⋯⋯ /一y 0 2 4 6 8 10 12 10—7xTim船ofI硼盯k10p Fig.2ImpactOfinnerlooptimesturningonaccuracy (onTestaetl). 图2程序内层循环执行次数对准确率的影响(测试集1) 之 童 爱 10—7xTimesofInnerLoop Fig.3Impactofinnerlooptimesturningonruntime (onTestsetl). 图3程序内层循环执行次数对运行时间的影响(测试 集1) 的可能,将内层循环次数设为词网中单词的个数. 2.2.4基准词数量对实验结果的影响 我们用HowNetSAFmF方法和HowNetPMI 方法测试了基准词数量对于结果准确率的影响: 表4中列出了实验中所使用的基准词: Table4 40PairsofParadigmWords 表4 40组褒贬基准词 PositiveParadigmWords NegativeParadigmWords 好光环得体震动人心巅峰 福分感激魅力别具匠心大 师鼎盛出色淳朴甘之如饴 独到绚丽恰到好处优秀才 华横溢创造力积极如火如 藁著名力透纸背逼真舒般 灿烂纯真飞扬青春美好和 谐宽容自由自在欢愉成熟 诚实善良和平文明 不良弊病痴呆莫名其妙粗暴 功利主义固步自封愁惨不忍睹 悲惨诡异狠毒假胃吹毛求疵 粗鄙尖酸浑浑噩噩暴殄天物自 不量力抱佛脚薄情保守饱食终 日崩溃畸形西蛇添足委屈坏 变态失败呆板游离走火人魔 痛苦毛病煽情嚷头支离破碎 郁闷扭曲 图4中分别测试了两种方法在3个测试集上不 同的基准词数量对结果的影响. 曩\妇叠jo等1 万方数据 1718 .. 锄地胪_f饷req((r仍w,i" .)), (9) ‘喜芰二器:竺妻薹!语仞。耐的词频,珊代表雾,向判断正确的慨硼磊姜翥嚣嚣筹单词. “”娜风果中嗣所有 方法荔言竺黧2i兰MI即为文献[6]中使用的方法耋翌40对基准词时的茹叭叫甲便用的善蠹著舞委薰篓勰筹善徽竺雯?然方法茹篮鬻:Z嚣毫薹篓撬2竺z”磊菇毒麓:筝麓鬈溉蹦唔∥结鼬舅嚣蕊霉蒺蒸 在表5中,通过对比两种基于H。wNet相二摩 利用芝£麓馨孽兰倾向计算的结果,我们絮s:黑懋套猫;蒜耋筹冀慧锻竺竺考虑装:兹雯善:亲雯霸如下方法计算文档准确率: “”。^1跏伞叉米用 甘小 .舭钟抛Q 2a巡+b+c+d,(10) 嚣茹霎霎翟2翟詈箩为正的实饲的个数,6表示 蒜耋之三矍妻篓竺三坠姜票芸芸焉盖蒸鬻鬈恕罂断为磊茹鬻鬟 语气分类结果如袭6所示:。⋯。3刚玎”’缎。又档 万方数据 杜伟夫等:一种新的情感词汇语义倾向计算方法 1719 Table6 ExperimentalResultsofTextClamification 衰6文档实验结果 从该实验可以看出,随着词汇语义倾向计算准 确率的提升,文档倾向分类的准确率也随之提升,这 从一定程度上证明了本文方法的有效性和实用性. 3结 论 本文提出了一个计算词语语义倾向的通用框 架:首先利用词语间关系构建词语无向网络图;将词 语语义倾向计算问题转化为图划分问题,并进一步 转化为函数优化问题并进行求解. 根据这个框架,本文分别实验了由基于词典的 词语相似度计算方法和基于词语共现率的相似度计 算方法构建的词语无向网络.然后,以“最小切分”为 目标函数,并利用模拟退火算法进行求解. 实验表明,该框架具有很好的可扩展性和鲁棒 性:可扩展性体现在,可以利用各种计算词语相似度 的方法,并利用各种启发式算法对其进行求解;由于 模拟退火算法可以以概率1逼近最优解的特性,使 得该方法具有较好的鲁棒性。 本文各实验所使用的词语相似度,只是对词语 关系的一种很表面化的度量.同时,也刻意忽略了机 器翻译意义下的相似度与词语语义倾向计算中所要 求的相似度之间的差别.如果采用更加准确的词汇 相似度度量方法,相信会得到更好实验结果.另外, 相似程度只是词语间关系中的一种,如何发现词语 之间更为本质的关系,将是今后工作中的一个重要 问题. 参考 文献 [1]TumeyP.Thumbsuporthumbsdown?semanticorientation appliedtounsupervisedclassificationofreviews[C]IIProcof the40thAnnualMeetingof theAssociationfor ComputationalLinguistics.NewYork:ACM·2002l417— 424 [2]PangB,LeeL.Shivakumarv.Thumbsup?sentiment classificationusingmachinelearningtechniques[C]//Procof the2002ConfonEmpiricalMethodsinNaturalLanguage Processing.Stroudsburg,PA,USA:ACL。2002;79-86 [3]WiebeJM.Learningsubjectiveadjectivesfromcorpora[C] [[Procofthe17thNationalConfonArtificialIntelligence. MenloPark:AAAIPress.2000:735—740 [4]HatzivassiloglouV,McKeownKR.Predictingthesemantic orientationofadjectives[c]/Procofthe35thAnnual MeetingoftheAssociationforComputationalLinguisticsand the8thConfoftheEuropeanChapteroftheAssociationfor ComputationalLinguistics.Stroudsburg。PA.USA:ACI,· 1997:174—18】 [5]TurneyP.LittmanM.Measuringpraiseandcriticism: inferenceofsemanticorientationfromassociation[J].ACM TransonInformationSystems,2003,21(4):315—346 [6]ZhuYanlan,MinJin。ZhouYaqian,eta1.Semantic orientationcomputingbasedonHowNet[J].Journalof ChineseInformation,2006,20(1);14-20(inChinese) (朱嫣岚,闵锦.周雅倩,等.基于HowNet的词汇语义倾向 计算[J].中文信息学报,2006.20(1):14-20) [7]PangB,LeeI。.Asentimentaleducation:Sentimentanalysis usingsubjectivitysummarizationbasedonminimumcuts[c] //Procofthe42ndAnnualMeetingonAssociationfor ComputationalLinguistics.Stroudsburg·PA·USA:ACLt 2004:271—278 [8]TakamuraH,InuiT.OkumuraM.Extractingsemantic orientationsofwordsusingSpinModel[C]//Procofthe43rd AnnualMeetingoftheACL.Stroudsburg·PA·USA: ACL.2005:133-140 [9]KampsJ,MarxM。MokkenRJ,eta1.UsingWordNettO measuresemanticorientationofadjectives[C]//Procof LREC-04。4thIntConfonLanguageResourcesand Evaluation.Lisbon:LREC.2004:1115-1118 万方数据 1720 计算机研究与发展2009,46(10) D03 [11] [12] [13] BollegalaD.MatsuoY.IshizukaM.Measuresemantic similaritybetweenwordsusingWebsearchengines[c3|| Procofthel6thIntWoddWideWebConf.Banff:WWW, 2007:757-766 DongZhendong.HowNet[DB/OL].[2008一Ol一27].http:// WWW.keenage.comU LiuQan,LiSujian.Wordsimilaritycomputingbasedon HowNet[J].ComputationalLinguisticsandChinese LanguageProcessing,2002,(7):59—76 (刘群,李索建.基于《知网》的词汇语义相似度的计算[J]. 中文计算语言学,2002,(7):59—76) ChristosHP.ComputationalComplexity[M].NewYork: Addision—Wesley,1994:50-60 DuWeifa,bornin1978.PhDcandidate. Hismainresearchinterestsinclude sentimentanalysis. 杜伟夫,1978年生,博士研究生,主要研究 方向为文本倾向性分析. edu.en). TanSongbo,bornin1978.PhD.Associate professor.Hismainresearchinterests includesentimentanalysis. 谭松波,1978年生,博士,副研究员,主要 研究方向为文本倾向性分析(tansongbo@ software.ict.ac.cn). YunXiaochun,bornin 1971.Professor andPhDsupervisor.Hismainresearch interestsincludenetworkinformation security 云晓春,1971年生,教授,博士生导师,主 要研究方向为网络信息安全(yxc@hit. ChengXneqi,bornin1971.Professorand PhDsupervisor.Hisresearchinterests includenetworkinformationsecurity, large-scaleinformationretrievaland knowledgemining. 程学旗,1971年生,教授,博士生导师,主 要研究方向为网络信息安全、大规模信息提取与知识挖掘 (cxq@ict.ac.cn). ResearchBackground Atpresent,peoplehaveever-increasingpreferencefortheInternetforexpressingtheirpersonalexperiencesandopinions onalmostanything:atreviewsites,forums,discussiongroups,blogsandetc.Thoseusergeneratedcontentcontainsvery valuableemotionalinformation.HowtOminethoseemotionalinformationautomatiea!lyandefficientlywillhencebeavery challengingquestion,aswellasbepromisinginapplicationsanddevelopmentofEnterpriseBusinessIntelligenceandPublic ()pinionSurveyandetc.Text-leveledsentimentanalysistechnologyisbasedonwordsemanticorientationcomputing.Inthis paper,anovelscalablewordsemanticorientationcomputingframeworkisproposed,inwhichthewordsemanticorientation computingistransformedintothefunctionoptimization.Thisworkissupportedbythe973NationalBasicResearchProgramof ChinaunderthegrantNo.2004CB318109andtheNationalNaturalScienceFoundationProgramofChinaunderthegrantNo. 60803085. 万方数据 一种新的情感词汇语义倾向计算方法 作者: 杜伟夫, 谭松波, 云晓春, 程学旗, Du Weifu, Tan Songbo, Yun Xiaochun, Cheng Xueqi 作者单位: 杜伟夫,Du Weifu(哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001;中国科学院计算 技术研究所,北京,100190), 谭松波,云晓春,程学旗,Tan Songbo,Yun Xiaochun,Cheng Xueqi(中国科学院计算技术研究所,北京,100190) 刊名: 计算机研究与发展 英文刊名: JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT 年,卷(期): 2009,46(10) 参考文献(13条) 1.Turney P;Littman M Measuring praise and criticism:inference of semantic orientation from association[外文期刊] 2003(04) 2.Hatzivassiloglou V;McKeown K R Predicting the semantic orientation of adjectives 1997 3.Wiebe J M Learning subjective adjectives from corpora 2000 4.Pang B;Lee L;Shivakumar V Thumbs up? sentiment classification using machine learning techniques 2002 5.Tumey P Thumbs up or thumbs down? semantic orientation applied to unsupervised classification of reviews 2002 6.Christos H P Computational Complexity 1994 7.刘群;李素建 基于<知网>的词汇语义相似度的计算 2002(07) 8.Dong Zhendong HowNet 2008 9.Bollegala D;Matsuo Y;Ishizuka M Measure semantic similarity between words using Web search engines 2007 10.Kamps J;Marx M;Mokken R J Using WordNet to measure semantic orientation of adjectives 2004 11.Takamura H;Inui T;Okumura M Extracting semantic orientations of words using Spin Model 2005 12.Pang B;Lee L A sentimental education:Sentiment analysis using subjectivity summarization based on minimum cuts 2004 13.朱嫣岚;闵锦;周雅倩 基于HowNet的词汇语义倾向计算[期刊]-中文信息学报 2006(01) 本文链接:http://d.g.wanfangdata.com.cn/Periodical_jsjyjyfz200910013.aspx
/
本文档为【一种新的情感词汇语义倾向计算方法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索