一种新的情感词汇语义倾向计算方法下载_在线阅读_9

is_971375

暂无简介

一种新的情感词汇语义倾向计算方法计算机研究与发展 ISSN1000—12391CN11—17771TP JournalofComputerResearchandDevelopment 46(10)：1713—1720，2009 一种新的情感词汇语义倾向计算方法杜伟夫1’2 谭松波2 云晓春2 程学旗2 1(哈尔滨工业大学计算机科学与技术学院哈尔滨 150001) z(中国科学院计算技术研究所北京 100190) (duweifu@software．ict．ac．cn) ANewMethodtoComputemanticOrientation ...

计算机研究与发展 ISSN1000—12391CN11—17771TP JournalofComputerResearchandDevelopment 46(10)：1713—1720，2009 一种新的情感词汇语义倾向计算方法杜伟夫1’2 谭松波2 云晓春2 程学旗2 1(哈尔滨工业大学计算机科学与技术学院哈尔滨 150001) z(中国科学院计算技术研究所北京 100190) (duweifu@software．ict．ac．cn) ANewMethodtoComputemanticOrientation DuWeiful”，TanSongb02，YunXiaochunz，andChengXueqi2 1(SchoolofComputerScience，HarbinInstituteofTechnology。Harbin150001) 2(InstituteofComputingTechnology，ChineseAcademyofSciences，Beijing100190) AbstractAtpresent，peoplehaveever-increasingpreferencefortheInternetforexpressingtheir personalexperiencesandopinionsonalmostanythingatreviewsites，forums，discussiongroups， blogs，etc．Thoseuser-generatedcontentcontainsveryvaluableemotionalinformation．Howtomine thoseemotionalinformationautomaticallyandefficientlywillhencebeaverychallengingquestion，as wellasbepromisinginapplicationsanddevelopmentofenterprisebusinessintelligenceandpublic opinionsurveyandSOon．Text-leveledsentimentanalysistechnologyisconsideredasfinextensionand enhancementoftraditionaltopicdetectingandtracking(TDT)technologybyaddingsomenew approachesandideas，whichisbasedonwordsemanticorientationcomputing．Inthispaper，anovel scalablewordsemanticorientationcomputingframeworkisproposed，inwhichthewordsemantic orientationcomputingistransformedintothefunctionoptimization．Asaninstanceoftheproposed framework，theauthorsbuildanundirectedgraphintheuseofwordsimilaritycomputingtechnology first，andthenpartitiontheword—to-wordgraphbytheideaof‘minimum-cut’，therebyfunction optimizationisadoptedinthiswordsemanticorientationcomputingframeworkandresolvedbyusing simulatedannealingalgorithm；Theexperimentalresultsprovethattheproposedframeworkis reasonableandthealgorithmperformsbetterthanthoseexistingcounterparts． Keywordscomputerapplication；Chineseinformationprocessing；sentimentclassification；semantic orientation；simulatedannealingalgorithm 摘要当前，人们越来越倾向于通过互联网(论坛、讨论组、博客)

表

关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf 视力表打印pdf 用图表说话 pdf

达自己对事物的观点、意见．如何利用计算机自动、有效地挖掘这些信息是一个具有挑战性的问

题

快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题

，并且在企业智能分析、政府舆情分析等领域具有广阔的应用空间和发展前景．文本倾向分析就是以挖掘、分析文本中所包含的情感信息为目的的一种技术，它是传统的话题发现与跟踪研究的拓展和深化，并为其提供了新的思路和方法．文本倾向分析的基础是词语语义倾向计算．提出一个可扩展的词汇语义倾向计算框架，将词语语义倾向计算问题归结为优化问题．在算法实现上，首先利用多种词语相似度计算方法构建词语无向图；然后利用以“最小切分”为目标的目标函数对该图进行划分，并利用模拟退火算法进行求解．实验证明了该框架的合理性以及求解方法的有效性．收稿日期：2008—04-16；修回日期：2009—0818 基金项目：国家“九七三”重点基础研究发展

计划

项目进度计划表范例计划下载计划下载计划下载课程教学计划下载

基金项目(2004CB318109)；国家自然科学基金项目(60803085) 万方数据计算机研究与发展2009，46(10) 关键词计算机应用；中文信息处理；态度分类；语义倾向；模拟退火算法中圈法分类号TP391 随着互联网的快速发展以及Web2．0时代的到来，网络逐渐从单纯的静态信息载体变成了人们发表言论、展现个性的平台．面对如此海量的富含情感信息的文本，人们迫切地需要找到一种快速对大规模文本进行态度分析的方法．文本倾向性分析研究D-z]就是在这样的背景下开展起来的．通常而言，词语语义倾向计算凹]是段落或篇章级语气分析的基础．计算词汇的语义倾向目的就是要对每个未标注的词语赋予一个一1至+1之间的一个实数．其中，正负号用来表明语气的褒贬；实数的绝对值表明了褒贬的强烈程度．为简单起见，通常将词语的倾向性标为一1或+1．该研究始于1997年[4]，通常利用词语相似度以及一些被人工标注语气的基准词来确定其余未标注词语的语义倾向．在现有方法中，一部分方法【5创只利用未标注词语与基准词之间的局部信息，而忽略了未标注词语之间的全局信息，致使算法性能仍存在提升空间．针对该问题，～些学者尝试利用基于图的方法进行词语语义倾向计算L7刮．Kamps等人利用 WordNet提供的词语相似度进行词语语义倾向计算L!”，但该方法只针对形容词，并只考虑了词语间的同义关系．为了获得更高的词汇语义倾向计算精度，并减少基准词数量对实验结果的影响，本文提出一个新的求解词语语义倾向问题的通用框架：首先，利用词语相似度构建词语无向图，将词语语义倾向计算问题转化为图划分问题；然后设计对该图进行有效划分的目标函数，并进行求解．根据这个框架，本文分别实验了由基于词典的词语相似度计算方法和基于词语共现率的相似度计算方法构建的词语无向网络．然后，以“最小切分”为目标函数，并利用模拟退火算法进行求解．实验结果表明，该方法具有较高的准确率；并且对于基准词的数量变化相对不敏感． 1词汇语义倾向计算 1．1 问题定义及求解框架如果这样设想，用一个无向图来表示字典中所有词语的关系．构建无向图G一{V，E)，其中，V为图中的节点集合，代表字典中的每个单词；E为图中的连边集合，代表词语两两之间的相似度．本文基于这样的假设：具有较大的相似度的两个词语更有可能具有相同的语义倾向．这样，词语的语义倾向计算问题可以归结为对图G进行划分，使得符号相同的节点子图相似度之和最大；同时，使符号相异的节点子图相似度之和最小．这样，就确定了图中每个词语的语义倾向．基于这样的假设，我们将问题形式化描述如下；定义1．彤为包含所有语义倾向待定的词语的集合，所包含词语的个数为N=1wI． f1，ifthereisanedgejoiningverticesi，_『， Wi一{ 。。。 10，otherwise． (1) 定义2．Cl和c2为Ⅳ的划分，即ClcW，c2c w，C。UCz=Ⅳ，ClnC2=a．同时，为了便于说明，定义两个指示函数：西一f1’讧挺Cl’ (2) 12，ifi∈C2．艿c西，∞，={。19。。if。ho，e，=wiasie,． c3，本文以“最小切分”为目标对图进行划分，目标函数需满足以下几个条件； 1)奖励子类内部的连边； 2)惩罚子类内部的非连边； 3)惩罚子类间的连边； 4)奖励子类间的非连边，即 H({盯))一一∑口i型型+ 1≠’ intn：“h出 ∑6。!!二里!!壁鱼!互!+ ‘≠o inI而一二m一点Hb ∑Cii坚!!!二璺堕：垒∑一 ‘≠』E订fmY“f稚‘ ∑d“!!二里!!!!二鱼鱼：垒当(4) ‘≠J dmⅡf二m一☆以‘ 其中，口#，b。，白，d“代表这4个条件的权重．对于本问题，令口d=％，b#一九．同时，可以将目标函数所满足的条件归为两类t 条件1和条件2用于增加子类的内聚性；条件3和条件4用于减少子类之间的耦合性．这样，我们得到了一个可扩展性较好的词语语义倾向计算框架；万方数据杜伟夫等：一种新的情感词汇语义倾向计算方法 1)利用词语间关系构建词语无向网络图(本文分别使用基于词典和基于语料两种方法)； 2)将词语语义倾向计算问题转化为图划分问题，并进一步转化为函数优化问题(本文以“最小切分”思想设计目标函数)； 3)构建求解算法对目标函数进行求解(本文使用模拟退火算法进行求解)．在下面小节中，将分别介绍该框架的几个组成部分． 1．2词汇相似度计算词汇相似度计算是自然语言处理、信息检索和信息抽取等领域的一项重要且基础的工作[10。，目的是度量词语之间的相似程度．通常，相似度值被定义为o～l的一个实数，绝对值越大相似度越高．之前主要有两种思路，一种是利用统计方法，通过分析大规模语料中的词语分布规律，得出词语的相似度；另一种是基于词典的方法，比如英文词典 WordNet和中文词典知网(英文名称为HowNet)[¨]．本文分别采用了基于语料统计的相似度计算方法和 HowNet提供的词语相似度计算方法作为构建词语无向网络图的基础． 1．2．1基于共现率的词语相似度互联网作为一个巨大的语料库，其价值已被越来越多的人认识．本文将传统的基于词语共现率计算相似度的方法进行适当变化，使其可以应用于互联网语料．在下面各公式中，H(P)代表在搜索引擎中输入查询P所得到的返回页面数．PnQ代表词语P 与词语Q的联合查询(即“P和Q”)．并且，由于网络数据中存在噪声，在某些网页中共现的两个词也许只是出于偶然，为减少这样的影响，我们定义阈值一，如果联合查询PnQ所返回的页面数H(PNQ) 小于该阈值，则将词语P，Q之间的相似度设为0．各公式定义如下： PCJaccard(P，Q)一 f0，ifH(PNQ)≤C，1丽矸黑壮‰，otherwiH H PN se．【 (P)+(Q)一H(Q)⋯ ⋯ (5) PCOverlaP(P，Q)一 f0，ifH(PNQ)≤c，1J淼‰，otherwimin P H se． ‘6’【 (H()，(Q))⋯⋯ ①在本文实验中，将f设为5． PC,Dice(P，Q)一 r0，ifH(POQ)≤f，1鼎编'otherwit se． ¨’H(P)+H(Q)⋯⋯ PCPMI(P，Q)= f0，ifH(PnQ)≤C， fH(P0Q)1．{．I——广1．，． (8) 11092I雨万厂_丽yl’0协盯州跎·【【可可J 在这里，N代表搜索引擎所有索引的网页数量．我们使用google提供的数字1010作为N的估计值．然后，我们利用上述各种方法得到的两两词语之间的相似度，构造词语无向网络图． 1．2．2基于HowNet的词语相似度《知网》是一个以汉语和英语词语所代表的概念为描述对象，以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库[11】．本文使用了HowNet提供的语义相似度的计算功能．语义相似度的计算功能是根据文献[12]中的原理编写的词汇语义相似度计算程序，实现了词语之间语义相似度的计算． 1．3问题求解由于该问题是一个NP完全问题Ll引，本文引入模拟退火的思想。将解决问题的过程转化为在目标函数的解空间中搜索最优解的过程．模拟退火算法是局部搜索算法的扩展，它不同于局部搜索之处是以一定的概率选择领域中的最优值状态，理论上已经证明它是一个全局最优算法并且以概率1接近最优值．基于模拟退火的词语语义倾向判定算法 (SoSA算法)首先将网络随机初始化，并设定一个高的初始“温度”T(1)．模拟退火算法能否找到全局最优解，取决于初始温度丁(1)是否足够高以及温度下降得是否足够慢，而这些正好与程序收敛时间相矛盾．为了平衡解的质量与收敛速度，我们通过后面的实验(参见图2和图3)，将算法的这些

参数

转速和进给参数表a 氧化沟运行参数高温蒸汽处理医疗废物 pid参数自整定算法口腔医院集中消毒供应

调整为比较合适的值．然后随机地选择一个节点i，假定其现在的状态是叫；一+1，计算在这种构型下的系统总能量 Ed，接着，再计算如果改变到候选状态，即铆；一一1 时，对应的系统能量E6，如果候选状态的能量E< E，则接受这个状态改变；如果能量E6反而更高，则万方数据计算机研究与发展2009，46(10) 以概率exp{一A既／T(k)}接受这个状态的改变．其中，△既=Eb一．巴． SoSA算法持续多次随机轮询(选择并测试)节点，并根据以上方式进行状态改变．然后，逐渐将温度下降，重复下一轮操作．接受能量增加的候选状态的概率也逐步下降．算法继续进行，直到每个节点都被访问多次后温度进一步下降，查询过程也重复进行．当温度非常低时，接受能量增加的状态转移的概率非常小，此时系统的行为类似贪心算法．算法伪代码如下所示：算法1．SOSA算法． ①begininitializeT(是)，志。。，s(1)，础“i， _『一1，⋯，N ② 忌一O ③ do愚一忌+1 ④ do随机地选择节点i；假设它的状态为 5i ⑤ 根据式(4)计算系统当前能量E4 ⑥ E一一E ⑦ ifE Rand[O，1) ⑩thensi=一si ⑩ until所有节点轮询多次 ⑥ until七一是。。或停止准则满足 ⑩ returnE，sf，i一1，⋯，N ⑩end 2实验及分析 2．1生成测试集本文实验使用了情感博客、电影评论和笔记本电脑3个主题的中文评论数据，所有数据都是我们从互联网的相关中文评论网站采集获得的．由于同一主题的评论可能出现在不同的评论网站，为防止数据集中出现重复的样本，对于特定的URL地址我们指定了特定的采集者．语料采集后，经过抽取，转换成统一的文本格式，并经人工标注极性(正面评论或负面评论)，最终得到实验使用的数据集．数据集中的样本情况如表1所示．文档集中包括情感博客1003篇、电影评论988 篇和笔记本电脑评论901篇，总计2892篇． Table1 CompositionoftheDocument-LeveledTestData 表1实验用文档测试集构成情况．词语的语义倾向判断具有不确定性，表现在两个方面：首先，部分词语在不同的语用环境下具有不同的语义倾向．比如，通常来说，“轻薄”是一个贬义词；而在笔记本领域，它却是一个褒义词．其次，对于同一个词，比如“彪悍”，不同的人的判断也是有差异的．为减少上述因素产生的影响，本文在从文档测试集生成词语测试集时，采用多人共同标注的方法，并在构建通用领域测试集时尽量避免选择语义倾向与语用领域相关的词语．最终，本文共生成3个词语测试集，构成情况如表2所示；测试集中的部分词语如表3所示． Table2 Comp鸺itionoftheWord-LeveledTestData 表2实验用词语测试集构成情况 Tahie3 PartoftheTestSets 表3部分测试集中的词语 2．2实验设计 2．2．1生成词语无向网络图建立词语无向图网络之前，需要首先度量词语之间的相似度．本文采用了5种方法度量词语之间万方数据杜伟夫等：一种薪的情感词汇语义倾向计算方法的相似度．首先，如第1．2．2节所述，我们使用了基于 HowNet的词语相似度计算方法．由于基于HowNer的词语相似度的度量方法的结果很大程度上依赖于领域专家的背景知识，为减少度量词语相似度时人为的差异．本文还分别基于式(5)～(8)，度量两个词语P，Q之间的相似度．之后，本文利用这5种词语相似度，分别构建了词语无向网络图． 2．2．2验证目标函数的合理性另外，我们也通过实验验证了该目标函数与准确率之间的关系．在模拟退火算法的迭代过程中，我们截取其中的一部分解，为了便于观察，我们将这些解按照能量进行排序，绘制了目标函数值与语义倾向判断准确率的关系图．该实验结果如图1所示：、÷-一、一兰 Fig．1Correlationbetweenenergyandaccuracy(on Testsetl)．图1能置值与准确率的关系曲线(测试集1) 当排除一些噪声之后，可以看出，目标函数与准确率是负相关的，随着能量值的逐渐降低，结果的准确率在逐渐下降．这说明了以词语相似度构建的词语网络的聚团性，也从实验角度验证了本文所选取的目标函数的合理性． 2．2．3调整算法参数在SOSA算法中，初始温度、温度的下降速度以及在每个温度值时程序的内层循环次数对于收敛速度与结果准确率有较大的影响．在使用该算法时需要调整参数，以在结果精度与收敛时间之间作出权衡．本文分别实验了迭代次数对结果准确率和收敛时间的影响，如图2、图3所示．根据上述实验，本文将初始温度设为词网中所有词语的两两相似度之和；温度下降速度设为 98％；同时，为保证算法在每个温度值时能尝试更多 ①在第2．2．5节中对该方法进行详细介绍． 100 芝80 喜∞ 40 ： Z ／i ，奠⋯⋯ ／一y 0 2 4 6 8 10 12 10—7xTim船ofI硼盯k10p Fig．2ImpactOfinnerlooptimesturningonaccuracy (onTestaetl)．图2程序内层循环执行次数对准确率的影响(测试集1) 之童爱 10—7xTimesofInnerLoop Fig．3Impactofinnerlooptimesturningonruntime (onTestsetl)．图3程序内层循环执行次数对运行时间的影响(测试集1) 的可能，将内层循环次数设为词网中单词的个数． 2．2．4基准词数量对实验结果的影响我们用HowNetSAFmF方法和HowNetPMI 方法测试了基准词数量对于结果准确率的影响：表4中列出了实验中所使用的基准词： Table4 40PairsofParadigmWords 表4 40组褒贬基准词 PositiveParadigmWords NegativeParadigmWords 好光环得体震动人心巅峰福分感激魅力别具匠心大师鼎盛出色淳朴甘之如饴独到绚丽恰到好处优秀才华横溢创造力积极如火如藁著名力透纸背逼真舒般灿烂纯真飞扬青春美好和谐宽容自由自在欢愉成熟诚实善良和平文明不良弊病痴呆莫名其妙粗暴功利主义固步自封愁惨不忍睹悲惨诡异狠毒假胃吹毛求疵粗鄙尖酸浑浑噩噩暴殄天物自不量力抱佛脚薄情保守饱食终日崩溃畸形西蛇添足委屈坏变态失败呆板游离走火人魔痛苦毛病煽情嚷头支离破碎郁闷扭曲图4中分别测试了两种方法在3个测试集上不同的基准词数量对结果的影响．曩＼妇叠jo等1 万方数据 1718 ．．锄地胪_f饷req((r仍w，i" ．))， (9) ‘喜芰二器：竺妻薹!语仞。耐的词频，珊代表雾，向判断正确的慨硼磊姜翥嚣嚣筹单词． “”娜风果中嗣所有方法荔言竺黧2i兰MI即为文献[6]中使用的方法耋翌40对基准词时的茹叭叫甲便用的善蠹著舞委薰篓勰筹善徽竺雯?然方法茹篮鬻：Z嚣毫薹篓撬2竺z”磊菇毒麓：筝麓鬈溉蹦唔∥结鼬舅嚣蕊霉蒺蒸在表5中，通过对比两种基于H。wNet相二摩利用芝￡麓馨孽兰倾向计算的结果，我们絮s：黑懋套猫；蒜耋筹冀慧锻竺竺考虑装：兹雯善：亲雯霸如下方法计算文档准确率： “”。^1跏伞叉米用甘小．舭钟抛Q 2a巡+b+c+d，(10) 嚣茹霎霎翟2翟詈箩为正的实饲的个数，6表示蒜耋之三矍妻篓竺三坠姜票芸芸焉盖蒸鬻鬈恕罂断为磊茹鬻鬟语气分类结果如袭6所示：。⋯。3刚玎”’缎。又档万方数据杜伟夫等：一种新的情感词汇语义倾向计算方法 1719 Table6 ExperimentalResultsofTextClamification 衰6文档实验结果从该实验可以看出，随着词汇语义倾向计算准确率的提升，文档倾向分类的准确率也随之提升，这从一定程度上证明了本文方法的有效性和实用性． 3结论本文提出了一个计算词语语义倾向的通用框架：首先利用词语间关系构建词语无向网络图；将词语语义倾向计算问题转化为图划分问题，并进一步转化为函数优化问题并进行求解．根据这个框架，本文分别实验了由基于词典的词语相似度计算方法和基于词语共现率的相似度计算方法构建的词语无向网络．然后，以“最小切分”为目标函数，并利用模拟退火算法进行求解．实验表明，该框架具有很好的可扩展性和鲁棒性：可扩展性体现在，可以利用各种计算词语相似度的方法，并利用各种启发式算法对其进行求解；由于模拟退火算法可以以概率1逼近最优解的特性，使得该方法具有较好的鲁棒性。本文各实验所使用的词语相似度，只是对词语关系的一种很表面化的度量．同时，也刻意忽略了机器翻译意义下的相似度与词语语义倾向计算中所要求的相似度之间的差别．如果采用更加准确的词汇相似度度量方法，相信会得到更好实验结果．另外，相似程度只是词语间关系中的一种，如何发现词语之间更为本质的关系，将是今后工作中的一个重要问题．参考文献 [1]TumeyP．Thumbsuporthumbsdown?semanticorientation appliedtounsupervisedclassificationofreviews[C]IIProcof the40thAnnualMeetingof theAssociationfor ComputationalLinguistics．NewYork：ACM·2002l417— 424 [2]PangB，LeeL．Shivakumarv．Thumbsup?sentiment classificationusingmachinelearningtechniques[C]／／Procof the2002ConfonEmpiricalMethodsinNaturalLanguage Processing．Stroudsburg，PA，USA：ACL。2002；79-86 [3]WiebeJM．Learningsubjectiveadjectivesfromcorpora[C] [[Procofthe17thNationalConfonArtificialIntelligence． MenloPark：AAAIPress．2000：735—740 [4]HatzivassiloglouV，McKeownKR．Predictingthesemantic orientationofadjectives[c]／Procofthe35thAnnual MeetingoftheAssociationforComputationalLinguisticsand the8thConfoftheEuropeanChapteroftheAssociationfor ComputationalLinguistics．Stroudsburg。PA．USA：ACI，· 1997：174—18】 [5]TurneyP．LittmanM．Measuringpraiseandcriticism： inferenceofsemanticorientationfromassociation[J]．ACM TransonInformationSystems，2003，21(4)：315—346 [6]ZhuYanlan，MinJin。ZhouYaqian，eta1．Semantic orientationcomputingbasedonHowNet[J]．Journalof ChineseInformation，2006，20(1)；14-20(inChinese) (朱嫣岚，闵锦．周雅倩，等．基于HowNet的词汇语义倾向计算[J]．中文信息学报，2006．20(1)：14-20) [7]PangB，LeeI。．Asentimentaleducation：Sentimentanalysis usingsubjectivitysummarizationbasedonminimumcuts[c] ／／Procofthe42ndAnnualMeetingonAssociationfor ComputationalLinguistics．Stroudsburg·PA·USA：ACLt 2004：271—278 [8]TakamuraH，InuiT．OkumuraM．Extractingsemantic orientationsofwordsusingSpinModel[C]／／Procofthe43rd AnnualMeetingoftheACL．Stroudsburg·PA·USA： ACL．2005：133-140 [9]KampsJ，MarxM。MokkenRJ，eta1．UsingWordNettO measuresemanticorientationofadjectives[C]／／Procof LREC-04。4thIntConfonLanguageResourcesand Evaluation．Lisbon：LREC．2004：1115-1118 万方数据 1720 计算机研究与发展2009，46(10) D03 [11] [12] [13] BollegalaD．MatsuoY．IshizukaM．Measuresemantic similaritybetweenwordsusingWebsearchengines[c3|| Procofthel6thIntWoddWideWebConf．Banff：WWW， 2007：757-766 DongZhendong．HowNet[DB／OL]．[2008一Ol一27]．http：／／ WWW．keenage．comU LiuQan，LiSujian．Wordsimilaritycomputingbasedon HowNet[J]．ComputationalLinguisticsandChinese LanguageProcessing，2002，(7)：59—76 (刘群，李索建．基于《知网》的词汇语义相似度的计算[J]．中文计算语言学，2002，(7)：59—76) ChristosHP．ComputationalComplexity[M]．NewYork： Addision—Wesley，1994：50-60 DuWeifa，bornin1978．PhDcandidate． Hismainresearchinterestsinclude sentimentanalysis．杜伟夫，1978年生，博士研究生，主要研究方向为文本倾向性分析． edu．en)． TanSongbo，bornin1978．PhD．Associate professor．Hismainresearchinterests includesentimentanalysis．谭松波，1978年生，博士，副研究员，主要研究方向为文本倾向性分析(tansongbo@ software．ict．ac．cn)． YunXiaochun，bornin 1971．Professor andPhDsupervisor．Hismainresearch interestsincludenetworkinformation security 云晓春，1971年生，教授，博士生导师，主要研究方向为网络信息安全(yxc@hit． ChengXneqi，bornin1971．Professorand PhDsupervisor．Hisresearchinterests includenetworkinformationsecurity， large-scaleinformationretrievaland knowledgemining．程学旗，1971年生，教授，博士生导师，主要研究方向为网络信息安全、大规模信息提取与知识挖掘 (cxq@ict．ac．cn)． ResearchBackground Atpresent，peoplehaveever-increasingpreferencefortheInternetforexpressingtheirpersonalexperiencesandopinions onalmostanything：atreviewsites，forums，discussiongroups，blogsandetc．Thoseusergeneratedcontentcontainsvery valuableemotionalinformation．HowtOminethoseemotionalinformationautomatiea!lyandefficientlywillhencebeavery challengingquestion，aswellasbepromisinginapplicationsanddevelopmentofEnterpriseBusinessIntelligenceandPublic ()pinionSurveyandetc．Text-leveledsentimentanalysistechnologyisbasedonwordsemanticorientationcomputing．Inthis paper，anovelscalablewordsemanticorientationcomputingframeworkisproposed，inwhichthewordsemanticorientation computingistransformedintothefunctionoptimization．Thisworkissupportedbythe973NationalBasicResearchProgramof ChinaunderthegrantNo．2004CB318109andtheNationalNaturalScienceFoundationProgramofChinaunderthegrantNo． 60803085．万方数据一种新的情感词汇语义倾向计算方法作者：杜伟夫，谭松波，云晓春，程学旗， Du Weifu， Tan Songbo， Yun Xiaochun， Cheng Xueqi 作者单位：杜伟夫,Du Weifu(哈尔滨工业大学计算机科学与技术学院,哈尔滨,150001;中国科学院计算技术研究所,北京,100190)，谭松波,云晓春,程学旗,Tan Songbo,Yun Xiaochun,Cheng Xueqi(中国科学院计算技术研究所,北京,100190) 刊名：计算机研究与发展英文刊名： JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT 年，卷(期)： 2009,46(10) 参考文献(13条) 1.Turney P;Littman M Measuring praise and criticism:inference of semantic orientation from association[外文期刊] 2003(04) 2.Hatzivassiloglou V;McKeown K R Predicting the semantic orientation of adjectives 1997 3.Wiebe J M Learning subjective adjectives from corpora 2000 4.Pang B;Lee L;Shivakumar V Thumbs up? sentiment classification using machine learning techniques 2002 5.Tumey P Thumbs up or thumbs down? semantic orientation applied to unsupervised classification of reviews 2002 6.Christos H P Computational Complexity 1994 7.刘群;李素建基于<知网>的词汇语义相似度的计算 2002(07) 8.Dong Zhendong HowNet 2008 9.Bollegala D;Matsuo Y;Ishizuka M Measure semantic similarity between words using Web search engines 2007 10.Kamps J;Marx M;Mokken R J Using WordNet to measure semantic orientation of adjectives 2004 11.Takamura H;Inui T;Okumura M Extracting semantic orientations of words using Spin Model 2005 12.Pang B;Lee L A sentimental education:Sentiment analysis using subjectivity summarization based on minimum cuts 2004 13.朱嫣岚;闵锦;周雅倩基于HowNet的词汇语义倾向计算[期刊

论文

政研论文下载论文大学下载论文大学下载关于长拳的论文浙大论文封面下载

]-中文信息学报 2006(01) 本文链接：http://d.g.wanfangdata.com.cn/Periodical_jsjyjyfz200910013.aspx

本文档为【一种新的情感词汇语义倾向计算方法】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。

一种新的情感词汇语义倾向计算方法

热门搜索

历史搜索