为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

信息检索提高查准率的验证、反驳

2011-12-06 3页 doc 28KB 26阅读

用户头像

is_671380

暂无简介

举报
信息检索提高查准率的验证、反驳 计算机信息检索实验报告 ——信息检索提高查准率的验证、反驳 班级: 姓名: 随着信息技术的发展与网络时代的到来,信息检索对于大家的生活所带来的作用越来越大,与此同时,正是因为网络的发展壮大,使得我们所能检索的信息量越来越大,而真正能为我们所用的信息也不过是搜索结果中的一叶扁舟, 那么提高查准率也就意味着提高信息利用率的同时提高了我们对于网络的利用率。   1 . 查准率的概念、提高意义与方法 1.1 查准率的概念 查准率指的是是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。查全率...
信息检索提高查准率的验证、反驳
计算机信息检索实验 ——信息检索提高查准率的验证、反驳 班级: 姓名: 随着信息技术的发展与网络时代的到来,信息检索对于大家的生活所带来的作用越来越大,与此同时,正是因为网络的发展壮大,使得我们所能检索的信息量越来越大,而真正能为我们所用的信息也不过是搜索结果中的一叶扁舟, 那么提高查准率也就意味着提高信息利用率的同时提高了我们对于网络的利用率。   1 . 查准率的概念、提高意义与方法 1.1 查准率的概念 查准率指的是是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统检出文献准确度的尺度。查全率 = 检出的相关文献篇数/检出的全部文献篇数× 100%。 1.2提高查准率的意义 查准率标志某一检索系统运行过程中拒绝无关文献、选出有关文献的能力,同时也是用户从检出文献中进一步筛选出相关文献所需时间的一种间接测度。为达到相同查全率,高的查准率意味着用户鉴别检索结果时只需用较少时间,不过这种测度主要适用于评价情报工作人员代替用户检索的情况。 1.3 课本上给我们的提高查准率的方法 ①选择最常用的(合适的)搜索引擎②注意关键词的使用③利用“网页快照”④重视“相关搜索”⑤使用“双引号”进行精确查找⑥特殊搜索命令⑦限制查询范围⑧使用短语⑨使用词组⑩使用自然语言 2。查准方式的验证 2.1选择合适的搜索引擎 我觉得这个方法是相当有意义的,主要体现在以下两点 1.google作为搜索引擎不仅支持百度所具有的“关键词”的检索方式,还可以进行分类目录式搜索。也就是我们能看到的高级搜索的功能。 如果我们对于信息的分类比较熟悉,我们就可以利用分类目录式搜索进行搜索。 2.任何一个搜索引擎都对应着一个公司一个集团,当搜索引擎涉及到企业利益的时候,搜索引擎会通过一些手段对一些信息进行屏蔽,这样对于我们想要搜索到的信息准确性影响是相当大,也就降低了我们对信息搜索的查准率。最明显的就是,我们对“百度竞价排名”在百度和谷歌中分别进行搜索,显然我们所获得的搜索结果第一页所显示的内容不尽相同,如果我们想要的信息是有关于其违规方面的内容的,显然我们应该选择的搜索引擎不会是百度,但是也不能一概而论说百度不好。这是我们对于实用性的实验,我们再来看搜索数量,在百度和谷歌分别搜索“百度竞价排名黑幕”,在百度中找到相关结果约553,000个,在 google 中找到约 249,000 条结果,显然这对我们查准率是有影响的。当然,这实验并不是为了证明谷歌是比百度更好的搜索引擎,只能说明选择合适的搜索引擎对我们提高查准率是一种有效的办法。 2.2注意关键词的使用 其实这一点基本上是不需要再通过实验来进行验证的,因为在我们日常生活中是最常用的一种提高查准率的方法。现在越来越多的网络用户用两个字以上的关键词组合进行检索,使用关键词组合取代单一的关键字可以提高查准率。比如,做一个有趣的搜索,我想在百度中找到自己,使用关键字我的名字“邹家珉”,一共找到32个搜索结果,其中只有25条信息是我想要找到的;而我输入“邹家珉 女”一共找到16个搜索结果,其中有15条是我想要找的信息;那么再输入“邹家珉 女 上政”就只剩下8条搜索结果,所有的结果都是与我有关的。显然,关键词组合可以提高我们搜索的查准率。 2.3使用“双引号”进行精确查找 查找内容是一个词组或者汉字,用双引号括起来,检索系统会把双引号括起来的检索词语作为一个词组来检索,从而使得到的结果更少、更精确。本方法在验证阶段出现问题,将在反驳中进行,详见3查准方式的反驳 2.4限制查询范围 范围限制的能力越强,就越能准确地找到需要的信息。在搜索中我们可以通过分类限制、地域限制、时间、网站类型限制等来提高我们的信息查准率。如,去年我有幸成为10级军训的导生,我看了我们系的军训晚会十分精彩,正上着行政法的课我想把它找出来和我们同学一起分享,我可以通过分类限制,选择我要搜索的为图片,抑或是正在上信息检索课,可以直接限制分类为视频,显然这可以提高查准率 3。查准方式的反驳 -使用“双引号”进行精确查找 课本第107页指出“ 如果查找的内容是一个词组或者汉字,最好的方法就是将它们用双引号括起来,这样得到的结果更少、更精确。因为,检索系统会把双引号括起来的检索词语作为一个词组来检索。”看到这段话,我首先认为其言之有理,于是对其进行了验证,课本上给了search engine的举例,我认为书本所说的是正确的,于是并没有对其进行实验,于是我进入百度,我想看这一方法是否适用于汉语,于是首先在搜索了一个词组 幸福额度,找到相关结果约8,110,000个 ,然后对其加上双引号又进行了搜索,结果仍然是找到相关结果约8,110,000个;于是我有搜索了一个汉字 矗,显然加不加双引号的结果都是 找到相关结果约46,800,000个。于是我开始质疑书本上的内容,先搜索search engine找到相关结果约3,480,000个 再搜索"search engine"。其结果让我大跌眼镜,竟然找到相关结果约5,400,000个,这显然与书本上说的加双引号得到的结果更少、更好相悖。于是我又进入谷歌进行搜索。因为数据比较复杂,我绘制以下表格反映结果 加双引号 不加双引号 Search engine 找到约 1,350,000,000 条结果 < 找到约 1,430,000,000 条结果 找到相关结果约5,400,000个 > 找到相关结果约3,480,000个 幸福额度 找到约 4,020,000 条结果 < 找到约 64,100,000 条结果 找到相关结果约8,110,000个 = 找到相关结果约8,110,000个 矗 找到约 7,010,000 条结果 > 找到约 7,000,000 条结果 找到相关结果约46,800,000个 = 找到相关结果约46,800,000个 与你同行 找到约 5,880,000 条结果 < 找到约 15,900,000 条结果 找到相关结果约4,120,000个 = 找到相关结果约4,120,000个 (注:灰色字体是百度搜索结果,黑色是谷歌) 通过这表格不难发现,在百度中这一个搜索技巧是完全不适用的,在谷歌中也不是完全适用的,但是我们不能一棒子打死,否认这种方法,不能提高查准率,只是在某些方面它并不适用。 查准率的提高对于我们信息利用率的提高有着非常重要的意义,因为我们对于提高查准率的方法需要进行一定的了解,我们不能盲信书本上给我们的方法,而本次实验更是让我认识到提高查准率无论在验证还是在反驳上都不是简简单单的通过一次两次的搜索来完成的,实验过程中我运用了多种搜索引擎来验证这些方法的同时也加深了自己对于查准率的认识,我通过表格等形式展现我实验结果使得我所得到的结果清晰可见,但是我仍然不自信这些可以作为一份合格的实验报告展现在大家面前,因为任何一个实验都需要非常庞大的数据分析的,我所能做的只是九牛一毛,希望在日后的工作学习中,有一批专业的人士能通过实验,为我们验证,反驳,发现更多的提高查准率的方法。
/
本文档为【信息检索提高查准率的验证、反驳】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
热门搜索

历史搜索

    清空历史搜索