为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

站内搜索引擎

2018-01-14 3页 doc 13KB 17阅读

用户头像

is_321635

暂无简介

举报
站内搜索引擎站内搜索引擎 有很多网站都在网页上加个“站内搜索引擎”、“搜索引擎”、“全文检索”等等相关字样。 用户一用,结果发现,既不能多关键组合查询,也不能支持国际语法,甚至不能支持全文检索,就更 别谈不支持相关性排序等真正的搜索引擎具备的功能了。这些搜索和真正的站内搜索引擎有和区别呢, 真正的全文检索应具备 相关性排序技术 和 分词索引功能。 如果需要进行互联网的信息抓取和采集 那么还需要网络蜘蛛模块。 分词、索引、排序这是全文检索的基本和核心,缺一不可。全文检索至少需要 具备中文分词、索引、相关性排序功能。 所以简单考查一个...
站内搜索引擎
站内搜索引擎 有很多网站都在网页上加个“站内搜索引擎”、“搜索引擎”、“全文检索”等等相关字样。 用户一用,结果发现,既不能多关键组合查询,也不能支持国际语法,甚至不能支持全文检索,就更 别谈不支持相关性排序等真正的搜索引擎具备的功能了。这些搜索和真正的站内搜索引擎有和区别呢, 真正的全文检索应具备 相关性排序技术 和 分词索引功能。 如果需要进行互联网的信息抓取和采集 那么还需要网络蜘蛛模块。 分词、索引、排序这是全文检索的基本和核心,缺一不可。全文检索至少需要 具备中文分词、索引、相关性排序功能。 所以简单考查一个站内搜索引擎的真伪只需要知道:能否实现相关性排序、国际的搜索语法、动 态摘要、飘红、支持海量数据多并快速发查询、搜索耗时极短。 (当然这只是全文检索的基本内容,一个全文检索的搜索引擎的品质好坏还和相关的技术水平、各种技术 的结合、产品的管理有很大关系。 评价全文检索的标准是用户体验度,今后我们会提供相关方面的内容) 常用的站内搜索技术比较: 基于数据库的搜索 基于spider抓取的站内搜索 全文检索者站内搜索软件系统 通过Spider抓取网页,经html解析,对数据库数据进行html解析、图片缩略,分原理 数据库搜索 分词,索引实现网页式站内搜索。 词,索引,实现站内搜索。 非常低下 消耗大量硬件资检索效率 高效 高效 源 无法完成全文检索(可以用网页检索 优点:不需要做各种工作,直sql的单字索引功能最简单标题,内容 基于内容分析的排序方法。基于内接即可使用 缺点: 1.有大量的不必要的的完成索引功能实现最低容分析排序是最佳的排序方法。 标题和内容可信息影响搜索结果的排序和显示的效果。检索范围 级的全文检索),只能进行控制,搜索结果准确到位。 内容可控,用户可严重影响精确度。 2.部分页面无法抓取标题检索。 数据库效率太对搜索的内容范围和体现的结果进行精确的控到。 3.用户对搜索范围和内容以及体现低,无法开展各种附加功制 的结果无法精确控制 能。 检索语法 无 支持标准的国际搜索语法。 支持标准的国际搜索语法。 提供动态摘要,摘要清晰精确,便于用户快速动态摘要 无 摘要内容不清晰各种垃圾信息过多 寻找到需要的信息。 关键词飘红 无 有 有 不可有效控制,动态网页抓取效果不佳,可有效控制,您可以把多个字段拆分合并,可没有链接的网页无法抓取,页面出现杂乱以确定那些需要,哪些不需要。所有动态网页内容的范围 可控制 信息影响搜索结果。对于时间控制也无法和没有链接的网页均可有效收入。 栏目控制精做到精准,对于栏目的归属无法做到准准。 确。 图片缩略 无 无 有 同义词 无 无 有 相关性排序 无 有 有 其他 低效率低质量的平台无法二次研发成本高 具有持续不断的升级能力和良好的售后服务。 开展增值服务 以产品形式运作,多家客户分摊成本,成本相成本 低 价格高 对低廉。运维成本低。 程序维护无须投入,但是需要进行一定量的内维护成本 不大 维护量不大。 容维护。 经过简单即可胜任。
/
本文档为【站内搜索引擎】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索