中文数据库搜索
(一)利用中文数据库进行文献信息检索示例:
1、检索课题名称:机器学习中的若干重要问题的研究
2、课题
:
中文关键词:1 机器学习 2重要问题
英文关键词:(1)machine learning (2)key questions 3、选择检索工具:本课题检索目标为中文各类相关文献。根据本图书馆的资源情况选择如下数据库:
(1)CNKI数字图书馆:中国期刊全文数据库
(2)万方数据库(会议论文)
(3)维普咨询网
4、构建检索策略:
检索算法:机器学习*重要问题
时间范围:2005-¬2009
文献范围:期刊论文、会议论文、专著
为了保证查全率可考虑使用全文检索途径和高级检索方式。 5、简述检索策略调整的过程:
1)在 CNKI中国期刊全文数据库中(CNKI数据库镜像):
a、为保证查全率,使用“机器学习*重要问题”检索运算式,检索范围选择:所 有专辑、全文中检索,检索出记录 4597条。
、上述检索策略得到的检索结果 4597条过多,考虑缩小检索范围。改全文检b
索项为
篇名检索。
使用“机器学习*重要问题”检索运算式,检索范围选择:所有专辑,篇名中检索,
检
索出记录 0条。
C、上述检索策略得到的检索结果 0 条太少,考虑扩大检索范围。改检索算式为“机
器学习”检索范围为篇名检索,检索出记录 242 条,数量适中。 2)万方数据库(会议论文):
a、由于“万方数据库(会议论文)”收录的文献比较单一,为保证查全率,使用“机器
学习*重要问题”检索运算式,检索范围选择:全字段中检索,不限定年代,检索出记
录1 条。
b、上述检索策略得到的检索结果 1 条。考虑检索算式复杂,可简单一些。由于本课
题的主体
是“机器学习”,改用“机器学习”单一算式检索,检索出记录224条。 C、检索结果过多,使用“机器学习”在论文标题中检索,检索出记录49条
3)维普资讯网(《中文科技期刊数据库》(全文版)):
A、使用检索式(K=机器学习*K=重要问题 ),在“题名或关键词”中检索,不限定
年
代,检索出记录0 条。
B、数据库为期刊全文数据库,不应该得到这么少的相关文献。调整检索策略,改为课
题主体检索。
用“机器学习”单一算式检索,检索出记录1366条。
(1)CNKI 中国期刊全文数据库有关专辑检索结果(选 1 条): 基于标引经验和机器学习相结合的多层自动分类
【英文篇名】A study of bibliotherapy in the treatment of depression
【作者】何琳; 侯汉清;
【英文作者】He Lin;Hou Han Qing; China; 【作者单位】南京农业大学信息管理系;
【刊名】中国索引, Journal of the China Society of Indexers, 2006年 01期
【关键词】 机器学习;
【英文关键词】 machine learning
【摘要】由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,
导致基于机器学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验
的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词
串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相
结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的
关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测
试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类
,并对该方法存在的不足进行了分析。
(2)万方数据库检索结果(选 1 条) :
基于信息理论的机器学习准则:以分类问题为例
中国人工智能学会第12届全国学术年会
2007年11月20
(3)维普资讯网(选 1 条) :
机器学习的查询扩展在博客检索中的应用
王秉卿 张奇 吴立德 黄萱菁
《 中文信息学报 》
2008年 22卷 6期
复旦大学计算机科学与技术学院,上海200083
摘 要: 该文介绍一种新的查询扩展方法,该方法结合了查询扩展技术和机器学习理
论。通过机器学习的方法挑选出查询扩展词,以此提高检索结果的性能。对于输入的
查询项,首先通过伪反馈技术生成候选扩展词集合,然后使用支持向量机对输入的候
选词评分,挑选得分较高的候选词和原始查询项组成一个新的查询项。由于训练这个
支持向量机的训练数据较难获得,我们利用评测会议的检索结果和检索工具自动地生
成训练数据。这套查询扩展方法的优点在于通过对训练语料的学习(能够对候选扩展
词作出更合理的选择。在TREC评测会议组织的观点检索任务中,相对于不采用任何扩
展技术的基准系统,该方法提高了MAP指标33(1,。[著者文摘] 关键词: 计算机应用 中文信息处理 信息检索 查询扩展 机器学习 7、标示原文线索:
(1)基于标引经验和机器学习相结合的多层自动分类
【作者】何琳; 侯汉清
【作者单位】南京农业大学信息管理系;
【刊名】中国索引, Journal of the China Society of Indexers, 2006年 01期
(2)专题——基于信息理论的机器学习准则:以分类问题为例 中国人工智能学会第12届全国学术年会
2007年11月20
(3)机器学习的查询扩展在博客检索中的应用
王秉卿 张奇 吴立德 黄萱菁
《 中文信息学报 》
2008年 22卷 6期