为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

教育教学视频搜索引擎架构及其关键技术研究

2011-10-23 5页 pdf 397KB 37阅读

用户头像

is_882734

暂无简介

举报
教育教学视频搜索引擎架构及其关键技术研究 2010年3月 山东师范大学学报(自然科学版) Mar.2010 第25卷第1期 JournalofShandongNormaluniVers时(NaturalScience) Vd.25No.1 教育教学视频搜索引擎架构及其关键技术研究 张慧琼 方海光。 (首都师范大学教育技术系,北京,100048) 摘要基于视频关键字的传统检索方法不能满足学习者检索特定学习内容的检索需求.通过分析教学课录视频资源的特 征、结构以及资源的使用特点,规范教学课录视频资源制作标准,采用相关技术对视频资源进行预处理以及建立教学语义本体...
教育教学视频搜索引擎架构及其关键技术研究
2010年3月 山东师范大学学报(自然科学版) Mar.2010 第25卷第1期 JournalofShandongNormaluniVers时(NaturalScience) Vd.25No.1 教育教学视频搜索引擎架构及其关键技术研究 张慧琼 方海光。 (首都师范大学教育技术系,北京,100048) 摘要基于视频关键字的传统检索方法不能满足学习者检索特定学习内容的检索需求.通过分析教学课录视频资源的特 征、结构以及资源的使用特点,教学课录视频资源制作,采用相关技术对视频资源进行预处理以及建立教学语义本体等 一系列操作和处理,在此基础构架教学课录视频搜索引擎,实现教学课录视频资源的检索和利用,提高资源的共享率和利用率,帮 助师范生或一线教师提高教育教学的能力.并且基于“首都师范大学基础教育课程点评平台”案例分析和阐述视频搜索引擎架构 中的关键技术. 关键词教学课录;视频检索;搜索引擎;垂直搜索 中图分类号G229.26 文献标识码A doi:10.3969/j.i&m.1001—4748.2010.01.043 1概 述 通用搜索引擎大都以关键词建立索引,在提高用户使用效率的同时,瓶颈也日益显露⋯.传统的视频检索大多是基于关 键词的检索,即根据事先设定的关键词检索视频资源.传统的视频检索缺乏元数据标准对视频内容进行精确描述,并且视频 关键词描述的人工或者半自动化处理方式造成视频描述的主观差异性较大,所以基于关键字的视频检索,其检索的结果可能 与检索需求不相关,不能满足用户检索需求.搜索引擎并不强调检索出来的信息数量,而是信息质量,即检索出的信息要与搜 索需求高度相关.因此对于视频检索,在视频语义理解基础上,实现视频内容合理表达和描述,是视频内容管理和检索的关键 问心】.在视频搜索领域,针对教学领域的视频搜索的研究相当少,而且教学课录视频资源也缺乏统一的制作、管理标准,仅 凭关键字是很难准确描述、检索视频,视频搜索领域正面临着技术瓶颈.针对基础教育的搜索研究,构建基于基础教育视频资 源搜索引擎,有效处理、组织、存储、检索教学课录视频资源,提高视频资源检索效率和利用率是研究的核心和动力. 2基于视频的学习 个体认识事物、理解事物以及处理刺激或信息的模式称之为学习模式,学习模式有多种分类方法,根据生理直觉或学习 通道,可以简单的分为视觉学习模式,听觉学习模式,触影动觉学习模式.有关研究表明:单凭听觉获取知识,能记忆15%的 内容;单凭视觉获取知识,能记忆25%的内容;听觉视觉同时运用,能记忆65%的内容.而视频学习把看、听、说、做等功能统一 起来,给学习者多感官、多层次的刺激,发挥多个感官的综合优势,可以提高学习的效率.信息化社会知识更新频繁,视频学习 方式能根据学习者需求检索到最合适的资源,而且不受时空限制,自由选择环境和时间学习.比如:师范生以及一线教师不仅 要学习教育理论知识,要掌握新的教学理论、教学理念和教学规律等陈述性静态的知识,而且也需要提升他们的教学技能和 方法.而便捷的、易于观察的视频学习资源提供了新的学习途径和方式,他们通过分析视频中教师的教学方法、处理实际教学 问题的技巧和策略,再结合自身实际情况或者教学经历,总结和体会视频学习的教学经验,然后他们通过模拟操练和反复琢 磨,快速地提高教学技能和积累教学经验,并且培养他们处理教学突发事件的能力.师范生通过检索、学习具有针对性教学视 频资源,可以在短时间内熟悉教学流程,大大缩短师范生走上新岗位的适应期.对于一线教师,通过学习研究视频资源,可缩 短教学新手成长为经验丰富的教师的工作年限,提高了他们的教学组织能力和工作效益.教学课录视频搜索引擎能高效组 织、管理优秀教师的教学课录视频资源,而且也能提供有效的基于视频内容的检索方式和视频资源呈现方式,帮助师范生和 一线教师快速得到需要的学习资源,提高学习效率. 3教学课录视频搜索引擎架构 教学课录是中小学教学课程录像的简称,本文主要是指基础教育的教学视频资源,这些教学课录视频资源必须按照既定 的标准和格式进行处理,也即是通过对教学课录视频资源制定统一的视频资源制作标准,通过技术手段实现视频内容标签自 动生成和半自动编辑处理,并且据此构建视频的教学语义本体,将教学课录及相关文件组织成可以检索的视频资源. 收稿H期:2009—09—06 +通讯作者,副教授,硕上生导师. 156 万方数据 第1期 张慧琼,等:教育教学视频搜索引擎架构及其关键技术研究 第25卷 教学课录搜索引擎是垂直搜索在教育领域的创新应用.它对已对象化的视频资源进行管理和检索,更好地为搜索者服 务,满足教学领域使用者特定的检索需求.它以通用搜索引擎理论为基础,借鉴垂直搜索引擎成功应用的经验,分析教学课录 视频资源,构建教学语义本体,并根据教育资源词库建立视频资源索引文件,然后提供给用户友好的搜索界面实现视频检索 功能.搜索引擎在不同应用实例中的具体实现有着极大的差异,但都由搜索模块、检索模块、索引模块、用户模块四个主要部 分组成.教学课录视频搜索引擎应用于教学领域,为基础教育提供专业搜索服务.教学课录视频搜索引擎架构如图1所示. 搜索引擎架构中的数据预处理部分是此架构 的基础模块,它提供一系列程序和流程完成对视 频资源的操作和处理.数据预处理程序采用技术 手段,采用自动或者半自动方式抽取视频资源描 述信息,形成该视频文件的标签文件,并构建教学 语义本体;索引处理则是根据教育资源词库建立 倒排索引文件,完成视频资源索引功能;检索组 件根据用户输入查询条件检索视频资源文件,并 按特定的排序算法返回检索结果;前端用户检索, 主要是为实现人机交互提供操作界面和个性化学 习环境的支持. 4搜索引擎中的关键技术 用户特征 信息 学习背景 学习需求 视频检索 日志 输入 显示 检索 组件 斧鞴 中心数据库 专家库、索引文十 库、教学视频库、 知识库、视频特 征库 图l教学课录视频搜索引擎架构 4.1 视频单元化处理 教学课录视频资源既有 图像也有视频,还有声音以及大量教学案例设计文档,非结构化教学课录视频资源的属性信息如表l所示. 视频单元化处理是实现视频检索的先行工作.首 表1教学课录视频资源属性信息 先,在视频资源录制前,根据视频资源特征以及用户利 用资源的不同特点,确定教学课录视频资源的制作标 准.如教学课录必须有课程导入过程,必须有包含教学 内容简介的PPT文档,必须有完整的教学设计等.视频 制作必须严格遵循此标准,为视频对象化处理做准备工 作.其次,对已经收录的视频资源进行技术处理,分析教 属性 属性描述 教学视频 炙篱纛嚣黧i荔凳嚣馨警年级、选送学校、视频主讲 专家点评视频 包括专家信息、专家点评内容、专家推荐内容 视频 视频对应的教案设计文档,包括教学设计、教学过程等 视频PPrr 教学视频对应的PPrf文件,是视频内容的主要描述 学视频资源的基本特征和结构,从视频对应的教学PPT文件以及其它描述文件中抽取出描述教学视频的关键元素,这些抽取 出的关键元素形成关于视频内容的标签文件.建立索引时也是根据视频标签文件建立该教学课录视频的索引文件,如果视频 标签文件遗漏教学视频的重要信息或者错误提取视频信息,则可能漏检视频或者检索到的视频与检索条件不相关.本文的视 频搜索引擎架构中,一个视频文件只对应一个标签文件,但一个标签文件描述的信息可能在多个视频文件中存在,因此,为了 使标签文件能完全与视频文件对应,标签文件不仅包括抽取出的视频基本内容描述,还包括标签文件对应的视频文件的存储 属性.标签文件包括的主要属性如表2所示。 4.2教学语义本体的构建语义是对知 识、内容或数据的抽象.语义具有领域性特 征,不属于任何领域的语义是不存在的.本 文是针对教学领域的视频资源搜索,教学语 义本体是描述教学概念以及这些概念之间 关系的概念模型,构建详尽的教育语义本体 需要对教学领域有深刻的理解和认识”J,构 建的教学语义本体能否准确的描述和表述 该领域的知识将影响视频搜索引擎的检索 效率和效果.通过半自动方式抽取视频内容 信息并构建针对该视频的教学语义本体,是 实现基于视频内容检索的有效方式.构建教 学语义本体首先需要对教学领域里的知识 进行表述,即用词和术语来表述教学知识.在 表2教学课录视频资源标签文件属性信息 属性类别 属性值 标题 教师信息 视频内容描述 专家点评描述 视频推荐内容 教学方法 教学模式 教学策略 课程名 参考书目 视频文件信息 PP'r文件信息 教学设计文件 视频存储信息 视频标题(视频标题的标准格式如年级一课程名一教学内容) 姓名,教龄,地址,电话,Emnil,简介 视频主要内容,内容来自于教学PPT或者屏幕文字 专家点评内容,专家相关信息 视频突出的特点,值得推荐的内容,比如课堂组织,教学引入等 教学视频中采用的教学法 采用的教学模式 采用的教学策略 视频教学授课的课程名称的完整准确描述 视频教学对应的教师教学的参考书目 教学课录对应的视频文件名 视频文件对应的教学内容简介PPT文件的名字、位置信息 视频文件对应的教学设计文档的内容、名字、位置信息记录视频存储的位置信息—— 本文中,这些词和术语构成了教育资源词库,词库中的词汇主要是教育行业的专业词汇和常用词汇,比如必须包括教育教学 157 一鬻 万方数据 第25卷 山东师范大学学报(自然科.学版) 第1期 的基本环节、基本过程、基本特点和基本理论等知识和术语.根据语义本体论理论和构建方法,构建视频标签文件语义本体, 才能使抽取出的视频内容描述信息被计算机识别和检索. 4.3 自动索引处理视频标签文件记录了教学课录视频资源的基本信息,建立视频索引以及检索视频都是直接操作标签文 件.建立视频索引时首先根据教育资源词库建立倒排索引文件,然后利用分词技术分割出标签文件中的词语,再将分割出的 词语与倒排索引文件进行匹配,若找到该词语,则在倒排索引文件中对应的词语后面增加标签文件的存储信息.倒排索引文 件并不是直接记录某个关键词对应的文件名,而是记录对应文件名的存储地址.如果某个关键字在多个文件中出现,则分别 记录对应文件名的存储地址.本文搜索引擎架构中,标签文件与视频文件是完全对应的关系,但标签文件描述的信息还包括 教学PPT文件、教学设计文件等.因此倒排索引文件中存储的文件还包括视频文件,教学PPT文件、教学设计文件等.假设经 过数据预处理,已经形成了四个标签文件,分别编号为标签文件l、标签文件2、标签文件3、标签文件4.从标签文件中抽出基 本内容如下: 标签文件1:小学数学,三角形定义,三角形演示,实例教学 法. 标签文件2:小学数学,三角形演示,三角形分类,钝角三角 形,直角三角形,实例教学法,启发教学法. 标签文件3:小学数学,三角形演示,三角形面积. 标签文件4:小学数学,三角形定义,三角形习题. 采用中文分词技术,将标签文件内容切分成一个个单词, 作为索引关键字.分词切割需要去掉一些无意义的词和标点符 号,本文举例时已经对内容作了一些处理,并已经构建了教学 语义本体,并且假设标签文件号与视频文件是一一对应的.根 据以上规则和处理,形成表3所示的倒排文件属性信息. 4.4匹配检索处理算法在搜索引擎中,视频检索组件是前 端用户输入和后端索引文件库之间的中间桥梁.当用户输入单 表3视频标签文件的倒排文件信息 教育语义奉体/关键字标签文件的编号视频文件的编号 个关键词检索时,若找到匹配的视频文件,则分别输出这些文件;当用户输入多个关键字检索时,则检索组件将输入的每个关 键字分别与索引文件进行匹配,检索出每个关键字对应的视频文件,然后将这些满足单个关键字的视频文件做”并集”处理后 输出.对于检索的结果,有些与检索关键字关联程度高,有些关联程度低,应该优先输出关联程度高的视频文件.目前比较成 熟排序算法利用关键字在文档中出现的位置和出现的频率来进行排序H1.视频资源使用者关注的是视频内容,因此视频内容 占有最多的权值;视频推荐内容是同类视频中的精华资源,它在排序算法中也占有比较重的权值.视频检索时需要优先确定 检索科目,因此教学科目也是影响排序的重要选项. 本文根据表2教学课录视频资源标签文件结 构,分析视频资源的特征值,给出影响排序的一些关 键字及权重值,如视频内容(15%);专家点评 (10%);推荐内容(10%),教学方法(10%),教学策 略(8%)等.以上影响排序的因素分别用d1,挖,幽, 拼,凼⋯表示,且各因素的权重值用加1,以,们,t14, 舾⋯表示.则该视频资源最终的排序权重和为: F=dl木wl4-d2}w24-d3宰w34-d4·u,4+d5 幸埘5⋯+dn书W//.(n≥1),教学课录视频排序值的点 Ⅳ 计算可抽象为:,=∑Dn·IlZn.(其中』\r为影响 权值的关键字个数,D表示关键字的值,形表示关键 字的权重值). 5案 例 视频提交用户 图2’课程点评平台系统架构图 理 教学课录视频搜索引擎架构的支持案例一首都 师范大学基础教育课程点评平台(以下均简称“课程点评平台”)的系统架构图如图2所示.该平台通过视频提交接口收录了 大量的中小学常态课教学视频资源,教育领域专家通过点评接口点评收录的教学视频资源,并且推荐出优秀和具有特色的教 学视频.广大基础教育的在职教师、教研员、在校师范生及其关注基础教育的人士均可通过身份验证和授权共享该平台的视频 {下转第163页) 158 万方数据 第1期 栾秀群,等:运动改善胰岛素抵抗的机制探讨 第25卷 【4] [5] [6] [7] [8] 【9] [10] [11] [12] [13] RichterEA.Glueoseande黼i∞andinsulin:emergingConcepts[J3.Physiol,2001,535(2):313—22. TremblayF.RegulationofGLUT4tra佑candmnctionbyInsulinandcontractioninskeletalmuscle[J].FrontBiosci,2003,(8):1072. ChibalinAV,YuM,Ryderj-W,etal.Exercise—inducedchangesinexpressionandactivityofproteinsinvolvedininsulinsignaltransduetionin skeletalmuscle:differentialeffects帆insulin—receptorsubstrates1 and2[J].ProcNatlAeadSeiUSA,2000.97:38—43. HeledY,ShapiroY,ShaniY,eta1.PhysisalexerciseenhancesproteinkinaseCdeltaactivitymdinsulinreceptortyrosinephosphoryhtianin diabetes—pronepsanunomysobesus[J]Metabolism,2003,52(8):1028. 。 李斌,刘礼斌,刘小鹫,等.中等强度运动对II型糖尿病伴肥胖患者胰岛素敏感性及血浆脂联素水平的影响[J].中国临床康复,2005, 9(39):22—24. 黄力平,宋光耀,王智华,等.不同游泳时问对高脂饮食老年大鼠血清瘦素水平的影响[J].中华物理医学与康复杂志,2001,23(4):199. NISKANENL,LAAKSONENDE。LINDSTRONJ,et81.S自tUmuricacid鹊aharbinger0fmetabolicoutcomeinsubjectswithimpairedglucose tolerance[J].DiabetesCare,2006,29:709—711. 孙莉敏,胡永善,吴毅,等.运动对糖尿病大鼠血清瘦素水平的影响[J].中华物理医学与康复杂志,2001。23(5):261—265. UraN,ShinshiY.SignificanceofinsulinresistancetOatheroscleroticcomplicafionsinessentialhypertension[J].NipponRinsho,2004,62(1): 57—64. 熊艳,粱弈铨.餐后不同时间急性运动负荷对NIDDM患者的降糖作用[J].中山医科大学学报,2000,21(5):360—362. 气elelelelC唷e唷e1C噶e噶e1C唷e儒e噶e气C乍G气e’o’o气e1C啃ele唷e哼e啃e^总^啦^心H心^心—C,∞水喇常1C础常水1C臂常水水,啦一 (上接第158页) 资源.课程点评平台系统主要包括中心数据库部分,业务用户群以及各类用户与事物中心进行业务、数据处理的接口. 课程点评平台中,中心数据库包括互为镜像的中心数据库和事务处理中心两个数据库.中心数据库存储核心数据业务, 如专家信息,知识信息库,视频信息库,视频特征信息库等.事务中心则负责各接口与各类用户群体的业务处理、数据交换等. 用户群体分为四类,访问用户包括师范生、一线教师以及一般访问用户,一般访问用户只能搜索、浏览该平台的视频资源,对 于注册的师范生和一线教师,则提供检索功能、反馈功能以及反思功能,这些功能首先需要通过用户接口进行验证处理,然后 提交搜索引擎检索.专家用户则通过专家点评接口,浏览、选择、点评教学视频.视频提交用户通过视频提交接口,提交视频到 事务中心。另外也可浏览查看未点评、已点评的视频资源,并且可以根据专家点评信息给予反馈.平台管理用户通过管理接口 管理中心数据库和事务中心处理库,完成后台管理功能.各用户群体通过各自的接口访问视频搜索引擎,管理、检索、浏览教 学视频资源.在课程点评平台中,用户通过分类搜索如课程名、主讲人等或者其他关键字搜索,比如输入关键字“一年级语 文”,点击检索即可得到相应的学习资源,包括教学视频文件本身,教师的讲解、学生的互动,也包括点评专家对教学内容、教 学过程的点评,以及与该视频文件相关的支持资源如教学视频的P阳文件、教学设计文档、教学理论等.通过课程点评平台, 用户可以方便快捷地找到满足用户需要的学习资源,提高用户学习的效率,提高课程点评平台视频资源的利用率,使得该平 台的优质教学视频资源能够得到有效地共享,缩小地区、学校之间的教育不均衡,从而促进教师专业化发展. 6结 语 构建面向基础教育的教学课录视频搜索引擎是搜索引擎在教学领域的创新应用.构建基于“首都师范大学基础教育课程 点评平台”的视频搜索引擎是有效利用平台视频资源的有效途径.创设和制定规范的视频资源制作、管理标准,分析视频资源 特征、结构,自动或者半自动方式抽取视频资源信息并构建教学语义本体,在此基础上构建面向中小学的教学视频资源搜索 引擎提高了教学视频的利用率和共享率.但由于视频资源的复杂性以及在教育领域应用的专业性,教学课录视频检索方式需 要不断改进.随着语义分析的不断成熟,MPEG一7标准的制定,基于内容的视频检索技术将会提高教学视频资源的检索效率, 在教学领域将发挥越来越大的作用”J. 7参考文献 [1]陈华,粱循,杨健.面向专题的智能化中文搜索引擎[J].广西师范大学学报:自然科学版,2007,25(2):103—106. [2]肖鸿开,吴飞.视频内容分析与检索技术研究现状和未来发展趋势[J].广播与电视技术,2005,(6):51—54. [3]朱华.中文搜索引擎结构初探[J]。情报科学,2001,19(11):1210—1212. [4]徐金雷,杨晓江.基础教育资源搜索引擎的排序算法研究[J].电化教育研究,2007,(2):69-72. [5]刘俊晓,盂祥增,吴鹏飞.基于内容的视频分析与检索技术及其教学应用【J].中国电化教育,2006,(4):92—95. 163 万方数据 教育教学视频搜索引擎架构及其关键技术研究 作者: 张慧琼, 方海光 作者单位: 首都师范大学教育技术系,北京,100048 刊名: 山东师范大学学报(自然科学版) 英文刊名: JOURNAL OF SHANDONG NORMAL UNIVERSITY(NATURAL SCIENCE) 年,卷(期): 2010,25(1) 参考文献(5条) 1.刘俊晓;孟祥增;吴鹏飞 基于内容的视频分析与检索技术及其教学应用[期刊论文]-中国电化教育 2006(04) 2.徐金雷;杨晓江 基础教育资源搜索引擎的排序算法研究[期刊论文]-电化教育研究 2007(02) 3.朱华 中文搜索引擎结构初探[期刊论文]-情报科学 2001(11) 4.肖鸿开;吴飞 视频内容分析与检索技术研究现状和未来发展趋势[期刊论文]-广播与电视技术 2005(06) 5.陈华;粱循;杨健 面向专题的智能化中文搜索引擎[期刊论文]-广西师范大学学报(自然科学版) 2007(02) 本文链接:http://d.g.wanfangdata.com.cn/Periodical_sdsdxb-zrkx201001043.aspx
/
本文档为【教育教学视频搜索引擎架构及其关键技术研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索