为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书

2017-11-14 38页 doc 1MB 183阅读

用户头像

is_511210

暂无简介

举报
国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书 国家数字图书馆 文献数字化加工中心 项目需求书 2009年12月 1 目录 一、前言 ---------------------------------------------------------------------------------------------------------------------- 3 二、国家数字图书馆总体建设目标及总体架构 -----------------------------------------...
国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书
国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书 国家数字图书馆 文献数字化加工中心 项目需求书 2009年12月 1 目录 一、前言 ---------------------------------------------------------------------------------------------------------------------- 3 二、国家数字图书馆总体建设目标及总体架构 ------------------------------------------------------------------ 3 三、国家数字图书馆的核心业务系统功能模块架构 ------------------------------------------------------------ 5 3.1、国家数字图书馆核心业务系统架构 ------------------------------------------------------------------------ 5 3.2、国家数字图书馆数字资源的数据流向 ---------------------------------------- 错误~未定义书签。7 3.3、国家数字图书馆数字资源的分布状态 --------------------------------------------------------------------- 5 四、国家数字图书馆文献数字化加工中心 ------------------------------------------------------------------------- 6 4.1、文献数字化总体要求 ------------------------------------------------------------------------------------------ 6 4.2、文献数字化加工中心应用软件要求 ----------------------------------------------------------------------- 6 4.2.1、文献数字化加工中心应用软件开发技术要求 ----------------------------------------------------- 7 4.2.1.1、符合软件规范的要求 ------------------------------------------------------------------------------------ 7 4.2.1.2、承建商应采用统一的标记语言 ------------------------------------------------------------------------------ 8 4.2.1.3、承建商应采用统一的开发语言版本 ------------------------------------------------------------------------ 8 4.2.1.4、承建商应采用主流的开发集成平台 ------------------------------------------------------------------------ 8 4.2.1.5、接口的规范 ------------------------------------------------------------------------------------------------------- 8 4.2.2、文献数字化加工中心应用软件开发功能要求 ----------------------------------------------------- 8 4.2.2.1、术语 ---------------------------------------------------------------------------------------------------------------- 8 4.2.2.2、需求描述 ---------------------------------------------------------------------------------------------------------- 9 4.2.2.3、功能描述 --------------------------------------------------------------------------------------------------------- 10 4.2.2.5、接口 --------------------------------------------------------------------------------------------------------------- 18 4.2.2.5、格式与标准 ------------------------------------------------------------------------------------------------------ 19 4.2.3、文献数字化加工中心应用软件性能要求 ---------------------------------------------------------- 21 4.3、文献数字化加工中心专业采集设备的性能要求 ----------------------------------------------------- 22 4.3.1、大幅面扫描仪 --------------------------------------------------------------------------------------------- 22 ----------------------------------------------------------------------------------------------- 23 4.3.2、快速扫描仪 4.3.3、缩微胶片扫描仪(平片、8/16/35毫米胶片扫描加工用)3套-------------------------------- 25 4.3.4、彩色书刊非接触扫描仪(非接触式,用于书刊半自动翻页,可仿真复制)1套 ------- 25 4.3.5、专业类非接触式扫描仪(超大、非接触、实物等加工处理)1套 -------------------------- 25 4.4、培训要求及售后服务 ---------------------------------------------------------------------------------------- 26 4.5、对文件数字化处理中心承建商的要求 ------------------------------------------------------------------ 27 2 一、前言 国家数字图书馆文献数字化加工中心主要承担国家图书馆馆藏资源中,文献资源的数字化生产,包括普通纸介质文献、古籍善本、缩微文献、音视频、特殊资源(如舆图、甲骨等)。它是国家数字图书馆数字资源建设和服务的起点,它是国家数字图书馆核心业务系统之一。该中心的主要职能是数字资源创建。 本次项目的工程范围和边界是指文献数字化加工中心的应用软件开发,各类专业采集设备及它们之间的集成和接口程序。建设单位要以高度的责任心和为能参加这样的国家级项目的荣誉感,站在全局的角度,以细致、科学的工程实施手段高质量的完成此次项目。 二、国家数字图书馆总体建设目标及总体架构 国家数字图书馆将全面履行国家图书馆的职能,有重点的收藏、建设和长期保存中文数字信息,在互联网上形成超大规模的、高质量的中文数字资源库群,建构数字资源采集、加工、保存的技术支撑平台,并通过国家骨干通信网向全国以及全球提供中文数字信息服务,使国家数字图书馆成为世界最大的中文数字信息保存基地与服务基地,成为国家重要的信息基础设施。利用先进的技术和传播手段,向全国及全球展示中华优秀文化,实现馆藏资源的共享。 国家数字图书馆的建设要完成我国中文文献的书目数据库建设,通过网络通道向公众全面提供中文二次、三次文献的检索(包括图书、期刊、报纸的名称及篇名数据);完成馆藏特色资源库的建设,向公众提供具有中国文化特色的信息资源,包括:甲骨资源库、金石拓片资源库、敦煌资源库、地方志资源库、图书馆学资源库、中国国情资源库、中国博士论文资源库、中国学资源库等;建立中文互联网信息资源库,保存中国重要的网站网页信息,并向公众提供查询服务;与其他行业性、地区性数字图书馆系统连通,向公众提供全方位的知识信息库,使国家数字图书馆成为世界中文数字信息资源的权威查询中心和服务中心。 3 站在信息化建设的角度讲,它的总体架构如下: 国家数字图书馆总体架构 Portal统一门户 基资源发布与服务新增/定制业务于资源采集资源加工资源组织与管理SOA 数资数……文唯字源全字文电网……中献一资基发国资献子络……版文传元的标源虚层全布联源数资资……权信递数识组拟资文与合加字源源……处息数与据符织参源检服编工加缴采……理处馆检系与考服索务目管图工送集……理际索统存务子理……互馆储系借统业务系X n 服务标识符服务版权服务认证/授权服务 x1 服务x2 服务……………………统运安 维全 基服务注册服务发现服务合成服务发布服务管理用保于保 ESB 支撑数障障 平 据的WebService适配器FTP适配器文件适配器元数据转换适配器数据库适配器定制适配器……………………………接台应口体体 系系 数国图现有运行系统外部系统图采购资源元数据库自建资源电子图书Aleph系统馆业OAIS永久保存各一卡通系统务级资互联网信多媒体资科各数源书目数据大研息资源源类读者管理系统供学机据图应构书商库馆网上支付 ………………… ………………… 系统平台 国 家 数 字 图 书 馆 标 准 规 范 体 系 4 三、国家数字图书馆的核心业务系统功能模块架构 3.1、国家数字图书馆核心业务系统架构 数字图书馆从业务流角度来讲,它分为数字资源的采集、数字资源的集中管 理和保存、数字资源的发布与服务。 整个核心系统各模块的功能用以支持系统中信息资源的流向、转换、管理及 发布。 架构中主要包括和涉及的功能模块有: , 文献数字化和数据采集系统 , 数字资源集中保存与管理 , 数字资源长期保存 , 服务与发布平台 , 元检索 , 与核心业务系统配套的唯一标识符系统 , 与核心业务系统配套的版权管理系统 , 与国家数字图书馆各业务系统配套的应用支撑平台 3.3、国家数字图书馆数字资源的分布状态 1. 外部信息资源 2. 采集系统数字资源 3. 集中保存数字资源 4. 长期保存数字资源 5. 面向特定检索应用的元数据资源 6. 呈现给外部用户的数据 5 四、国家数字图书馆文献数字化加工中心 本项目需求书是围绕着文献数字化加工中心的建设展开的。 文献数字化加工中心包括文献数字化处理及管理软件、采集设备、输出设备、系统运行平台及基础设施和配套设备。本项目的工程范围和边界是指文献数字化加工中心的应用软件开发,各类专业扫描仪、缩微数字化处理设备及它们之间的集成。 文献数字化加工中心,并不单纯是一个软件开发和软硬集成项目。承建商不仅是提供一个生产系统,更重要的是要提供一套行之有效的生产和管理流程,并通过培训使用户指定的人员熟练使用直至交付。其中文献数字化加工中心的应用软件中的数字成品管理(包括介质)模块,负责对中心的生产产品进行有效的管理,侧重的是毛成品的管理,而数字资源集中保存与管理系统中的数字资源管理侧重的是资产管理、长期保存及面向服务的管理。 4.1、文献数字化总体要求 文献数字化中心业务处理能力 , 普通纸质文献数字化处理能力:30万册(件)/年; , 缩微介质数字化处理能力:300万拍/年; , 文摘记录加工处理能力:9万个/年; , 书目记录、文摘记录、版权关系、数字资源唯一标识符等挂接处理能力: 各9万个/年; , 目次的处理、挂接处理能力:180万行/年 , 篇名的处理、挂接处理能力:600万个/年 , 音频、视频资源的深度标引处理能力:6000小时/年 4.2、文献数字化加工中心应用软件要求 文献数字化加工中心应用软件从功能要求上讲主要包括三个方面。一是对各类文献数字化生产和标引生产过程中各道工序的处理提供软件工具级支持,以提高各道工序(操作员处理或程序自动完成)的完成质量和生产效率;二是对文献 6 数字化处理任务进行流程化管理,通过对任务的分派和跟踪管理,提高文献数字化处理的整体质量和工作效率;三是提供系统级支撑和管理功能,包括用户及权限管理、生产工序配置管理、全局数据管理、生产情况统计、数字成品管理(包括介质管理)和移交管理。 文献数字化加工中心应用软件提供对数字化生产过程中物流数据、生产管理数据、数字化元数据和对象数据、历史数据的有效管理,这是提高各处理环节生产效率的基础。 文献数字化加工中心应用软件从组成上讲,包括文献数字化生产(扫描、拍摄、音视频数字化、缩微品数字化等)子系统、标引生产子系统及配套的文献数字化中心管理子系统。 文献数字化加工中心应用软件要尽可能遵循的国家图书馆关于汉字规范处理、唯一标识符、对象数据、元数据等相关标准规范。对于规范所不能涵盖或不适用的部分,要在实施的过程中制定相应的内部标准。 文献数据化成果以对象数据和元数据的形式体现。 4.2.1、文献数字化加工中心应用软件开发技术要求 文献数字化加工中心应用软件是作为国家数字图书馆整个应用系统的一部分,它的开发要符合国家数字图书馆工程建设对软件开发的规范要求。 所谓国家数字图书馆软件开发的规范要求至少包括如下几个方面: 1. 符合软件工程规范的要求 承建商对软件设计、开发要符合软件工程的规范要求,它的具体现之一就是在设计和开发过程中按软件工程规范要求承建商向用户和总集提交过程文档,经多方评审通过再进入下一步的流程,以保证软件开发质量及开发过程受控。软件工程实施过程中关键的技术和过程文档如下: , 软件开发 , 软件需求规格说明书 , 质量保证计划 , 配置管理计划 , 数据结构设计说明 , 软件概要设计说明 7 , 软件详细设计说明 , 软件测试计划 , 软件测试说明及用例 , 软件测试报告 , 用户手册 , 安装部署手册 , 运维手册 , 部署实施报告 , 软件配置文档 , 试运行报告 2. 承建商应采用统一的标记语言 3. 承建商应采用统一的开发语言版本 4. 承建商应采用主流的开发集成平台 5. 接口的规范 4.2.2、文献数字化加工中心应用软件开发功能要求 文献数字化加工中心应用软件包括:文献数字化生产(扫描、拍摄、音视频数字化、缩微品数字化等)子系统、标引生产子系统及配套的文献数字化中心管理子系统,该系统是一个B/S 与C/S相结合的软件项目,其中服务端采用UNIX操作系统。另外,在该管理子系统中其很重要的一部分是对生产所得到的数字成品进行有效管理,它将作为该中心生成的数字成品的管理工具。本节是项目需求书最重要的一节。 4.2.2.1、术语 文献:本系统涉及的文献指普通纸质书册、古籍善本、缩微文献、音视频、特殊资源(如舆图、甲骨等)国家图书馆拥有的资源。 元数据:数据的数据。一般记录对象数据的描述信息、结构信息、管理信息(技术、数据版权、数据出处、数据来源等),用于检索、分类、统计等功能。 8 数字化:采用数字手段将普通数据转化为数字信息。这里普通数据指纸质、胶片、舆图、甲骨、磁带、录像带等介质上载有的数据;数字信息则存储于磁盘、光盘、磁带等载体上的数字信号。数字化的手段一般是数字采集、OCR识别、存储。 对象数据:普通文献数字化后形成的数据,称为对象数据,如一段数字视频,一个TIFF图象文件等。 数字水印:数字水印技术是将一些标识信息(即数字水印)直接嵌入数字载体(包括多媒体、文档、软件等)当中,但不影响原载体的使用价值,也不容易被人的知觉系统(如视觉或听觉系统)觉察或注意到。通过这些隐藏在载体中的信息,可以达到确认创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。 4.2.2.2、需求描述 (1)、文献数字化生产 文献数字化生产的任务,就是要对各类文献通过一系列流程工艺处理,最后形成可供移交的数字对象资源,以及相关的元数据。 文献数字化生产的核心是对生产流程的管理,流程工序包括任务分配、资料前整理、对象数据处理、数据后处理、数据输出、实物整理归还等。各流程工序为独立模块,生产线以任务为目标而灵活设置。 文献数字化生长应用软件的开发,就是要对文献数字化生产工序的各生产环节提供软件支持,提高文献数字化生产各环节的自动化程度,从而提高文献数字化生产效率和数字化成品质量。 (2)、文献数字化标引 文献数字化标引的任务是对文献数字化生产所得到的数字资源进行二次加工,包括编辑加工书目数据、篇名数据、摘要、全文等,形成或完善相应的元数据。 文献数字化标引的核心是对标引生产流程的控制管理,流程工序包括任务分配、工序设置,文献对象的加工标引、校对检验、数据整合、数据输出等。 9 文献数字化标引应用软件的开发,就是要对文献数字化标引生产工序的各生产环节提供软件支持,提高标引生产的自动化程度,从而提高标引生产的效率和数字化成品质量。 文献数字化生产和文献数字化标引的相关环节,可供配置组合到一起构成一个新的工序。 文献数字化标引子系统应提供预留接口以处理国图其它渠道获得的数字资源。 (3)、系统管理 从业务角度讲,系统管理的目的,就是要对文献数字化生产和文献数字化标引提供全局性的配置、管理和控制功能,提供数字成品管理功能,并通过统计分析为生产决策服务。 系统管理的功能,包括管理和提供文献数字化生产、文献数字化标引所需的工序和工艺表,根据不同的任务类型和登录类型组配生产工序;组配任务分至相应生产线,接收生产线管理系统的各种信息;提供生产线上文献信息、数字成品、生产信息、人员、光盘加工数量以及历史数据等的各种查询和统计功能,按需输出各种电子报表;提供系统管理员权限管理的功能,对操作员等进行管理;提供以及报警和数据备份等维护功能。 4.2.2.3、功能描述 以下是文献数字化加工中心生产流程示意图,不同文献的数字化流程所包含的工序,需要在软件实现时进一步分析确认: 10 文献数字化生产(此图为示意图,仅作为参考) 一、文献数字化生产系统 (1) 文献前整理 实现自动接收和输出书目数据或其他元数据;按文献类型,分发任务,补充元数据(描述型元数据);登记文献是否需要修正或修裱;记录整理信息;检查校对;数据输出至相应生产线等功能。 (2) 图书数字化 按设定工序扫描;数据整合;图象编辑处理;版面切分处理;格式转换;检查、校对;数据封装(全部元数据、对象数据);数据刻盘;数据输出至服务器;磁盘清理;生成装订、还书单等。 (3) 期刊数字化 按设定工序扫描;数据整合;图象编辑处理;版面切分处理;格式转换;检查、校对;数据封装(全部元数据、对象数据);数据刻盘;数据输出至服务器;磁盘清理;生成装订、还书单等。 (4) 报纸数字化 按设定工序扫描;数据整合;图象编辑处理;版面切分处理;格式转换;检查、校对;数据封装(全部元数据、对象数据);数据刻盘;数据输出至服务器;磁盘清理;生成装订、还书单等。 (5) 普通古籍善本数字化 按设定工序,扫描或数码拍摄;预处理(遵循标准);数据整合;图象 11 编辑处理;版面还原等处理;格式转换;检查、校对;数据封装(全部元数据、对象数据);数据刻盘;数据输出至服务器;磁盘清理;生成归还清单等 (6) 特殊文献数字化 专业设备组建的特殊文献生产线。文献包括超大幅面地图、拓片、实物、珍贵古籍等。由于文献的特殊性,在生产过程中,强调生产工艺和工序环节,注重文献的细节处理。特殊文献生产要求、设定条件、生产时间、人员、文献保护等等,根据对象和任务具体情况,设置参数指标和生产线工序。 基本工序同普通古籍善本生产线,特殊工序的添加,需在任务加工初期配置。 (7) 缩微品数字化 针对16毫米、35毫米、平片等缩微制品, 进行数字化处理。系统支持专业硬件设备接口,并将设备处理的数字文件导入生产系统,完成进一步的编辑处理。 工序可根据对象的文献类型,进行生产线配置,如图书、报纸、期刊、善本等文献。 (8) 音频、视频数字化(采集;导入) 合理组织、配置生产线,使硬件系统与软件系统实现高指标的的生产效率。音视频文献的数据来源包括模拟资源(VHS)和原生数字资源(DV、DVD、VCD),所以数据的生产流程又分为数据采集和数字转换。 由于音视频文件的加工大多采用专业软件或编码器来完成,所以音频、视频加工生产线系统应注意与第三方软件的接口问题。 生产主要过程如下: 原始资源组织整理----〉建立工作目录----〉文件数字化----〉质量检查----〉数据保存 (9) 其它数字化 临时或指定的生产任务。根据具体需求,在工艺、工序、加工等参数表中,自动组配、定制生产线系统。比如对购买数据的格式转换、封装、拆分、命名,或更加深入数字处理对象文件。 (10) 对硬件设备和专业处理软件配置管理功能 12 能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。 能与专业处理软件进行良好集成,能根据处理工序和工艺中对专业处理软件的参数配置要求,基于专业处理软件所提供的接口对处理软件进行参数控制。 (11) 数字水印处理 对文献数字化产生的对象数据进行水印处理。根据数字水印处理策略,按照工序流程,对文档、图片、音视频数字资源加盖数字水印,数字对象的水印属性可以记录在相关元数据中。数字水印处理可以作为一项独立的功能,嵌入到文献数字化生产支撑软件中。 数字水印处理功能支持可见水印和隐形水印的处理,提供数字水印查看工具。隐形水印应有安全性。 (12) 元数据的生成与管理 包括管理型在内的各类元数据的生成贯穿于整个文献数字化处理的过程中,并在文献数字化的各个环节中会不断的补充与完善。描述性元数据的获取与完善需要根据不同种类的文献数字化工序而定。 (13) 唯一标识的和成与唯一标识符注册 根据中心管理系统的唯一标识管理策略对生成的对象数据分配与指定唯一标识,并按唯一标识符系统的注册格式要求,向唯一标识符系统注册并获取数字对象唯一标识符。内部唯一标识的生成和唯一标识符注册将作为生产环节的两个功能模块配置到各类文献数字化的流程工序中。 二、文献数字化标引系统 (1) 书目编辑 提供书目数据的编辑,以及书目与数字对象的挂接处理。能提供多种书目的编制方法:外部数据导入、相近记录拷贝、人工录入等。能够按基本元数据进行字段提取与处理;能够区分数据各个字段,并按要求在CNMARC、DC、XML或其他元数据格式、数据库之间的转换。要求具有检索、剔重、唯一标识处理的能力,且能够分配唯一资源标识符。 (2) 篇名标引 13 提供多种制作方法:数据导入;OCR识别;人工录入等;提供目次、书目、摘要、数字对象的挂接;建立目次到资源的唯一对应关系;校验、检查 (3) 摘要标引 主要处理摘要信息与对象实体进行连接;对于基本元数据进行提取与处理;提供多种制作方法:数据倒入;OCR识别;人工录入等;提供目次、书目、摘要、其他元数据与数字对象的挂接,建立唯一定位关系;校验、检查 (4) 自定义内容标引 版面指定内容置标(OCR识别、人工录入、数据导入);多媒体指定段落置标(OCR识别、语音识别、人工录入、数据导入);置标位置信息、与其它载体管理关系的记录;校验、检查 (5) 全文数字化处理(手工录入;或OCR识别) 生成ISO2709、XML、HTML、PDF、TXT、等格式和元数据转换;商业数据格式转换;支持多种加工方式;多种校验方式;检查 (6) 编辑管理 专用文字输入编辑管理工具,可以处理横排、竖排的输入;可以使用多种输入方法;可以进行多种信息编码之间的转换;可以支持形码、音码的输入;有多重输入比较的能力,版式预览的能力,支持基准的XML文件结构,含位置信息(对应加工图像)、可转换进入通用的文本编辑工具中 (7) 数字水印处理 对标引后形成的全文数据,在必要时可以作为对象数据来看待。当这些全文数据作为对象数据时,其发布与服务必须受到版权的约束,因此标引生产系统也需要具有数据水印处理功能。根据数字水印处理策略,按照工序流程,对数字对象加盖数字水印,数字对象的水印属性可以记录在相关元数据中。数字水印处理可以作为一项独立的功能,嵌入到标引生产支撑软件中。 (8) 字符集外管理 可建立Unicode字形字库,提供简单容易正确操作的输入方法,检索指定字形的字,对外字进行自动查重。可建立和修改字形曲线库、字的结构图、字音、自给编码等外字库,建立外字的属性。建立数字资源与外字的关联表。 14 提供外字输入、检索、查重和统计。提供输出外字功能。根据Unicode版本升级,修改外字库,并可按需要修改已做数字资源中相关外字的编码。该部分功能需要与中文信息处理系统子项目所购软件提供的功能进行整合。 (9) 元数据的生成与管理 数字资源标引生产过程所产生的元数据,一般都以元数据的形式保存。所产生或补充的元数据信息包括描述型元数据、管理型元数据等。元数据的属性字段规范需要在软件需求分析时进一步分析确定,原则上尽量采用国图标准。 (10) 对硬件设备和专业处理软件(主要是OCR)配置管理功能 能与专业采集处理设备进行良好的集成,能根据处理工序中对设备参数的配置要求,基于硬件设备所提供的接口对硬件设备进行参数控制。 能与专业处理软件进行良好集成,能根据处理工序和工艺中对专业处理软件的参数配置要求,基于专业处理软件所提供的接口对处理软件进行参数控制。 (11) 标引生产管理 根据任务生产通知单,按照要求分发到相应的标引生产线;根据具体任务设定生产流程、工序,掌握和控制生产进度和数量;数据接收(输入);置标字段管理,实现自定义字段名称和属性、任意选择字段、自动灵活组配标引数据库;统计及报表输出;人员角色、权限管理;生产线数据库维护;文件系统管理,包括对象文件、元数据和备份数据;数据输出。 三、文献数字化中心管理系统 文献数字化中心管理系统是与文献数字化生产文献数字化标引配置的管理系统,一方面实现文献数字化加工中心日常生产管理所需要的功能,另一方面实现事后统计分析功能。 (1) 任务管理 包括任务定制和管理。 根据文献类型、任务要求,生成任务单。调用工序工艺管理相关指标,与任务单一起发至生产线。 根据生产线完成人员的不同(馆内文献数字化加工中心、馆内其他业务 15 部门和馆外加工企业),负责任务下达、质量监督、工程过程控制、标准制定等。 (2) 人员权限管理 系统管理员、子系统管理员、操作员的帐户、密码、权限的管理。 (3) 接收管理 接收生产线外数据;接收生产线各个模块应用数据库数据;根据参数化管理来适应底层不同数据库和操作系统的不同数据传输格式的需要。 (4) 工序工艺管理 不同加工对象的工序工艺的配置。设置各种相关设备的参数,设置存储方式方法,设置数据格式转换要求,设置检查与校对的方式等。针对不同加工对象的数字化生产工序工艺的缺省设置,要符合国图实际的数字化加工规范要求。 对于生产流程的管理与任务分配,应充分考虑对服务器的支撑能力,以及终端处理过程的支撑能力。工序工艺配置信息可与定制任务进行匹配。 提供色彩、实物管理。对于实物扫描、拍照等的色系、拼图体系进行管理,主要是色基的管理、生产设备与处理参数说明、实体说明、数据格式、拼图等 (5) 数据库管理 对形成的各类数字资源的库进行维护管理,并有相应的功能应对生产过程需要的配置。 (6) 文件管理 对形成的各类文件进行维护管理,并有相应的功能应对生产过程中需要的调整。 (7) 数据输出管理 管理、输出各个文献数字化加工过程中产生的过程文件、资源数据格式、加工数据格式、元数据、对象数据。提供批量、增量等多种输出方式。对于输出可以根据加工任务时间、加工任务的质量检查、完成的批量等进行控制输出转移。加工完成前输出到临时存储区域,验收完毕,转移到资源储藏存储区域。对于输出任务形成一个可管理的、可检查的清单文件标签,便于再 16 加工、转移、存储使用。 (8) 软硬件接口参数配置管理 负责有关扫描仪、摄像系统、非线性编辑系统、音频视系统等各种设备的驱动、格式转换和格式控制等参数配置信息的管理。根据工序的不同调整和设置相应的硬件设备参数。根据工艺的需要,转换各种设备输入输出的格式。 负责对配属的专业处理软件的相关参数的配置管理,根据工序的不同调整和设置相应的专业处理软件参数。 (9) 版权信息登记 根据需要对数字资源的版权信息进行登记。 (10) 数字化产品移交管理 可定时批量或单独将生产审校通过的数字化成品,自动生成移交电子通知单,送至数字资源集中保存与管理系统,接收电子回执,并回送收到的通知回执。处理过程信息自动记录到加工记录中。 (11) 统计管理 对工作人员、加工时间、加工数量、数据成品、生产过程(工序)等各个方面进行统计。统计结果可打印、可显示棒形图、饼形图、表格,并可按时间输出电子表格。 (12) 快速印刷 根据已有的书目记录和数字资源目录进行查重、确认。提供待印刷清单,并通知快速印刷系统。任务批准后,进行质量检查,包括数据的完整性、顺序关系、版权关系、文献状态。 (13) 数字成品管理(包括介质管理) 能够管理各种存储介质的出入库。对新介质和成品盘的出入库、库内报废以及库内丢失都进行计算机管理,使介质的管理系统化。 查询各种介质的使用情况。用户可以方便的查询成品盘的情况以及盘中图书的信息。 提供统计库存各种介质的数量,使管理者清楚库存各种介质的情况。 提供统计文献成品,包括存放位置、类型、进库时间、数据数量、数据 17 格式等信息;记录数据出库信息。 库房(存储介质)管理子系统是一个独立的系统,它使用的数据库与生 产管理系统可以公用,在整个管理系统中,起着重要的作用。 (14) 帮助和自我学习支持 提供涉及到文献数字化加工系统的各个软件模块的使用、工序、工艺、 技术规范等的电子在线帮助手册,并可供生产操作人员和管理人员方便查询 使用。 4.2.2.5、接口 应用软件的接口分两类,一类是与文献数字化中心专业采集设备的接口, 如高速扫描仪、非接触扫描仪、大幅面扫描仪、数字音视频设备等,这方面 在文献数字化标引系统软件要求中的第10点和文献数字化中心管理系统软 件要求中的第8点有具体的要求。另一类是与其他应用软件的接口。 由于本项目承建商不但要承担应用软件的开发,同时还要完成软硬件设 备的集成及接口程序,与硬件设备接口属于承建商内部实现的问题,因此本 节所重点讲的问题是与其他应用系统软件的问题。 接口关系的业务描述 , 数字资源集中保存与管理系统 文献数字化系统将需要处理的文献进行数字化,并生成相应的元数据,得到的对象数据和元数据需要进入数字资源集中保存与管理系统进行深加工和集中保存,深加工的依据是根据国家数字图书馆制定的元数据、对象数据、知识组织等相关的标准。 另外,数字资源集中保存与管理系统还要处理电子资源呈缴、网页资源获取等其它途径过来的数字资源。 , 版权管理系统 在对文献进行数字化的过程中需要从版权管理系统中查询文献的版权授权等信息,并根据这些信息对文献的数字化对象地行相应的版权加工。在文献数字化过程中根据需要将版权基础信息(版权页信息)登记到版权管理系统。 , 唯一标识符系统 18 国家数字图书馆唯一标识符系统实现数字对象唯一标识符的注册和管理,并提供对象访问地址的解析。因此,文献数字化系统在生成数字对象的过程中,需要生成并向唯一标识符系统注册数字对象的唯一标识符。 , 快速印刷系统 缺书处理与快速印刷系统根据需要,向文献数字化系统申请对文献进行数字化处理,文献数字化系统处理完成后提供快速印刷所需的数字资源。另外,根据需要文献数字化系统也会向快速印刷系统请求对数字资源的快速印刷服务。 , Aleph系统 对于需要数字化的传统文献,文献数字化处理系统向ALEPH系统(自动化系统)中申请获得元数据,用于生成或修订数字对象的元数据,以及对已数字化的资源进行查重。 , 馆际互借系统 文献传递和馆际互借业务在需要调用数字化资源的时候,如果集中保存系统中没有这些资源,则可以直接向文献数字化系统申请进行文献数字处理。 4.2.2.5、格式与标准 文献数字化加工中心的生产过程、标引过程、管理过程中所涉及的仅用于管理的文件格式及数据标准,由承建商根据自己的经验结合国图的具体情况制定,在概要设计说明书确定之前加以明确并通过数图项目办的审核。 文献数字化加工中心的生产过程、标引过程中所涉及的对于元数据和对象数据的格式和标准,由承建商根据国家数字图书馆所制定的数据标准,结合软件实现和实用的因素制定,在软件需求规格说明书确定之前加以明确并通过数图项目办的审核。 承建商需要在国家图书馆现已形成的数字化加工处理规范成果的基础上,结合新建的文献数字化加工中心的功能,与用户方一起制定新的数字化加工处理规 19 范。 目前国图已经制定的标准规范有: , 汉字属性字典规范 , 国家图书馆唯一标识符标准规范 , 国家图书馆管理元数据规范 , 国家图书馆博士论文数字化加工规范(内部) , 国家图书馆中文图书数字化加工规范(内部) 国图正在制定的标准规范有: , 中文文献全文版式还原与全文输入XML规范 , 计算机中文信息处理规范 , 数字资源对象管理规范 , 文本数据加工标准与工作规范 , 图像数据加工标准与工作规范 , 音频数据加工标准与工作规范 , 视频数据加工标准与工作规范 , 国家图书馆核心元数据标准 , 国家图书馆元数据应用规范 , 国家图书馆专门元数据设计规范 , 专门元数据标准与著录规范——拓片 , 专门元数据标准与著录规范——舆图 , 专门元数据标准与著录规范——甲骨 , 专门元数据标准与著录规范——古籍 , 专门元数据标准与著录规范——家谱 , 专门元数据标准与著录规范——电子图书 , 专门元数据标准与著录规范——电子连续性资源 , 专门元数据标准与著录规范——学位论文 , 专门元数据标准与著录规范——期刊论文 , 专门元数据标准与著录规范——网络资源 , 专门元数据标准与著录规范——音频 20 , 专门元数据标准与著录规范——视频 , 专门元数据标准与著录规范——图像 , 数字对象统计规范 4.2.3、文献数字化加工中心应用软件性能要求 (文献数字化日处理能力 1 , 普通纸质文献数字化日处理能力1200*400页/工作日; , 缩微介质数字化日处理能力12000拍/工作日; /工作日; , 文摘记录加工日处理能力360个 , 书目记录、文摘记录、版权关系、数字资源唯一标识符等挂接日处理能 力,各360个/工作日; , 目次的处理、挂接日处理能力,72000行/工作日; , 篇名的处理、挂接处理能力,24万个/工作日; , 音频、视频资源的深度标引处理能力,24小时/工作日 2(并发支持及响应时间 支持500人同时在线,最多并发用户支持100, 生产任务管理并发支持, 个。 , 软件人机交互响应时间,在不涉及大对象数据处理和元数据检索的情况 下,100用户并发时,响应时间不起过5秒,平均响应时间不超过2秒。 , 系统内部标元数据/标引数据检索、平均响应时间不超过3秒,100用户 并发时不超过15秒。 , 在线成品信息检索,平均响应时间不过5秒,100用户并发时不超过15 秒。 3(数据传输要求 在进行与业务相关的大数据量传输时,在支持可靠性传输的前提下,系统应能充分利用所处网络和运行平台的性能。 21 4.3、文献数字化加工中心专业采集设备的性能参考 4.3.1、大幅面扫描仪 彩色数字化设备(2套) , 56英寸快速 扫描精度: +/-0.1% +/-1 象素点 扫描速度: 200dpi: 单色:9.00英寸/秒;24位彩色:1.5英寸/秒 光学分辨率: 输入 1200 x 600 / 输出600 x 600 (dpi) 插值分辨率: 线性插值从 100 到 9600dpi 以 1 dpi 递增 色彩模式: RAW RGB/ sRGB; 色域: 48-位原始点彩色图像捕捉;16-位原始点灰度图像捕捉 消蓝模式: 2D 智能自适应消蓝 (IAT) 最大进纸厚度:20毫米; 最大进纸宽度:61.9英寸(157厘米) 最大扫描宽度:56英寸(142.3厘米) 走纸系统: 双排高精密度驱动轴和全轮驱动等高校准橡胶滚轮;单排动态介质 控制的压力轴 光学成像系统:双高效节能LED光源(只有扫描时亮起,寿命达5万小时) 8 x 四重线性 CCD (RGB + 单色) 和红外虑镜镜头 操作面板: LCD 面板 (显示扫描仪状态, 模式和设置), 扫描 / 拷贝 按钮 电源: 外置电源 接口: USB2 接口;千兆以太网接口 软件: 专业的扫描处理软件,具备扫描流程管理和图像处理功能 认证: 欧洲能源之星(ENERGY STAR) 保修服务要求:原厂提供技术服务,三年7x24小时。 , 大幅面高精度彩色扫描仪(2套) 扫描精度: +/-0.05% +/-1 象素点 扫描速度: 200dpi: 单色:12.00 英寸/秒;24位彩色:4 英寸/秒 光学分辨率: 输入 1200 x 1200 dpi / 输出1200 x 1200 (dpi) 插值分辨率: 线性插值从 100 到 9600dpi 以 1 dpi 递增 色彩模式: RAW RGB/ sRGB; 色 域: 48-位原始点彩色图像捕捉;16-位原始点灰度图像捕捉 消蓝模式: 2D 智能自适应消蓝 (IAT) 走纸系统: 大直径、单滚筒、高精度驱动轴;介质厚度自动调节 光学成像系统:没有反光镜的直线光路成像;双高效节能LED光源(只有扫描时 亮起,寿命达5万小时);6 x 四重线性 CCD (RGB + 单色) 和 红外虑镜镜头 操作面板: LCD 面板 (显示扫描仪状态, 模式和设置), 扫描 / 拷贝 按钮 22 电源: 外置电源 接口: USB2 接口,千兆以太网接口 软件: 专业的扫描处理软件,具备扫描流程管理和图像处理功能 认证: 能源之星(ENERGY STAR) 保修服务要求:原厂提供技术服务,三年7x24小时 4.3.2、快速扫描仪 , 企业级高速文档扫描仪(日工作量6万页)(5台) 扫描速度(200dpi、双面、横向、信纸尺寸文档):i620:80ppm*(可达320ipm**) 扫描技术:两个三色增强CCD 光分辨率:300dpi 照明:每侧两个2500小时以上氙气灯、无汞 输出分辨率:彩色,灰度:100,150,200,240,300dpi 黑白:200,240,300,400dpi 最大文档尺寸:30.5厘米x66.04厘米(12英寸x26英寸) 最小文件尺寸:64毫米x64毫米(2.5英寸x2.5英寸) 进纸器,升降机:500页带有升降机的自动文档进纸器,有两种设置:连续 进纸和500页批量进纸 重张探测:最新的和增强的超声波重张检测功能(使用三个传感器)文档长度检测功能 连接:IEEE-1394(火线)接口,6针接头,包括IEEE-1394卡和连线 接口支持:TWAIN和ISIS驱动器(内含):影像采集软件,VirturalReScan(VRS)影像特征(扫描仪硬件本身):带有智能阈值处理的完美页面的扫描,自动剪切,强力剪切,纠偏,电子彩色滤除,正交旋转,误差扩散,半色调移除,噪声移除 文件格式输出:JPEG(用于彩色和灰度影像);TIFF(用于双色影像) 推荐PC配置:P? 2.4GHz 处理器,512MB RAM 支持的操作系统:Windows 98SE,Me,2000,XP 存储器:扫描仪内装256MB DIMM 保修服务要求:原厂提供技术服务,三年7x24小时 , 中档高速扫描仪 (5台) 速度:每分钟75页/150副影像(黑白/灰度/彩色)(速度会因您选择的驱动程序、应用程序软件、操作系统和PC而有所不同。) 扫描技术:双CCD; 光学分辨率:600dpi 照明:双荧光(冷阴极) 输出分辨率:75, 100, 150, 200, 240, 300, 400, 600和1200dpi 最大文档尺寸:297毫米×863毫米(11.7英寸×34英寸) 23 最小文档尺寸:50毫米×64毫米(2英寸×2.5英寸) 纸张厚度和重量:34-413克/每平方米(9-110磅) 进纸器:容量高达150张60克/每平方米(16磅) 重张进纸检测:具备超声波重张检测技术 连接功能:USB2.0 捆绑软件:TWAIN,ISIS和WIA驱动程序,采集软件,Lite版 影像功能(在扫描仪中):完美页面扫描功能、iThresholding智能阈值、自适应阈值 处理、纠偏、自动裁剪、局部裁剪、强力裁剪、电子滤色、双流数据扫描、交互 式色彩、亮度和对比度调整、自动调整方式、自动彩色检测、背景平滑、黑白影 像分区处理、自动照片裁剪、多颜色电子滤色、可训练式电子滤色、长文档模式、 特别文档模式、切换补丁 文件格式输出:单页以及多页TIFF,JPEG,RTF,PDF,或可搜索PDF 保修服务要求:原厂提供技术服务,三年7x24小时 , 普通高速扫描仪(10台) 扫描速度:在150dpi黑白、灰度和彩色模式及A4纸下,不低于50(单面)/100(双面)/每分钟 光学分辨率:300dpi 纸张自动适应:自动适应 纸张厚度和重量:从超薄纸到卡片都可以 最大文档尺寸:A3 ?ADF容量:不少于100页 ?扫描元件:双面CCD 接口:IEEE 1394接口(400MB/S) 扫描输出选项:支持以下五种输出选项: 1、黑白:纯黑白 2、灰度:8位灰阶扫描 3、彩色:24位真彩扫描 4、同时输出黑白和灰度(双流输出) 5、同时输出黑白和彩色(双流输出) 文件格式输出:JPEG(用于彩色和灰度影像),TIFF(用于黑白影像) 重张检测,3D超声波 影像特性: 自动纠偏、自动修剪,智能阈值处理完美页面扫描功能 软件: Smartscan扫描控制软件(集成扫描、编辑功能;自动色彩判断、书刊扫描模式等功能) 保修服务要求:原厂提供技术服务,三年7x24小时 , 普通平板扫描仪(25台) A3 扫描仪 光学分辨率 1600dpi 最大分辨率 1600 x 1600 dpi 色彩位数 48-bit 接口类型 USB 2.0 扫描速度: 6页/分 软件 Acrobat Reader、Readiris Pro 10 Corporate Edition、Presto PageManger、Presto! ImageFolio 4、OCR专业版 保修服务要求:原厂提供技术服务,一年5x8小时 24 4.3.3、缩微胶片扫描仪(平片、8/16/35毫米胶片扫描加工用)3套 功能:将缩微胶片转换成电子影像 胶片类型:平片,封套片,开窗卡,16mm卷片,35mm卷片 屏幕尺寸:303×440mm 放大尺寸:7.5x,9-16x,13-27x,20-50x 聚焦方式:手动 ;变 焦:手动 ;扫描速度:6.5秒/页(A4,400dpi) 扫描分辨率:200,300,400,600,800dpi;曝 光:自动,手动 扫描特点:自动对中;自动遮幅;自动影像转动;卤 素 灯:20V,150W 配置:主机、计算机接口板、PowerFilm操作软件、2940 SCSI接口卡、UC-7平片架/电动卷片架、变焦镜头: 9-16X、变焦镜头: 20-50XX 保修服务要求:原厂提供技术服务,三年7x24小时 4.3.4、彩色书刊非接触扫描仪(非接触式,用于书刊半自动翻页,可仿真复制)1套 扫描仪描述:顶置式扫描头,台式非接触扫描,适合文物、古籍、图书、报纸、字画、地图等单页或装订成册稿件 原件尺寸:635×460 毫米(超A2) 扫描速度:1 秒/页(A2,黑白、灰度,300dpi)4 秒/页(A2,彩色,300dpi) 分辨率:100-600dpi 扫描模式:36 位彩色,12 位灰度,1 位黑白二值 原稿厚度:书本最大厚度为100毫米 扫描稿台:连机书稿台(可选90 度开合电动压稿玻璃) 扫描方式:自动对焦,景深达50 毫米 接口:双IEEE1394 火线接口 影像格式:TIFF 不压缩,TIFF G4,JPEG,JP2,PDF,多页TIFF,BNMP,PCS 扫描软件:OS11 基本模块(扫描、存储、浏览) PerfectBook完美3D书刊扫描:纠斜、去杂点、翻转、去黑边、遮幅、锐化,智能分页、手指删除、水印处理、盖章效果、同步彩色转灰度和黑白 保修服务要求:原厂提供技术服务,三年7x24小时 4.3.5、专业类非接触式扫描仪(超大、非接触、实物等加工处理)1套 描述:顶置式扫描头,台式非接触扫描,适合文物、古籍、图书、报纸、字画、地图等单页或装订成册稿件 最大原件尺寸: 1240 x 870 mm(超A0) 分辨率:100-600 ppi,适合于所有格式 扫描速度:6.5秒(A0,彩色,200dpi) 16.8秒(A0,彩色,400dpi) 扫描模式:36 位彩色,12 位灰度,1 位黑白二值 25 OT180 H A0电动托书台(有自动开合玻璃面板):书本最大厚度为220mm,打开最大尺寸为1350×960mm(超A0) 扫描方式:高解析度扫描镜头,6.3 线对/毫米,高精度扫描头镜头,不失真,景深达50 毫米/ 2 英寸 接口:双火线接口 影像格式:TIFF 不压缩,TIFF G4,JPEG,PDF,多页TIFF,BMP,PCS,PNG OS12扫描软件基本模块:扫描、存储、浏览 PerfectBook完美3D书刊扫描:纠斜、去杂点、翻转、去黑边、遮幅、锐化,智能分页、手指删除、水印处理、盖章效果、同步彩色转灰度和黑白 IMAGING KIT影像工具包:工作管理、多种方式遮幅、自动遮幅、 自动切分、剪切、纠偏、去黑边、锐化、平滑遮幅等等 保修服务要求:原厂提供技术服务,三年7x24小时 4.3.6、音视频采集卡 (或设备,用于模拟信号转数字信号) 3套 至少支持MPEG2采集编辑,同时最好能支持MPEG4的采编 支持非线性编辑 支持多种编码格式转换 4.3.7、音视频采集卡 (或设备,用于模拟信号转数字信号) 1套 支持MPEG1采编,同时最好能支持MPEG4的采编 支持音频采编 支持多种编码格式转换 备注:文献数字化扫描设备和音视频采集卡(或设备)及设备自带配套软件费用,共计1098万,以暂定金形式计入投标总价,在中标后,由采购人和中标方共同主持商务和服务谈判确定文献数字化硬件设备的提供商,按实际发生额经采购人同意后支付;在项目实施过程中由采购人及其委托人、监理方、造价方和总集成方审核确定实际结算价格。 4.4、培训要求及售后服务 文献数字化加工中心并不单纯是一个软件开发和软硬集成项目。承建商不仅 是提供一个生产系统,更重要的是要提供一套行之有效的生产和管理流程,承建 商既是建设者又是用户管理下的具体生产者(前期)。 培训分为3个方面: 1、软件培训:包括软件使用培训、配置管理培训、系统管理培训、运维及 26 紧急处理培训,它的培训主要由该项目承建商承担。 2、设备培训:包括设备使用培训、参数设置培训、运维及保养培训、故障 处理培训,它的培训由承建商协调各厂商进行培训。 3、生产流程及管理培训:这是本项目培训最重要的部分,承建商组织自己 相关有经验的、有实战能力的生产及管理人员对用户指定的生产及 管理人员进行岗位对岗位,流程对流程,管理对管理的人盯人的培 训,直至用户熟练使用并能独立承担生产任务。 ,、为了达到培训的目的,用户指定的相关人员从项目一开始就加入到承建 商项目部中去,从软件开发的需求规格说明书,软件概要设计,开 发配置管理,软件详细设计,软件测试计划,软件测试,设备采购, 设备安装联调,系统整体上线试用,系统正式生产的整个项目建设 过程,用户指定的相关人员都全程参加,并根据国图的实际情况给 出必要的参考意见。 ,、为了缩短系统移交时间和保证用户指定的生产及管理人员的上岗质量 国家图书馆文献数字化加工中心进入试运行和正式生产时,承建商 组织其自己的生产及管理人员带领用户指定的生产及管理人员进 行生产,采取现场授徒的方式,对用户指定的人员进行讲解、培训 和现场操作,直到用户指定的人员熟练使用,逐步移交岗位直至整 个系统的交付。这是验收的一个条件。 ,、本项目承建商需提供三年的系统运维服务,并派专业人员驻国图现场提 供相关的各种技术服务和支持。三年质保期满后,根据用户要求承 建商需提供延长服务(服务是有偿的但不能拒绝,这一点需在投标 时承诺并写出三年质保期满后有偿服务价格,这部分内容将作为评 审考虑的一部分) 4.5、对文献数字化加工中心承建商的要求 (1)、文献数字化业内成熟的软件开发商和文献数字化加工处理生产商 (2)、已有自己成熟的文献数字化软件和应用业绩; (3)、已有一套证明行之有效的生产和管理流程; 27 (4)、有一支稳定的软件开发团队;熟悉JAVA;熟悉B/S和C/S程序开发;并能在 国图现场项目部上班; (5)、有一支稳定的生产团队,熟悉生产流程和精通管理; (6)、有使用上述专业扫描设备使用经验和业绩; (7)、熟悉各种主流专业扫描设备接口及扫描处理软件;有开发过这些设备接口 管理软件的经验,并注明业绩。 28
/
本文档为【国家数字图书馆文献数字化加工中心文献数字化处理中心项目技术需求书】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
热门搜索

历史搜索

    清空历史搜索