摘要:通过分析图书馆数据整合的现状和背景,以吉林动画学院图书馆网站数字资源一框式检索系统为例,对基于元数据整合的一框式检索系统进行阐述和分析。 关键词:元数据;数据整合;一框式检索 中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)01-0007-03 1 图书馆数据整合的现状 1.1 图书馆数字资源类型日趋多元化 随着网络的迅速发展,大量的信息以多样化的表现形式和实时互动的交流方式构成了一个虚拟世界。数字资源类型日益呈现多元化趋势,信息量丰富,高校图书馆 可通过自建、购买、共享和文献传递等方式满足读者需要。数字资源包括自建数据库,如馆藏书目数据库、学位论文和会议论文数据库、中外文现刊目次库、馆藏特 色数据库以及教学参考书数据库等;外购数据库,如CNKI中国知网、万方数据知识服务平台、Elsevier ScienceDirect、Springer Link等;光盘数据库;网络数字资源以及参与共享项目建设的数据库。随着数字资源数量和数据库类型的不断增多,增长速度加快,可供读者选择的数据库多达 上百种,面对如此多的资源,读者很难在特定的数据库中找到所需信息,需要在不同的数据库间切换、筛选,降低了检索效率。 同时网络资源也是图书 馆数字资源的一个重要组成部分,但是网络的不可控性造成了网上信息质量参差不齐, 缺乏系统的组织管理, 在选择和利用网上资源时给读者造成了很大的困难,同时也给图书馆为读者服务带来了不便,所以读者和图书馆都需要一个可以简捷、快速和有效地,能够实现跨库 检索获取所需信息的理想平台。 1.2图书馆数据整合的必要性 高校数字图书馆作为学校数字化信息中心,为教学、科研及广大师生提供 了信息服务保障,对提高教师教学水平及科研能力,起到积极的促进作用。高校数字图书馆的运行环境主要为校园网,提供局域网范围内的数字资源服务。作为一个 知识服务机构,承担了对文献和资源进行筛选、整理, 使文献有序化的工作。[1]在数字图书馆成为发展方向的背景下,各个图书馆越来越重视数字馆藏的丰富性和多样性。与此同时,大量的复杂数据面向读者,使读 者在选择和使用数字资源时造成困惑。图书馆作为“资源”和“读者”之间的桥梁,需要建立一个统一检索平台,使读者能够更加方便地从大量相关信息中准确挑选 出所需信息,浏览和获取来自图书馆及网络的各类数字资源,开辟了一个全方位了解和掌握所关注学科和领域动态的较为方便快捷的途径。因此,构建统一的检索平 台是解决这一问题的有效方式。[2] 2 基于元数据整合的一框式检索 2.1 元数据管理及特点 在图书信息领域,元数 据是指提供关于数字资源或数据的一种结构化数据,是对数字资源的结构化描述。跨库检索在图书馆网站中,与资源导航、开放链接、权限管理和个性化服务等功能 一起构成的数字资源整合系统,是图书馆网站检索系统中的一种关键技术。但对所有资源的跨库检索只是一种理想状态,实际中只能做到兼容尽可能多的资源。读者 需要针对某个学科领域、文献以及其他个性化需求的检索。元数据挖掘存储管理系统吸收了跨库检索的优点,并进行了改进,改变了读者的认识,通过对元数据进行 存储和预处理去重排序,提供了搜索引擎方式的检索,保留了跨库检索的功能,解决了采用单一跨库检索整合资源的弊端。元数据仓储的建立,对于数据仓库的成功 运行具有非常重要的作用。 元数据管理主要有两个方面的任务:一是存储和维护元数据库中的元数据;二是数据仓库建模工具、数据获取工具、前端工 具等之间的消息传递,协调各模块和工具之间的工作。通过元数据索引技术将图书馆的各种数字资源元数据预先收录,实现搜索引擎的检索效果,具有搜索速度快, 检索结果统一无重复的特点。 2.2 一框式检索及特点 一框式检索系统通过资源调度系统,对各种异构数字资源进行应用检索整合。一 框式检索引擎实现了文章题名、主题、作者、刊种进行分析型检索,使读者能够快速地获取所需要的结果,并且通过先进的知识组织体系和语义检索获取资源。一框 式检索为读者提供了统一的检索语言和检索界面,能够实现对本地和异地各种数字资源系统的检索,对多种异构系统的联邦检索,对多种资源元数据仓库的跨库检 索,为读者提供了个性化的检索服务。一框式检索系统是图书馆网站的核心组件之一,是一套完整的文献检索、获取系统。 2.3基于元数据整合的一框式检索系统 目前高校图书馆都同时拥有多种数字资源类型,每种数字资源都属于独立的系统,读者需要进入不同的数据库才能获取资源,海量的数字资源给读者带来诸多不 便。为解决该问题,本馆利用发现系统对馆藏纸质资源和数字资源进行了大规模整合,并在网站上启用了“基于元数据整合的一框式检索系统”。 |