您的当前位置:首页大数据时代军队图书馆资源共建共享与知识服务创新

大数据时代军队图书馆资源共建共享与知识服务创新

2023-06-23 来源:爱问旅游网
大数据时代军队图书馆资源共建共享与知识服务创新

作者:耿卫 杨伟超 尤江东

来源:《创新科技》 2013年第10期

耿卫 杨伟超 尤江东

(信息工程大学,河南郑州450001)

[摘要] 目前,大数据已经成为一种自然资源,开始注入各种行业,军队院校图书馆把握这个机遇,加强资源共建共享,利用大数据技术挖掘、识别和分析读者行为,拓展图书馆服务,提高知识服务创新。

[关键词] 大数据;共建共享;价值挖掘;服务创新

[中图分类号] G252 [文献标识码] A

1 大数据产生的背景及对图书馆的挑战与机遇

随着科技环境的巨变,信息网络迅猛发展。首先是电脑的全球普及,移动智能终端的盛行,随之而来的是社交网络的爆炸式发展,还有存储技术的发展等,这些都让数据的生产和收集能力得到提升。其次是非结构化和半结构化数据的有效分析模型的构建,相关软硬件的支撑,让数据的分析能力得到提升。面对数据形式日益复杂,数据的获取越来越细致,数据的传送、分享和访问能力也得到彻底变革。

国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010 年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB。无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据,数以亿计用户的互联网服务时时刻刻在产生巨量的交互,信息量每年正以最少59%的速度在递增,到2020年世界上的数据存储总额将达到35ZB。而更关键的是,这些信息不再是单纯的数字和文字,还有更复杂的图片、音频和视频。

通俗地讲大数据指的是海量数据加处理方法。有4 个典型的特征:一是variety(多样

性),多样性是指海量数据中包含结构化和非结构化的数据,相对于以文本为主的结构化数据,非结构化数据越来越多,包含视频、图片、位置等多种信息;二是volume(体量),体量是指包含的数据量规模庞大,具有一定的分析规模;三是velocity(速度),速度则是指数据处理的速度非常快,这是大数据区分于传统数据挖掘的最显著特征;四是value(价值),价值密度的高低与数据总量的大小成反比,通过强大的机器算法更迅速地完成数据的价值挖掘。大数据时代,院校的教学、读者的学习方式都会随之发生改变,数据将成为图书馆的核心资产,并将影响图书馆的业务模式,甚至重构其服务方式。如何挖掘分析数据资产,使其为大学决策乃至全军服务,是我们研究大数据的核心议题。全军图书馆在大数据时代,面临文化、信息化、人才培养等各方面的挑战,同时也迎来转型机遇和契机。

图书馆作为服务和信息资源保障部门,是大数据存储和服务的提供地。图书馆专业技术人才要及时掌握大数据技术给图书馆带来的影响,制定大数据时代图书馆发展策略。未来图书馆的竞争将是对大数据的综合掌握。随着人们对大数据的认识程度的提高,对大数据分析技术的日臻完善,大数据变得愈加有价值。例如,读者的借阅习惯、服务消费记载、服务质量提升等,

能为图书馆未来发展、服务模式进行趋势分析、发展预测提供支持的大数据,都有可能成为图书馆的核心资产,也是未来图书馆发展的选择。

2 军队院校图书馆资源共建共享保障机制建设

军队院校图书馆资源共建共享保障机制建设,围绕“全军院校一个馆”的建设目标,坚持“统筹规划、信息推动、联建共享、集约高效”的原则,以信息系统研发和信息化条件建设为抓手,以信息资源建设为重点,以提高图书馆人员信息服务素质为突破口,在军队院校图书馆统一的信息管理系统支撑下,努力构建基于网络共享,服务基于网络互联的“大平台、大数据、大服务”的运行保障模式。

文献资源联建共享,通用资源联合保障,有效提升全军院校图书馆文献资源整体保障能力,也有效地节省了信息资源建设经费。随着大数据时代技术的发展,为联建共享提供了有力的技术支撑。

2.1 不断拓展联建共享的途径

近十年来,军校图书馆在信息资源联建共享方面已经迈开了步子。在数字图书馆建设中,总部机关批准了多个信息资源共享重点建设项目,取得了丰硕的成果,发挥了很好的作用。例如,我校的作战信息与战场环境专业图书馆建设,从全军信息资源共建共享的建设需求出发,完成了数字资源创建、元数据加工、组织管理、信息挖掘、加工整合和提交管理等多个环节,最终建成17个专题数据库,有效提高作战信息与战场环境专业图书馆信息服务联合保障能力,完善了军事特色信息资源建设保障体系。另外,为更好的提高资源使用效益,共建共享,提供联合保障,我校与地方高校签订战略合作协议,优质资源共享、军民融合发展。

2.2 加强资源统一订购和联合采购

军队院校图书馆在联席会组织领导下,完成通用文献数字资源统一订购和联合采购,配发全军院校共享。组织有关院校集中与资源数据商进行谈判,联合采购各院校所需的信息资源,降低了采购成本,提高了经费使用效益。到2012年底,纳入联合保障计划的通用数字资源库已达62个,其中统一采购配发全军院校使用的各类资源数据库26个,联合采购的资源数据库33个,较好地保障了军队院校信息资源所需。

2.3 启动MALIS项目建设

军队院校图书馆开展信息化建设已有多年,图书馆已形成了加强信息化服务的共识,锻炼出了一支信息化建设与管理的人才队伍,积累了建设的经验;先后开发了图书馆业务管理系统(Milins、NM2000、Milnets)和数字图书馆管理系统(MADL),部分实现了信息资源的共建共享,在数字图书馆建设和图书馆信息化建设中发挥了重要的作用。

随着大数据时代信息技术发展并结合当前军队院校图书馆现状,参考借鉴中国高等教育文献保障系统(CALIS)、国家科学数字图书馆系统等建设项目情况,军队院校图书馆启动新的信息管理系统建设-MALIS项目建设。MALIS项目建设整合现有资源和应用系统,推进资源和技术平台的联合开发建设,构建军事特色鲜明、信息资源丰富、标准规范统一、服务功能强大、使用方便快捷、管理安全可靠、国内一流的军队院校图书馆信息管理系统,实现统一平台、统一标准,统一检索、统一认证,通过协同建设、联合保障,使系统成为图书馆整体服务能力提升的倍增器,为院校教学科研、部队教育训练、机关决策咨询提供高效率、全方位的文献保障和信息服务,成为军队信息化建设的重要基础设施,使军队院校图书馆建设从分散走向联合,从以资源建设为重点转变为以信息服务为中心,借助大数据时代信息技术,通过资源共享、联合保障,真正实现“全军院校一个馆”的资源建设与信息服务目标。

3 图书馆大数据的价值挖掘

数字资源的积累就是数字图书馆财富的沉淀。一方面我们通过引进购买数据库和自主数字化加工的方式,不断积累期刊、图书、会议、论文、报纸等渠道发表的,经过权威审核把关的学术资源,这类资源相对严紧可靠,具有较高的学术价值;另一方面通过互联网智能抓取技术,不断积累相关的网络资讯内容,这类资源时效性好,是鲜活的研究参考资料。严谨学术资料和鲜活的网络资讯互相取长补短,相得益彰,形成数字图书馆的基础财富。

大数据时代,图书馆应加大对知识资源库的价值挖掘,更好地为读者服务。下面分析我校图书馆大量的用户信息行为产生的数据。

我校用户查询书目产生的milnets日志—存在于milnets系统。用户借还书产生的流通日志—存在于milnets系统。用户检索浏览下载电子资源产生的日志—存在于不同数据库系统。

用户访问产生的流量数据。主要有两类:

其一是交换机的出入口流量、上下行组包数、CPU、内存占用率等。缓存在不同交换机。

其二是服务器的占用内存、进程数、CPU负载、当前用户数、硬盘卷占用情况—缓存在不同服务器。

利用这些信息,进行价值挖掘,我们可以为学科服务,利用各种日志数据,研究探索从网络底层获取数据。以我校九大学科为例,将不同学院读者检索浏览下载的信息行为数据进行分类,分析用户检索浏览下载的文献(全文、摘要、关键词)特征,加入时间纬度,归纳出读者感兴趣的主题,利用关联分析、聚类分析、社会网络分析等进行学科热点预测和交叉学科分析研究。建立基于读者信息行为分析的学科服务支持研究报告。最后得出读者的需求,建立九大学科服务群。

在大数据面前,搜索是基础,首先要给读者提供简捷、精准的搜索服务。其次是及时融入专题服务,为各专业学科、社会热点快速地创建虚拟专题库,聚类相关的背景资料,为读者提供针对性的服务。另外提供按需推送的服务,根据用户的学科专业、研究领域、自定义过滤条件,及时将最新更新的资源通知、推送给用户。让读者广泛参与,为专业学科、干教提供建站云端,使更多的人或组织可以参与到资源建设和使用中来。最后,提供安全、可控的服务,对用户的知识服务严格审核,鼓励使用但杜绝恶意下载。根据这些需求,我们开发建设仓储智能管理平台系统。

我校的仓储智能管理平台系统,可以有效地将网页式服务(资源导航、统一检索、信息发布等)、桌面端服务、信息采集、专题数字信息等功能有效集成于一个平台之上,实现所有信息全平台无障碍流通。在用户服务以及大数据建设两个方面获得提升。探索从网络底层获取用户访问数据库资源的信息行为数据的方法。解决图书馆界数据异构和应用异构难题。整合的数字资源包括馆藏书目、馆藏数字化资源、镜像资源、非镜像数据资源、开放获取资源以及网络公开资源等。

4 图书馆知识服务创新

服务创新,就是要克服循守旧的思想,锐意进取,勇于实践,创造性地解决各种难题,不断探索适应读者的需要、符合本单位实际情况的服务模式。大数据时代,必须依靠改革创新探索新对策,寻求新办法。树立创新意识,及时把服务中好的经验和做法上升到理论高度,促进

图书馆知识服务迈上新台阶。图书馆服务创新是其价值体现的核心,也是其存在的价值与意义所在。

4.1 积极探索大数据分析技术

大数据时代,多类数据的拥有、挖掘、融合、利用水平是图书馆创新的关键因素。一方面图书馆知识服务只有对大量的用户数据挖掘、分析,才能得出图书馆所需要的决策参考。另一方面读者需要大数据分析及内容,例如图书馆为读者做的信息参考、情报分析等。积极探索和分析大数据,要求我们在三个方面彻底改变对大数据的态度。第一是收集和使用大量数据,而不是像统计学家们在过去100多年里所做的那样,只满足于少量的数据或样本;第二是抛弃我们对有条理和纯净的数据的偏爱,转而接受杂乱无章的数据;第三是收集和分析大量信息及一切相关素材,找出可能有助于预测未来事件发生的规律。

4.2 积极开展图书馆创新服务

现代图书馆的服务,需要更高的技术要求,需要高标准的智能化服务水平。图书馆智能化服务水平的高低,不仅影响知识从单个主体拥有向多个主体拥有的流通与传播,而且对隐性的知识向显性的知识转变、知识的发现、挖掘和组织等都有影响。

4.3 充分利用数据分析技术

未来图书馆对技术、工具的应用需求将会更加迫切,这也为图书馆的技术应用水平提高提出了更高的要求。目前聚类分析、网络分析、可视化分析、数据融合、数据集成等技术已经初步发展,也可能是未来研究和发展的方向。我们要积极发展应用,努力通过这些数据分析预测未来的发展趋势。

5 结语

大数据时代已经到来,展望未来,图书馆发展前景广阔。工作人员应积极尝试和思考解决图书馆信息服务创新和资源开发中的大数据问题,为开创图书馆工作的新局面,为培养高素质新型人才,做出更大的贡献!

参考文献:

[1]张文彦,等.大数据时代的图书馆初探[J].图书与情报,2012(06).

[2]孙琳.大数据时代图书馆服务体系创新研究[J].理论观察,2013(04).

[3]韩翠峰.大数据带给图书馆的影响与挑战[J].图书与情报,2012(05).

[4]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(01).

[5]徐子沛.大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活[M].桂林:广西师范大学出版社,2012:40-57.

作者简介:耿卫(1961.8-),女,硕士,研究馆员,图书馆馆长,研究方向:情报管理与研究。

杨伟超(1980.12-)男,硕士,馆员,研究方向:信息技术,数据库。

因篇幅问题不能全部显示,请点此查看更多更全内容