网站首页  
地市频道: 郑州开封洛阳平顶山安阳鹤壁新乡焦作濮阳许昌漯河三门峡南阳商丘信阳周口驻马店济源
政务
中原经济区 政策法规 业务指导 职称教育
档案科研 档案学会 党建 精神文明 廉政
资讯
通知公告 档案新闻 《档案工作》电子期刊
互动
网上调查 馆藏珍品展厅
利用天地 档案征集 档案技术
档案文件查阅
已公开现行文件查询 河南数字档案馆
音视频档案 历史记忆 本地沿革
 科技研究
优秀科技成果简介之一
更新时间:2016-11-9

优秀科技成果简介之一

 

 

档案安全保障体系建设情况调查研究

 

项目基本情况:

该项目是由河南省档案局牵头,组织全省档案科研工作专业人才完成的2010年度国家档案局科技计划项目,该项目获得2012年度河南省档案局优秀科技成果一等奖,2013年度国家档案局优秀科技成果三等奖。项目组成人员主要有:方婷、李宝玲、王书继、吴雁平、刘东斌、王建祥、管先海、李兴利、刘子芳。

项目主要成果:

完成了调研报告:河南省档案安全保障体系建设情况调查研究报告。形成了两个业务指导性文件:《河南省各级档案馆档案安全评估办法》;《河南省各级档案馆档案安全评估标准》;产生4篇理论研究文章:《档案安全保障体系建设概念、对象、范围的界定》、《档案馆主要安全风险因素分析》、《档案安全保障指标体系建设研究》、《档案馆档案安全评估内容研究》(其中3篇在,《档案管理》上发表),一篇调查报告《河南省档案安全保障体系现状调查报告》、一个纲要《河南省档案安全保障体系建设规划纲要》(草案)。

项目内容介绍:

该项目把理论研究与实践研究相结合。理论研究部分首先对档案安全保障体系建设的概念及内容研究。对档案安全保障体系建设的概念、对象、范围做一个界定,以明确这项工作的内涵与外延,具体工作对象与工作范围,同时对项目研究给以限制和引导。论述了档案安全保障体系建设概念及内容,并对档案安全体系、档案安全保障体系和档案安全保障体系建设概念进行了辨析。档案安全体系是一个动态的复合系统;档案安全保障体系是一个相对稳定的供给系统;档案安全保障体系建设则是一个重在实施的过程。对这三个概念,从以往的研究中看,大多是不分的,这既不利于研究,也不利于档案安全保障体系的建设。档案安全体系建立的重点是档案安全保障体系建设。

其次,开展档案安全风险因素及其成因的研究。该课题通过河南省省、市、县三级综合档案馆调查研究,了解各级档案馆中在馆库建设、设施设备、档案实体、档案信息、档案管理中存在的安全风险,档案安全风险因素大致分为环境风险因素、管理风险因素和技术风险因素三类,列举了72种风险因素,在这些因素中,做得好就是档案不可或缺的安全屏障,任何一项做不好就会成为档案资料安全保管不可忽视的蚁穴。并分析其成因,对完善安全体系,提高安全防范提供理论参考。

第三,重点对档案安全保障评估内容和指标体系的研究。采用归纳法从部分相关节点文献中归纳出档案安全保障体系建设应当遵循的原则,作出了档案安全保障体系的层级划分,提出实际测评指标值换算与使用方法,确定了档案安全保障体系评估档次与档案安全风险评估等级的对应关系,强调在进行档案安全保障体系评估时应该考虑原有基础的差异及控制性要素和分层分项控制等因素的影响。

从实践层面上,一是对档案安全保障体系建设调查研究。精心设计系统、全面、易操作的书面调查问卷,调查研究河南省、市、县三级档案安全保障体系建设的现状,为档案安全保障评估指标体系的构建提供实践基础。

二是对档案安全保障评估指标体系进行调研与论证。指标体系形成后,多次召开研讨会,广泛征求意见,又确定不同层次、不同条件的新乡市、三门峡市、永城市、鄢陵县四个档案馆进行试点,实际测评,使测评指标体系更加完善、更具有操作性。

三是把课题研究与档案安全建设的实践结合起来,把理论研究的成果转化为指导工作实践的业务规范。在档案安全保障体系测评指标体系基础上,结合实践需要,我们形成了《河南省各级档案馆档案安全评估办法》和《河南省各级档案馆档案安全评估标准》,并在全省各级综合档案馆、专业档案馆、部门档案馆、企业档案馆全面开展档案安全风险评估工作,以促进档案安全保障体系建设。

项目推广应用:

项目在研究过程中形成了一系列的理论成果。有3篇在《档案管理》上发表,其中《档案安全保障体系评估指标体系研究》于2011年10月国家局在南昌举办的档案安全体系建设研讨会上交流。项目负责人李宝玲同志参加国家档案局项目档案安全风险评估办法征求意见会,为国家局档案安全风险评估提供借鉴。

《河南省各级档案馆档案安全评估办法》和《河南省各级档案馆档案安全评估标准》以河南省档案局名义下发到各省辖市档案局、馆,省直部门、事业、企业档案馆参照执行。《办法》和《标准》成为全省指导档案安全保障体系建设和风险评估地规范性文件,2012年在新乡市、三门峡市、永城市和鄢陵县进行试点。2013年根据试点中存在的问题和漏洞,在新乡市召开了“档案安全体系建设与风险评估”现场会,对相关条目进行了修订和补充。自2012年以来,河南省档案局已经对15个省辖市4个省直管县(市)进行了安全评估,各省辖市也已经对各自县市区开展了档案安全保障体系的评估。

 

 

 

 

 

 

档案信息资源共享及应用平台研究

 

项目基本情况:

该项目是由中国电网河南电力公司完成的,获得2013年度河南省档案局优秀科技成果一等奖,项目组成人员主要有:孙金泉、于笑飞、丁杰、安静、刘惠兰、李艳君、丁巧真、刘星宇、毕永峰等。

项目主要成果:

项目建成了河南省电力公司档案信息资源共享及应用平台,提交了项目烟具的工作报告、研究报告、技术报告、测试报告等。

项目内容介绍:

河南省电力公司档案信息资源共享及应用平台是按照“统一管控、统一标准、统一技术、统一平台”的基本原则,以网络为基础,以档案信息资源为核心,运用先进的软件技术、网络技术和存储技术进行档案信息的收集、整理、存储和开发利用,通过管理创新与技术创新,实现公司各类档案资料信息化、标准化、规范化管理,实现覆盖省、市、县三级供电企业的档案管理平台。该系统平台技术先进、设计合理、功能全面,在数字档案与电子文件自动标引、自动分类和跨全宗检索服务等方面具有创新性,在电力系统档案信息资源共享平台建设领域达到了国内领先水平。

平台采用基于J2EE的“Web/中间件/服务器”技术架构,档案业务功能通过WEB方式实现,公共服务部份采用Web Service的方式提供,数据交换采用XML标准,基于SOA\EAI的架构方式设计开发与系统集成,使用开放总线,确保系统的扩展、维护和升级方便可行。平台设计既适应“大集中”的模式,又能适应“区域中心适度集中或分布”模式,满足了档案信息资源共享与应用的需求,实现了与协同办公系统的无缝连接。

系统采用了平台化的设计思想,针对不同用户的业务提供了功能强大的业务定制功能,使得用户的业务管理规范与系统低耦合,用户可以将自己的管理理念和规范通过业务定制功能在平台系统之上形成符合自身业务管理的应用系统。系统平台不仅考虑各单位业务不同的适应性,同时还兼顾了档案管理模式、数据结构、业务流程等业务因素的变化,以适应业务需求的不断变化,适应从档案管理到知识管理的要求。

平台通过开发和集成先进成熟的技术保障各项功能得到可靠实现、提高用户的易用性和流程的自动化程度,目前系统集成了:全文检索技术、OCR技术、电子文件转换处理技术、WEB报表技术、双层PDF技术、流媒体技术、图形图像处理技术等多种先进成熟的技术,同时开放的架构可与各类内容管理平台、智能搜索系统、IRM数字版权系统、数字印章和水印系统、数据加密技术进行替换和集成,根据用户的需要提供质优价廉的技术和功能性能强大的产品选择。

平台通过版本控制和严格管理,解决了档案业务规范修订、机构沿革给档案管理带来的问题。通过对用户归档业务流程的定制,控制各业务部门的归档范围、统一整理规则、控制管理移交接收过程、明确归档责任,使得各业务部门和工程项目管理部门在文件的产生之前即可明确需要归档的内容和责任,真正实现同步建档、随办随归、前端控制。

系统强化了电子文件管理,根据需要形成各类规范电子文件格式。在提供电子文件属性元数据管理的同时对电子文件本身采用了最合理的管理方式:使得归档的电子文件可自动形成规范浏览格式(PDF)、原始格式(用于下载利用)和缩略图三种方式存储,并可通过系统控制对不同类别电子文件的访问权限(正文、附件、发文稿/收文单、底稿)。可自动对电子文件识别建立全文检索索引库。实现流媒体文件的在线播放。

系统区分电子文件类型,增加了电子文件元数据信息管理。系统在档案元数据上遵从OAIS参考模型,解决数字档案信息长期保存问题。电子文件管理管理上采用ISO15489国际标准,通过技术手段实现了电子文件的规范化转换和存储,成为采用该国际标准的国内最佳实践。

系统平台功能齐全,涵盖档案检索、个人待办事项、档案业务、业务设置、权限管理等功能,实现了档案检索、收集整编、归档、移交、借阅及开发利用等全过程管理。

系统界面友好,运行稳定可靠,实现了同步建档、随办随归和前段控制等功能,提升了档案信息对企业决策的支持力,具有良好的经济社会效益。

项目推广应用

国网河南省电力公司档案信息资源共享及应用平台实现了省、市、县三级供电企业档案数据同步、集中存储以及档案资源共享,实现了档案检索、收集整编、归档、移交、借阅及开发利用等各环节的统筹管理。公司下属18各地市、14家直属单位、代管107个县上线运行以来,系统运行稳定,平台的应用取得了预期效果,对于提升公司档案管理质量和效益,推动公司档案管理的规范化、标准化发挥了积极而重要的作用。

 

 

 

 

 

 

 

 

 

 

河南省数字档案馆资源共享系统研究

 

项目基本情况:

该项目是由河南省档案局承担的2010年省科技厅科技攻关(重点)项目。项目编号为102102310256。项目成果获得2014年度河南省档案局优秀科技成果一等奖,主要完成人员有:李宝玲、郝伟斌、吴雁平、崔海燕、王建祥

项目主要成果:

项目完成了工作报告和研究报告,公开发表研究论文4篇。

项目内容介绍:

项目研究采用kbase海量非结构化存储技术、智能信息处理技术、异构资源整合检索引擎技术和远程数据更新技术,依托kbase强大的海量非结构化数据管理能力,构建了数字档案馆资源共享的模型。在深入研究了数字档案馆资源共享系统内涵的基础上,分析了当前我省数字档案馆资源共享的现状,借助河南档案信息网这个平台,依托kbase强大的海量非结构化数据管理能力,实现文本、图像、音视频、图纸、实物等各种档案信息的管理和高效、准确的全文检索。在河南区域内建立了全省档案数据分布式加工、集中和分布相结合发布的档案信息资源共建共享合作模式;建立河南省数字档案馆和市级数字档案馆,实现我省馆际档案资源共享,使河南省成为全国第一个实现区域性馆际档案信息共建共享的省份。

主要研究内容共5部分


 

第一部分是数字档案馆资源共享系统的内涵和建设意义

数字档案馆资源共享系统是指在已建成数字档案馆的基础上,建立档案信息数据管理中心,运用现代信息技术构建信息资源共享平台,采集、存储、管理一定区域内若干数字档案馆的信息资源,发布档案信息,以拓展档案信息资源共享的广度和深度,提供更广范围的档案信息服务。系统建设以整合国家开放档案信息资源、实现档案信息资源社会化共享与服务为目标,运用云计算等先进信息技术和管理模式,打造成覆盖全省各级综合档案馆、互联互通、统一运维的“一站式”档案信息资源服务平台。

数字档案馆资源共享系统建设,可以有效解决档案信息资源的分散性与用户对档案信息需要的系统性之间的矛盾;有利于满足用户多元化的需求;有利于增强数字档案馆与档案用户的贴近性,提高检索效率。

档案信息资源的分散性以及检索的专业性,给用户利用档案带来一定的难度,数字档案馆资源共享系统通过整合档案信息资源,能提供统一的档案信息整体或检索平台,大大简化用户检索资源的过程,降低用户检索档案信息的难度,真正体现“以人为本”的服务宗旨。

第二部分是数字档案馆资源共享系统建设的理论基础

一是是档案信息资源共享理论。档案信息资源共享是指在有效整合馆室藏档案信息的基础上,运用网络技术传递档案信息,同时加强科学管理及统筹规划,实现档案信息的社会充分共享。档案信息资源共享的主体是两个以上的不同主体,主要是各机关、团体、企事业单位和其他组织的档案保管机构以及各级各类档案馆。

二是国家档案信息资源整合理论。所谓信息资源整合(Integration),又称信息资源集成、信息资源融合,是指对位于不同地域的信息形成、管理单位中分散存储和管理的各类信息资源,通过一定的手段使之连接成为一个结构有序化、管理一体化、配置合理化的整体。所谓信息资源的共享则是指强化信息资源的可获知性和可获取性,使社会公众与组织公平地拥有对各类信息资源的获取权利与获取条件。

由此可见,信息资源的整合与共享并没有本质上的区别,两者都是强调通过社会组织之间的合作与协调,对分散的、孤立的、封闭的社会信息资源进行人为的控制和管理,从而实现信息资源的充分利用与最大增值,整合是为了更好地实现共享,共享则是整合的基本出发点与根本归宿。因此,在实践中,信息资源的整合与信息资源的共享是事物一体的两面,彼此之间密不可分,并没有特别明显的界限。

国家档案资源整合的总体目标是:充分利用现代高新技术手段、国家骨干通讯网络系统,整合国内各级综合档案馆、专业档案馆以及部分企业档案机构的馆藏档案信息资源,建立一个基于互联网的档案信息共享与服务平台,实现全国档案资源的共建共享,充分开发档案信息资源,发挥档案的社会效益和经济效益,以满足国家、社会和大众日益增长的档案信息需求。

三是是档案事业全方位管理理论。档案事业全方位管理是国家档案资源建设的需要,国家档案资源来源相当广泛,其建设任务也应由国家各级档案管理部门来承但,各级档案管理部门应树立档案事业全方位管理理念,除继续依法管理同级国家机构和本行政区域内国有企业、事业单位档案工作的同时,还必须依法监管所属区域内一切非国有社会组织乃至某些个人的档案工作。

档案事业全方位管理要求继续坚持集中统一、分级管理原则。《中华人民共和国档案法》第五条规定:“档案工作实行统一领导、分级管理的原则,维护档案完整与安全,便于社会各方面的利用。”我国档案事业管理的基本原则就是“统一领导、分级管理”八个大字。

档案事业全方位管理要求强化档案行政工作的属地管理,我国《档案法》第六条和《档案法实施办法》第八条,都有对县以上各级档案行政管理部门按照属地管理原则,依法主管本行政区域内的档案事业,并对本行政区域内各类社会组织的档案工作实行监督和指导有明确规定。

第三部分是数字档案馆资源共享系统建设的实践基础

我省档案信息化的现状可以用“初步的互联网网站对外服务,以行政区划为界的“块”状OA办公,外包为主的馆藏档案数字化加工,五花八门的档案馆内部管理信息系统,各自为政的电子文件中心建设”来概括。具体是建立了全省档案数据管理中心。主要负责省馆、市馆移交档案数据存储、管理及发布。依托kbase底层建立全省档案数据管理及服务平台,实现文本、图像、音视频、图纸、实物等各种格式档案资源的统一管理。其系统框架如下:

 

第四部分是数字档案馆资源共享系统的实现

一是数字档案馆资源共享系统模型的构建

采用kbase海量非结构化存储技术、智能信息处理技术、异构资源整合检索引擎技术和远程数据更新技术,依托kbase强大的海量非结构化数据管理能力,实现文本、图像、音视频、图纸、实物等各种档案信息的管理,和高效、准确的全文检索。构建出数字档案馆资源共享系统的模型,如图所示。





 


 

 

 

 

 

 

 

 

 


全省档案数据管理中心主要负责省馆、市馆移交档案数据存储、管理及发布。各地市分中心主要负责地市数字档案馆平台的建设,对所属区域内的档案数据进行采集、整理、加工、对外发布、数据上传省中心等工作。通过安装全省档案数据管理平台客户端程序,实现各地市数字档案馆平台的搭建以及档案的数字化加工、采集、管理、建库、分类、标引、权限设置、在线提交、异地备份、自行对外发布等功能,同时使地方数字档案馆和全省档案综合数据管理中心无缝对接。

全省档案信息共享与服务平台是全省档案数据管理中心对外档案信息发布和服务的窗口,实现整合后的文本、图像、音视频、图纸、实物等各种格式档案信息资源的发布和服务。通过权限实现在线检索,在线浏览、在线下载等功能,并提供在线归档、在线管理、最新动态、跨库检索、在线咨询、自动推送、个性化服务等增值服务,为广大用户提供开放、快捷、方便、亲民的全新档案服务模式。信息服务系统可嵌入或链接到“中国知网”、“河南档案信息网”、政务网、“档案界”等网站内。

二是数字档案馆资源共享系统的实现策略

数字档案馆资源共享系统是档案馆实施信息化的一个重要平台,它的应用与实施目标要围绕档案信息化战略思路来总体规划、分步实施、稳步拓展。

充分应用现有共享信息技术策略,创造性地应用现代化信息技术。共享技术基础设计坚持国际标准和国家标准,为未来发展预留空间。

档案信息服务方式创新目的是档案信息用户只需面对一台计算机,就能享受到从咨询、查找到打印、下载、传递等全过程的动态档案信息服务。主要包括:数字档案馆主页服务;档案信息检索服务;档案信息数字咨询服务。

三是档案信息的安全保障策略。

建立具有信息安全防护能力、隐患发现能力、网络应急反应能力和信息对抗能力的信息安全保障体系,提高整体信息安全管理水平,切实保障网络安全和信息安全。它侧重于保护信息的保密性、真实性和完整性,保证网络系统服务的连续性;保证攻击、破坏的可追查性;保证安全管理的可实施性。充分利用认证、访问控制、加密、入侵检测等安全技术,按需求提供多层次的安全保密和防范功能,逐步建立应急处理和数据灾难备份系统,并完善安全管理体系。

第五部分数字档案馆资源共享系统的应用

河南综合档案信息网是把省、市、县档案信息网站和档案信息整合到一个平台上,实现区域内信息资源集中优化。在管理上,通过技术部门专门人员施行分级分层的模块化网站管理模式。网站中频道里面各地区的分级网站栏目的信息,由本单位根据需要自行添加,每个单位的管理员都可以在后台管理自己网站前台的信息,如文字、图片和其他日常使用文件的发布、更新、删除等操作,同时对信息的统计和管理,使得前台内容能够得到及时更新和调整。

项目推广应用:

该项目研究与河南省档案信息网建设相结合,使项目研究成果在河南省档案信息网和河南省数字档案馆建设中得到了充分的应用。

项目的实施产生了巨大的经济效益和社会效益。从经济效益上看:数字档案馆档案信息资源共建共享模式同一平台、统一标准、资源共享,解决各市县馆多头投入,重复建设问题,把有限的资金用在数据的加工。可节省大量的人力、


财力、物力。从社会效益上讲:数字档案馆档案信息资源共享平台建设,形成一个跨平台、跨数据库、跨系统、跨内容、可共享的档案信息资源体系,通过建立统一的资源共享平台,实现数字档案馆档案信息资源的合理组织、优化配置、档案数字资源的集中管理以及档案信息资源的充分利用和效益增值的过程,使其具有集成检索功能,为广大用户提供开放、快捷、方便、亲民的全新档案服务模式。

项目研究成果对全省档案资源共享系统也起到了积极的作用,部分成果也被运用到济源市区域性综合档案管理平台和郑州市的数字档案馆的建设中。

 

 

 

文化名人档案收集保管利用研究

——以李先生档案与实物为例

 

项目基本情况:

该项目是由洛阳理工学院完成的河南省档案局2012年度科技计划项目,项目编号为2012-R-22。该项目获得2014年度河南省档案局优秀科技成果一等奖,项目主要完成人员有韩振英、沈光亮、丁晓琴、高成嘉、张丽昕、王喜凤、王进平、丁建辉。

项目主要成果:

项目完成了工作报告和研究报告,研究报告全文共分7部分,约5万字。同时围绕着项目研究内容项目组成员在《档案管理》、《兰台世界》等档案类核心期刊发表文章3篇,项目组以李凖先生档案资料为基础,建立李先生纪念室。开发建立了李先生信息网站,实现李先生档案信息数字化和网络化,更好地宣传、利用、研究李先生档案信息

项目内容介绍:

该项目研究采用了理论与实践相结合的方法。在理论方面主要在对文化名人档案资料收集、保管和利用理论梳理和国内相关案例分析的基础上,明确了名人档案资料收集、保管和利用的基本方法和注意事项。大体分为4个方面:一是明析文化名人档案涉及的基本概念和理论。详细阐述了名人及名人档案的概念,名人档案的特征、名人档案的社会价值;高校名人档案在教育、文化建设、社会影响所产生的作用以及高校名人档案建设的现状。二是对名人档案的收集展开研究,着重就建档对象的选择、名人档案的收集范围、收集途径、收集要求进行了有针对性的探索。三是对文化名人档案的保管和利用展开研究。提出了名人档案管理的真实完整、系统有序等原则,并对名人档案的保管、利用等相关问题提出了具体的措施方案。四是对名人档案的数字化开发进行了研究。针对名人档案的独特性、实用性提出了在名人档案数字化开发利用的开发设计、与组织实施的相关步骤和措施,并特别提出名人档案的数字化开发要尊重知识产权等。

在实践方面,课题以收集到的513份李先生档案和实物,包括手稿、书法作品、图书、奖章证书、桌椅文具和工艺品,40余份生平简介、年谱、声像资料为蓝本,对李凖先生的档案进行了认真细致的整理。一是分类,从档案的数量、实际状况和方便保管利用的基本要求出发,按载体形式和档案外形特征进行分类,形成了两大门类、八个种类和十二个子类。二是排列,根据收集到的档案类型,结合馆藏利用实际,将手记文稿类按创作形成自然卷排列,书法作品和笔记按形成时间先后顺序排列,图书按出版省别、市别顺序号排列,实物类在子类下逐个进行排列。三是编号,把纸质类编为 ZZ,实物类编为 SW,声像类设备编为 SX。四是整理归档,纸质材料类参照《归档文件整理规则》整理文书档案的方法,分类、排序、编号,以件为单位固定每件的位置后,以专题为单元,多件组柜或悬挂存放。形状、规格特异的实物类档案以单件保存,形状、规格、用途相近的多件组合保管。最后编制出归档(文件)目录。五是将收集到的李凖先生档案资料开辟出专门的库房按照国家档案局有关档案安全保护的管理技术要求设计,突出档案安全保护的“十防”要求,配备专门的空调、安全监控设备、自动报警和灭火设备及管理系统。建成了李先生纪念室,充分发挥李先生档案和实物的社会价值。六是设计制作李先生信息网站和档案数据库,对外开放展览、提供网上宣传。

项目推广应用:

首先项目组将理论研究成果转化为学术论文,其中“李先生档案收集保护利用研究”在《档案管理》发表,“名人档案研究刍议” 和“高校推进文化名人档案建设的实践与思考”在《兰台世界》发表。

课题组将理论研究与现实工作结合,建立了李凖先生纪念室,纪念室位于开元校区图书馆一楼,面积约90平方米。每周五下午向师生开放,并随时接待校外来宾前来参观。纪念室自建成开放以来,先后接待来宾近千人次参观,其中有:原浙江省军区司令员马以芝、郑州大学副校长张倩红、河南省教育工会主席李新江、河南省教育厅思政处处长何秀敏、北京邮电大学出版社社长代根兴等,教育部本科教学合格评估专家组、中原工学院、郑州牧业经济学院、河南爆破学会、河南省高校图书情报学会等领导专家也利用在来校考评、检查、学习、交流、会议期间集体参观了纪念室。学院还组织2013级新生约5000人参观纪念室。

同时项目组还制作李先生信息网站和档案数据库,对外开放展览、提供网上宣传。

 

 

基于布尔关联规则的数据挖掘技术

在数字档案馆中的应用研究

 

项目基本情况:

该项目是由河南牧业经济学院完成的河南省档案局2013年度科技计划项目,项目编号为2013-X-18。该项目获得2014年度河南省档案局优秀科技成果二等奖,项目主要完成人员有刘大宁、韩  慧、王金凤、张晓燕、王  燕、雷  鸣、李红兰

项目主要成果:

项目完成了工作报告和研究报告。同时围绕着项目研究内容项目组成员在《档案管理》、《兰台世界》、《计算机测量与控制》等核心期刊发表文章5篇。

项目内容介绍:

数字档案馆是以信息源、网络、数据库为基础的,其相关技术是较复杂较先进且不断发展的。该项目研究是基于当前数字档案馆的建设中需要研究解决的关键技术——数字挖掘技术中存在的问题而展开的。

在用户关系管理中,通过对档案馆的用户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响档案馆服务效果的关键因素,为档案馆定位、跟踪和定题服务主题的确立,重点用户服务群体的寻求、等决策支持提供参考依据。该项目研究成果提高了用户的检索速率,能根据用户使用的频繁程度智能地、适当的来安排信息档案资源的组织形式,当用户进入系统后,系统根据用户的信息能够自动地对数据库进行检索。项目研究为数字档案馆实现网络信息服务的智能化、个性化、精品化提供了支持工具。基于布尔关联规则的挖掘算法的应用是提出一种基于布尔关联规则挖掘频繁项集的算法。并利用此算法进行关联规则分析,即寻找数据库中数据的相关性。

具体内容如下:

一是项目的研究的对象:即运用基于关联规则的数据挖掘技术,从海量的档案馆的数据库中运用布尔关联规则分析,找出数据库中蕴藏的对于用户管理有用的规则、描述、预测等等,挖掘出潜在的有用信息,为日常档案馆的业务信息的管理提供决策参考。提供对于档案馆资源的布置、用户服务、馆藏目录设置等管理工作的决策支持。

二是项目研究的理论依据及主要技术指标:

1.基于布尔关联规则分析的用户关系管理:通过对档案馆的用户数据库里的大量数据进行挖掘,从大量的记录中发现有趣的关联关系,找出影响档案馆服务效果的关键因素。

2.基于分类、聚类的馆藏资源组织:通过聚类分析把一组数据按照相似性和差异性分为几个类别,使属于同一类别的数据间的相似性尽可能大,不同类别中的数据间相似性尽可能小,根据规则进行馆藏资源组织分类。

3.构建智能检索及特色档案信息库:基于上述基于关联规则的数据挖掘技术,从海量档案信息中按照相关专题进行挖掘、分类、加工、整理和有序化重组,实现智能检索并构建特色档案信息库及各类专题档案信息库等。

三是项目技术指标完成情况:

本项目采用数据挖掘技术进行数字档案馆技术的研究,完成的技术指标如下:

1.确定业务对象:清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步,挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。

2.数据的选择:搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。数据的预处理:研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。数据的转换:将数据转换成一个分析模型。这个分析模型是针对挖掘算法建立的。建立一个真正适合挖掘算法的分析模型。

3.数据挖掘:对所得到的经过转换的数据进行挖掘。除了完善合适的挖掘算法外,其余一切工作都能自动地完成。

4.结果分析:解释并评估结果,用到可视化技术分析数据。

5.知识的同化:将分析所得到的知识集成到业务信息系统的组织结构中。

四是基于布尔关联规则的挖掘算法的应用

提出一种基于布尔关联规则挖掘频繁项集的算法。它的主要思想是利用逐层搜索的迭代方法,来寻找数据库中频繁出现的项集。

该算法的主要步骤是:第一步,产生频繁1-项集L1,扫描数据库D,出现在D中各个数据项的集合组成为1-项候选项集c1,并统计出每个数据项出现的次数,次数大于最小支持计数(预先定义)的项的集合就是频繁1-项集集合L1;依次类推,第k步,产生频繁k-项集Lk,利用上一步产生的频繁(k-1)-项集L(k-1),与自己连接产生k-项集候选集ck,扫描数据库事务集,计算ck中每个成员出现的次数, 将小于最小支持数的候选项删除,最后产生出频繁k-项集。并利用此算法进行关联规则分析,即寻找数据库中数据的相关性。

五是关键问题论证:

1.将布尔关联规则分析应用于用户关系管理

 关联规则是描述数据库中数据项之间所存在的关系的规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。在用户关系管理中,通过对档案馆的用户数据库里的大量数据进行挖掘,可以从大量的记录中发现有趣的关联关系,找出影响档案馆服务效果的关键因素,为档案馆定位、跟踪和定题服务主题的确立,重点用户服务群体的寻求、等决策支持提供参考依据。

2.将分类、聚类应用于用户研究与馆藏资源组织

分类即通过找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,将数据库中的数据项映射到某个给定的类别。用户分类研究包括用户的分类、用户的属性和特征分析、用户满意度分析、用户的信息需求预测等。数字档案馆对不同用户需求进行分类,既可以指导自己的资源的组织,又可以为数字档案馆的建设提供可靠的依据。此外,还可以通过聚类分析把一组数据按照相似性和差异性分为几个类别,使属于同一类别的数据间的相似性尽可能大,不同类别中的数据间相似性尽可能小,应用到用户群体的分类、用户需求背景分析等环节。

上述关键问题及路线是在结构型数据挖掘的技术基础上进行研发,因此技术路线具有可行性。结构型数据挖掘针对的是结构化的数据,即SQL Server 或Oracle 等传统的数据库或数据仓库。与之相对应的技术和方法主要有:统计方法、基于事例的推理、规则推理、关联分析和序列模式算法、神经网络、决策术、遗传算法、可视化技术、模糊集、粗糙集等。数据挖掘主要应用于预测、回归、分类、聚类、关联分析、探索性数据分析、异常检测等方面。

六是存在问题分析与对策

项目研究内容为数字档案馆从理念走向现实提供了有力的技术支持,而数据挖掘的基础工作是数据的可识别性,即数据标准的统一性。由于在我国档案信息化建设过程中标准体系建设的滞后性,致使各种档案信息管理平台、档案管理软件、档案信息元数据、档案数据库结构等兼容性差,数据质量参差不齐,与数据挖掘所需要的高质量数据库的要求相差甚远。因此,档案部门需尽快出台标准体系,按照标准清理优化数据,统一数据库结构。档案工作者可借鉴数据挖掘在其他领域取得的成功经验,研究数据挖掘在数字档案馆建设各个环节中的应用价值,进一步推动数字档案馆建设由理念走向现实。

其次,项目研究的数据挖掘技术的精度仍需提高,即如何使得迭代算法能够在进行关联规则分析时稳定的收敛是仍需要进一步深入探讨的问题,建议采用数理分析方法,提出一种基于参数的优化模型,以此提高算法的鲁棒性。

最后,数字档案馆的安全问题也是需要攻克的重大难题之一。如计算机病毒、网络病毒和计算机黑客。因此如何研发出相应的安全软件措施或者硬件加密措施来保护数字档案的安全性也是亟需研究的课题。

七结语:该项目研究的数据挖掘技术比一般数据库系统提供的检索服务方式也更方便、自然、系统。不仅能够满足科学研究的大型而复杂的课题需要,而且可以满足家庭教育等形式丰富多彩的各种需求,在落实科教兴国的战略方面可以充分发挥档案工作的作用。该项目研究基于数据挖掘方法的数字档案馆技术,是对传统档案管理理念和方式的变革,是先进的管理思想与先进的科学技术结合。

项目推广应用:

本项目研究目前已经在部分院校数字档案管理中开展基础设施建设,相关成果已经在郑州量子伟业有限公司等专业大型数字档案处理公司得到广泛应用,并取得一定的效果。

数据挖掘技术比一般数据库系统提供的检索服务方式也更方便、自然、系统。不仅能够满足科学研究的大型而复杂的课题需要,而且可以满足家庭教育等形式丰富多彩的各种需求,在落实科教兴国的战略方面可以充分发挥档案工作的作用。基于数据挖掘方法的数字档案馆技术,是对传统档案管理理念和方式的重大变革,是先进的管理思想与先进的科学技术结合。主要体现在:

1.档案信息传递网络化

由于数字档案馆是在网上运行的,因此,宽带高速网对档案信息的迅速传递是必不可少的途径和条件。目前,支持数字档案馆的网络技术主要有:局域网技术,Internet技术和Intranet技术。考虑到档案信息不同于图书或其他信息,其传递的范围要受到密级的限制和访问权限的约束以及系统的安全性,因此,在许多场合使用局域网技术和Intranet技术较为稳妥。

2.档案信息空间虚拟化

由于数字档案馆是一个群体概念,是由一个部门、单位乃至一个地域的众多档案馆或信息资源单位组成的联合体,通过网络实现跨库互动查询,达到使用信息的目的,所以从这个角度讲,正是由于网络技术的运用,使得传统意义上的档案馆改变了存在的性质和方式,延伸了传递的途径和条件,拓宽了使用的环境和范围。

3.档案管理自动化

如档案自动编目、检索、档案自动标引、各类档案的借阅管理、统计、报表、档案业务建设活动等。

4.档案智能化服务

数字档案馆提供的科技知识等信息及时、准确、系统,具有较高的权威性和参考价值,比一般数据库系统提供的检索服务方式也更方便、自然、系统。数字档案馆不仅能够满足科学研究的大型而复杂的课题需要,而且可以满足家庭教育等形式丰富多彩的各种需求,在落实科教兴国的战略方面可以充分发挥档案工作的作用。

(整理河南省档案局王建祥)

 

 

 

 


友情链接
地址:郑州市金水路18号 邮政编码:450003 电子邮箱: hndafgc@126.com
版权所有 河南省档案局 豫ICP备11015203号-1