理论研究

档案数据化过程中语义组织的内涵、特点与原理解析

  • 祁天娇 ,
  • 冯惠玲
展开
  • 中国人民大学信息资源管理学院 北京 100872
祁天娇(ORCID:0000-0001-5595-4774),博士,博士后,E-mail:qtjjoy@163.com;冯惠玲(ORCID:0000-0003-4800-1259),教授,博士。

收稿日期: 2020-11-13

  修回日期: 2021-02-02

  网络出版日期: 2021-06-02

The Connotation,Characteristics and Principle Analysis of Semantic Organization in the Process of Archival Datalization

  • Qi Tianjiao ,
  • Feng Huiling
Expand
  • School of Information Resource Management, Renmin University of China, Beijing 100872

Received date: 2020-11-13

  Revised date: 2021-02-02

  Online published: 2021-06-02

摘要

[目的/意义] 档案数据化阶段,档案利用与服务需要满足用户在数据层级的需求,突破页面级阅读和文件级利用的限制,这就要求在组织环节构建起语义层级的档案组织新模式,以实现对档案内容、背景与结构数据的细颗粒分析与挖掘,面向档案资源增值、开发与智能化知识服务做好资源、方法与技术的准备。[方法/过程] 采用文献调研与案例分析等方法,立足档案数据化阶段特征,分析档案语义、语义关联和语义组织的基本内涵,比较分析档案与其他信息资源在语义组织过程中的区别与特性,探索在语义完整、链式关联以及网络多维原则下开展档案语义向内组织与向外组织的基本原理。[结果/结论] 档案语义组织是基于数据的含义与关联开展的档案组织新模式,旨在从档案资源的内容、背景与结构数据中发现语义与语义关联。档案语义组织是实现档案数据化的核心环节,是实现档案机器可理解、机器可操作的关键一步。通过档案语义组织,原本离散、分布、领域依赖的档案内容、背景与结构数据能够含义明确化、编码形式化、关系链接化,档案数据得以被机器可理解、可操作,档案自动化关联组织、存储与提供利用成为可能,从而最终支持基于人机交互、机机交互的档案资源智能化获取、利用与服务。

本文引用格式

祁天娇 , 冯惠玲 . 档案数据化过程中语义组织的内涵、特点与原理解析[J]. 图书情报工作, 2021 , 65(9) : 3 -15 . DOI: 10.13266/j.issn.0252-3116.2021.09.001

Abstract

[Purpose/significance] In the stage of archival datalization, archival utilization and service need to meet the new needs on the data level, breaking through the limitation of page level reading and file level using. This requests a new semantic organization mode for archives, supporting deep mining and analysis on the data in archival content, context and structure, to prepare resource, methods and technologies for archival value enrichment, resource development and intelligent knowledge services.[Method/process] Based on the phase characteristics of archival datalization, through literature investigation and cases study, this paper analyzed the basic connotation of archival semantic, semantic relation and semantic organization, compared the differences and features of archival semantic organization with the semantic organization of other information resources, and explored the theoretical framework of archival inward and outward semantic organization under the principles of semantic integrity, chain association and multi-dimensional network.[Result/conclusion] Archival semantic organization is carries out based on the meaning and linkage of data, aimed at finding the semantic relation from the content, background and structure data of archives. The archival semantic organization is the key link to realize the archival datalization and the key step to realize the archival machine-understandable and machine-operable. Through archival semantic organization, the originally scattered, disturbed and field-dependent archival content, background and structure data, could have clear definition, formal expression and associated links. Archival data could be machine-understandable and machine-operable. It is possible for archival resources to be organized, preserved and used automatically with linkages, thus eventually support the intelligent acquisition and utilization of archives based on human-machine and machine-machine interaction.

参考文献

[1] 钱毅.技术变迁环境下档案对象管理空间演化初探[J].档案学通讯,2018(2):10-14.
[2] 赵跃.大数据时代档案数据化的前景展望:意义与困境[J].档案学研究,2019(5):52-60.
[3] Negroponte Nicholas. Being digital[M]. New York:Vintage Books,1996.
[4] 姜浩.数据化由内而外的智能[M].北京:中国传媒大学,2017.
[5] 陶俊. 词表语义组织研究的演进(1998-2018)[J]. 图书情报工作,2018(21):140-148.
[6] 谈国新,侯西龙,庄文杰. 非物质文化遗产多媒体资源语义组织研究[J]. 图书馆学研究, 2017(24):44-54.
[7] 王曰芬,邢梦婷. 面向政府决策需求的社会舆情信息语义组织研究[J]. 现代图书情报技术, 2016, 32(7):21-31.
[8] 马雨萌, 郭进京, 王昉. e-Science环境下科学数据语义组织模型框架研究[J]. 现代图书情报技术, 2015(7):48-57.
[9] 袁艳. 科技报告中的知识发现研究[J]. 图书馆界,2017(5):82-84.
[10] 丁恒, 陆伟. 标准文献知识服务系统设计与实现[J]. 数据分析与知识发现, 2016, 32(7-8):120-128.
[11] 毕传龙.大数据时代民俗文化资源的数字化[J].民族艺术研究,2016(3):87-93.
[12] 马寅源.关联数据应用于档案知识服务的SWOT分析及策略[J].档案与建设,2017(2):17-20.
[13] 裘丽.后保管时代下构建档案知识服务模式探索[J].云南档案,2015(9):52-55.
[14] 林周佳.档案的语义级检索技术研究[J].档案与建设,2007(9):26-27.
[15] 任妍,庞宇飞,荆欣.全媒体档案信息资源语义组织与服务研究[J].档案管理,2019, 237(2):37-38.
[16] 沃尔钦科夫. 苏联档案工作的组织(在1956年12月22日全国档案工作会议上的报告)[J]. 档案工作,1957(2):5-9.
[17] 和宝荣, 陈兆祦, 松世勤. 文书档案工作基本知识讲座(提纲)——第四章档案的整理[J]. 档案工作, 1980(4):27-33.
[18] 周铭. 殊途同归:档案分类法与主题法研究[J]. 四川档案, 2000(1):12-14.
[19] 邓绍兴. 《中国档案分类法》是一部具有我国特色的档案分类法[J]. 北京档案, 1996(9):20-23.
[20] 曾娜. 网络档案信息资源组织研究[J]. 档案学通讯, 2010(1):45-49.
[21] 赵屹. 网络档案信息资源组织方式[J]. 科技文献信息管理, 2003(4):15-19.
[22] 李海军. 档案信息转化为"档案知识"的技术框架探讨[J]. 山西档案, 2007(1):28-30.
[23] 王兰成. 论知识集成环境下的档案信息组织与检索发展[J]. 档案学研究, 2008(5):45-50.
[24] 吕元智. 数字档案资源知识"关联"组织研究[J]. 档案学研究, 2012(6):46-50.
[25] 吕元智. 数字档案资源体系的语义互操作实现研究[J]. 档案学通讯, 2013(5):53-57.
[26] 吕元智. 数字档案资源跨媒体语义检索实现框架与关键问题研究[J]. 档案学研究, 2014(2):65-70.
[27] 吕元智. 数字档案资源跨媒体语义关联聚合实现策略研究[J]. 档案学研究, 2015(5):60-65.
[28] 第十三届国际档案大会文件报告集[C].北京:中国档案出版社,1997.
[29] 梁孟华.基于开放关联数据的数字档案资源跨媒体知识链接研究[J].档案学研究,2015(4):111-116.
[30] 冯惠玲.电子文件管理100问[M].北京:中国人民大学,2014.
[31] 戎军涛.学术文献内容知识元语义描述模型研究[J].情报科学,2019(7):30-35.
[32] 杜協昌,項潔.臺灣歷史數位圖書館[EB/OL].[2021-02-17]. http://doi.org/10.6681/NTURCDH.DB_THDL/Text.
[33] 贺德方,曾建勋.基于语义的馆藏资源深度聚合研究[J].中国图书馆学报,2012, 38(4):79-87.
[34] DURANTI L. The archival bond[J]. Archives and museum informatics, 1997, 11:213-218.
[35] 杜協昌,項潔.臺灣歷史數位圖書館[EB/OL].[2021-02-17].http://thdl.ntu.edu.tw/THDL/RetrieveSVG.php?filename=ntu-2252926-0080500806-0000840.txt.
[36] OLIVER W H. Archival arrangement-Five different operations at five different levels[J]. The American archivist,1964,27(1):21-42.
[37] 张正强,卞刚.现代档案著录的原则与原理[J].中国档案,1999(10):39-41.
[38] ISAD(G):General international standard archival description[S]. Second edition. ICA,1999:36.
[39] 马寅源.国内外档案多级著录的比较研究[J].档案学研究,2017(02):53-58.
[40] DAMA国际.DAMA数据管理知识体系指南[M].DAMA中国分会翻译组,译.北京:机械工业出版社,2020.
[41] National Archives. Citizen archivist dashboard[EB/OL].[2021-02-27]. https://www.archives.gov/citizen-archivist.
[42] Citizen archivist dashboard. Citizen contribution policy[EB/OL].[2021-01-27]. http://www.archives.gov/citizen-archivists/resources/tagging-policy.
[43] ANDREW W. Citizen archivist dashboard/Improving access to historical records through crowdsourcing[EB/OL].[2021-01-27]. https://www.citizenscience.gov/citizen-archivist/#.
[44] MARKUS[EB/OL].[2021-01-27]. https://dh.chinese-empires.eu/markus/beta/.
[45] HUGO M. Europeana semantic enrichment framework[EB/OL].[2021-02-01]. https://docs.google.com/document/d/1JvjrWMTpMIH7WnuieNqcT0zpJAXUPo6x4uMBj1pEx0Y/edit.
[46] HYVÖNEN E, VILJANEN K, TUOMINEN J, et al. Building a national semantic Web ontology and ontology service infrastructure-the FinnONTO approach[A]//The semantic Web:research and applications. Berlin:Springer, 2008:95-109.
[47] WIKIPEDIA. Archives hub[EB/OL].[2021-01-28]. https://en.wikipedia.org/wiki/Archives_Hub.
[48] Linking Lives. About locah[EB/OL].[2021-01-28]. http://linkinglives.archiveshub.ac.uk/about-locah/.
[49] ADRIAN S. Final froduct post:Archives Hub EAD to RDF XSLT stylesheet[EB/OL].[2021-01-28]. http://locah.archiveshub.ac.uk/tag/linkeddata/.
文章导航

/