纪念中国科学院文献情报中心成立70周年专辑

面向智慧知识服务的科技文献大数据体系建设

  • 吴振新 ,
  • 钱力 ,
  • 谢靖 ,
  • 常志军 ,
  • 许丽媛 ,
  • 赵艳
展开
  • 1. 中国科学院文献情报中心 北京 100190;
    2. 中国科学院大学经济与管理学院图书情报与档案管理系 北京 100190
吴振新(ORCID:0000-0003-4966-1961),研究馆员,博士生导师,;钱力(ORCID:0000-0002-0931-2882),研究馆员,硕士生导师;谢靖(ORCID:0000-0001-6698-1786),副研究馆员,硕士生导师;常志军(ORCID:0000-0001-9211-8599),副研究馆员,硕士生导师;赵艳(ORCID:0000-0002-0515-1954),研究馆员,博士,硕士生导师。

收稿日期: 2020-11-05

  修回日期: 2020-12-20

  网络出版日期: 2020-12-20

基金资助

本文受"中国科学院文献情报中心成立七十周年主题论坛与纪念文集出版"项目资助出版。

Construction of Sci-Tech Big Data System oriented to Intelligent Knowledge Service

  • Wu Zhenxin ,
  • Qian Li ,
  • Xie Jing ,
  • Chang Zhijun ,
  • Xu Liyuan ,
  • Zhao Yan
Expand
  • 1. National Science Library, Chinese Academy Sciences, Beijing 100190;
    2. Department of Library, Information and Archives Management, School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190

Received date: 2020-11-05

  Revised date: 2020-12-20

  Online published: 2020-12-20

摘要

[目的/意义] 探索构建文献情报大数据知识资源体系,支撑面向多领域的智慧知识服务。[方法/过程] 基于AI应用需求,借鉴业界经验,梳理现有资源体系的问题,从多层次多维度扩展资源体系;构建可靠数据处理流程和计算平台,支持高效数据采集和处理;研发智能化数据治理工具,实现知识资源的有效治理,确保提供高质量数据资源。[结果/结论] 已初步形成覆盖多类型、多学科的科技文献大数据知识资源体系,构建完成高度自动化的数据采集治理流程,实施多重数据质量控制,积累数亿高质量数据,且为多个知识服务提供数据支撑。

本文引用格式

吴振新 , 钱力 , 谢靖 , 常志军 , 许丽媛 , 赵艳 . 面向智慧知识服务的科技文献大数据体系建设[J]. 图书情报工作, 2020 , 64(24) : 63 -72 . DOI: 10.13266/j.issn.0252-3116.2020.24.008

Abstract

[Purpose/significance] The paper explores the construction of literature intelligence big data knowledge resource system, which supports multi-domain intelligent knowledge service.[Method/process] Based on the AI application requirements, drawing on the industry experience, combing the problems of existing resource system, the paper expanded the resource system from multi-level and multi-dimensional, built a reliable data processing process and computing platform to support efficient data collection and processing, and developed intelligent data governance tools to achieve effective governance of knowledge resources and ensure the provision of high-quality data resources.[Result/conclusion] It has initially formed a knowledge resource system covering multiple types and disciplines of sci-tech literature, constructed and completed a highly automated data collection and governance process, implemented multiple data quality control, and accumulated hundreds of millions of high-quality data. At present, it has provided data support for multiple knowledge services.

参考文献

[1] 人工智能那么火~如今AI的应用场景都有哪些?[EB/OL].[2020-11-16]. https://www.zhihu.com/question/282715644.
[2] The AI Hierarchy of Needs[EB/OL].[2020-11-16]. https://hackernoon.com/the-ai-hierarchy-of-needs-18f111fcc007.
[3] AIBigbull2050. 人工智能三驾马车:算法,算力,算据[EB/OL].[2020-11-16]. http://blog.itpub.net/69946223/viewspace-2734390.
[4] 刘琳. 新基建热潮下,AI基础数据服务会有哪些变化?[EB/OL].[2020-06-03]. https://www.leiphone.com/news/202006/WNW3OH7baaG0RBi5.html.
[5] 钱力, 张晓林, 王茜. 基于科技文献的研究设计指纹描述框架研究[J]. 大学图书馆学报, 2015, 33(1):14-20.
[6] 柯平,邹金汇. 后知识服务时代的图书馆转型[J]. 中国图书馆学报, 2019,45(1):4-17.
[7] Research Intelligence[EB/OL].[2020-10-06]. https://www.elsevier.com/research-intelligence.
[8] Digital Science[EB/OL].[2020-10-06]. https://www.digital-science.com.
[9] Wizdom.ai[EB/OL].[2020-10-06]. https://www.wizdom.ai/#about.
[10] arXiv[EB/OL].[2020-10-06]. https://arxiv.org.
[11] Pubmed[EB/OL].[2020-10-06]. https://www.ncbi.nlm.nih.gov/pubmed.
[12] STKOS科技知识组织体系共享服务系统[EB/OL].[2020-10-06]. http://stkos.las.ac.cn/stkosservice/user/welcome.htm.
[13] iAuthor中国科学家在线[EB/OL].[2020-10-08]. http://iauthor.cn/welcome/index.
[14] 中国科学院机构知识库网格[EB/OL].[2020-10-08]. http://www.irgrid.ac.cn.
[15] NSTL统一文献元数据标准3.0[EB/OL].[2020-10-08]. http://spec.nstl.gov.cn/embed/home.htm.
[16] SciFire基于群体智能的知识服务平台[EB/OL].[2020-10-08]. http://159.226.100.96/bi/bi.html.
[17] 中华人民共和国教育部网站提供的中国高等院校的名单[EB/OL].[2020-10-08]. http://www.moe.gov.cn/srcsite/A03/moe_634/201706/t20170614_306900.html.
[18] DBPedia的全球大学数据[EB/OL].[2020-10-08]. https://wiki.dbpedia.org/develop/datasets.
[19] 中国科学家在线[EB/OL].[2020-10-08]. https://iauthor.cn.
[20] 中国科学院文献情报中心中国科学院知识服务平台[EB/OL].[2020-10-08]. https://www.las.ac.cn.
[21] 科技大数据知识发现平台[EB/OL].[2020-10-10]. https://scholareye.cn/.
[22] 慧科研个人版智能随身科研助理[EB/OL].[2020-10-10]. https://scholarin.cn/.
[23] 中国科学院文献情报中心数据观测平台[EB/OL].[2020-10-10]. http://kgview.las.ac.cn.
[24] 中国科学院文献情报中心中国科学院知识服务平台数据服务[EB/OL].[2020-10-10]. https://www.las.ac.cn/front/dataCenter/dataResources.
[25] 慧科研机构版机构知识管理与分析服务平台[EB/OL].[2020-10-10]. https://inst.scholarin.cn/.
文章导航

/