图书情报工作 ›› 2018, Vol. 62 ›› Issue (2): 135-143.DOI: 10.13266/j.issn.0252-3116.2018.02.018

• 知识组织 • 上一篇    下一篇

科技论文的研究设计指纹自动识别方法构建与实现

钱力1, 张晓林1, 王茜2   

  1. 1. 中国科学院文献情报中心 北京 100190;
    2. 中国医学科学院医学信息研究所图书馆 北京 100005
  • 收稿日期:2017-08-30 修回日期:2017-11-14 出版日期:2018-01-20 发布日期:2018-01-20
  • 作者简介:钱力(ORCID:0000-0002-0931-2882),信息系统与知识计算中心主任,副研究馆员,硕士生导师,Email:qianl@mail.las.ac.cn;张晓林(ORCID:0000-0001-8891-8366),研究员,博士生导师;王茜(ORCID:0000-0002-8629-8199),馆员,博士。
  • 基金资助:
    本文系中国科学院文献情报能力建设专项"科技论文的研究设计指纹自动语义标注工具研发"(项目编号:院1658)研究成果之一。

Building and Implement on Automatic Identification Method of Research Design Fingerprint of Scientific Papers

Qian Li1, Zhang Xiaolin1, Wang Qian2   

  1. 1. National Science Library, Chinese Academy of Sciences, Beijing 100190;
    2. Institute of Medical Information/Medical Library, CAMS & PUMC, Beijing 100005
  • Received:2017-08-30 Revised:2017-11-14 Online:2018-01-20 Published:2018-01-20

摘要: [目的/意义]从科技论文中自动识别与抽取研究设计指纹,能够为科研人员项目设计、研究方法的有效性评估、研究过程问题诊断、研究结果鉴别与评价提供重要的方法论和研究操作支撑。[方法/过程]基于科技论文研究设计指纹的概念模型,提出基于多规则模式混合机器学习方法,设计并实现指纹识别算法,并以数据挖掘领域的期刊文献数据为例,对识别算法的可行性与有效性进行分析验证。[结果/结论]除研究数据与研究趋势外,其他研究设计指纹识别准确率的认可度都基本达到80%以上,覆盖率的认可度,除研究工具与研究数据外,基本达到80%以上。

关键词: 研究设计指纹, 语义标注知识抽取, 机器学习

Abstract: [Purpose/significance] Automatic identification and extraction of research design fingerprint from scientific papers is able to provide researchers with significant methodology and research support for project design, validity evaluation of research methods, problem diagnosis of research process and identification and evaluation of research results.[Method/process]The paper, based on the concept model of research design fingerprint in scientific papers, proposes amulti-rule hybrid machine learning methods to design and implement the fingerprint identification algorithm model and analyze and verify the feasibility and validity of the methodby sample data in the field of datamining.[Result/conclusion] The results show that in addition to the research data and research trends, the recognition accuracy of other research design fingerprint is almost 80%. And the acceptance of coverage, in addition to research tools and research data, is almost 80%.

Key words: research design fingerprint, semantic annotation knowledge extraction, machine learning

中图分类号: