图书情报工作 ›› 2021, Vol. 65 ›› Issue (10): 90-104.DOI: 10.13266/j.issn.0252-3116.2021.10.010

• 知识组织 • 上一篇    下一篇

社会科学数据的创建和使用研究——二次匹配数据采集规则的应用

陈欣1, 曹朝金2, 叶春森1, 汪传雷1   

  1. 1. 安徽大学商学院 合肥 230009;
    2. 合肥工业大学管理学院 合肥 230009
  • 收稿日期:2020-09-24 修回日期:2021-02-23 出版日期:2021-05-20 发布日期:2021-06-02
  • 作者简介:陈欣(ORCID:0000-0001-7528-0789),讲师,博士,E-mail:chenxinnju@foxmail.com;曹朝金(ORCID:0000-0003-2683-2051),硕士研究生;叶春森(ORCID:0000-0001-7782-2721),副教授,博士;汪传雷(ORCID:0000-0003-4498-3152),教授,博士。
  • 基金资助:
    本文系国家社会科学基金青年项目"学术大数据环境下社会科学数据开放的影响因素及评价研究"(项目编号:19CTQ029)和安徽高校人文社会科学研究重点项目"安徽省物流科技数据使用现状与对策研究"(项目编号:SK2017A0016)研究成果之一。

Research on Social Science Data Creation and Using——Application of Twice Matching Data Acquisition Rules

Chen Xin1, Cao Chaojin2, Ye Chunsen1, Wang Chuanlei1   

  1. 1. School of Business, Anhui University, Hefei 230009;
    2. School of Management, Hefei University of Technology, Hefei 230009
  • Received:2020-09-24 Revised:2021-02-23 Online:2021-05-20 Published:2021-06-02

摘要: [目的/意义] 在数据生命周期框架下,创新性地提出一种从论文中采集社会科学数据创建和使用相关信息的方法,并深入研究其基本情况,为社会科学数据的研究提供新思路。[方法/过程] 以学科交叉性较强的物流研究领域2015-2020年的CSSCI收录的论文为样本,通过迭代式方法构建基于数据生命周期的"泛化-精确关键词词库",采集社会科学数据的相关信息,并结合社会科学数据外部环境信息,对社会科学数据的创建和使用进行全面研究。[结果/结论] 在采集论文中社会科学数据的创建和使用相关信息上,二次匹配数据采集规则具有可行性和高效性,互联网已经成为社会科学研究主要的数据搜集方式,不同研究主题的数据使用偏好不同,对于数据分析工具的使用普及度仍然较低。

关键词: 社会科学数据, 泛化-精确词库, 二次匹配数据采集规则, Python, 文献计量

Abstract: [Purpose/significance] Under the framework of the data life cycle, this paper proposes an innovative method for collecting information on the creation and use of social science data from papers, and deeply studies its basic situation, which provides a new idea for the research of social science data. [Method/process] Based on the papers collected by CSSCI from 2015 to 2020 in the field of logistics research with strong interdisciplinary intersection, this paper constructed thesauruses with generalized and accurate keyword based on the data life cycle through iterative method, collected the relevant information of social science data. Then, combined with the external environmental information of social science data, a comprehensive study of the creation and use of social science data has been carried out. [Result/conclusion] The rules is feasible and efficient in collecting information on the creation and use of social science data. Using Internet has become the main data collection method in social science research. Different research topics have different preferences for data use, and the popularity of data analysis tools is still low.

Key words: social scientific data, generalized-accurate thesaurus, twice matching data acquisition rules, Python, bibliometrics

中图分类号: