知识组织

社会科学数据的创建和使用研究——二次匹配数据采集规则的应用

  • 陈欣 ,
  • 曹朝金 ,
  • 叶春森 ,
  • 汪传雷
展开
  • 1. 安徽大学商学院 合肥 230009;
    2. 合肥工业大学管理学院 合肥 230009
陈欣(ORCID:0000-0001-7528-0789),讲师,博士,E-mail:chenxinnju@foxmail.com;曹朝金(ORCID:0000-0003-2683-2051),硕士研究生;叶春森(ORCID:0000-0001-7782-2721),副教授,博士;汪传雷(ORCID:0000-0003-4498-3152),教授,博士。

收稿日期: 2020-09-24

  修回日期: 2021-02-23

  网络出版日期: 2021-06-02

基金资助

本文系国家社会科学基金青年项目"学术大数据环境下社会科学数据开放的影响因素及评价研究"(项目编号:19CTQ029)和安徽高校人文社会科学研究重点项目"安徽省物流科技数据使用现状与对策研究"(项目编号:SK2017A0016)研究成果之一。

Research on Social Science Data Creation and Using——Application of Twice Matching Data Acquisition Rules

  • Chen Xin ,
  • Cao Chaojin ,
  • Ye Chunsen ,
  • Wang Chuanlei
Expand
  • 1. School of Business, Anhui University, Hefei 230009;
    2. School of Management, Hefei University of Technology, Hefei 230009

Received date: 2020-09-24

  Revised date: 2021-02-23

  Online published: 2021-06-02

摘要

[目的/意义] 在数据生命周期框架下,创新性地提出一种从论文中采集社会科学数据创建和使用相关信息的方法,并深入研究其基本情况,为社会科学数据的研究提供新思路。[方法/过程] 以学科交叉性较强的物流研究领域2015-2020年的CSSCI收录的论文为样本,通过迭代式方法构建基于数据生命周期的"泛化-精确关键词词库",采集社会科学数据的相关信息,并结合社会科学数据外部环境信息,对社会科学数据的创建和使用进行全面研究。[结果/结论] 在采集论文中社会科学数据的创建和使用相关信息上,二次匹配数据采集规则具有可行性和高效性,互联网已经成为社会科学研究主要的数据搜集方式,不同研究主题的数据使用偏好不同,对于数据分析工具的使用普及度仍然较低。

本文引用格式

陈欣 , 曹朝金 , 叶春森 , 汪传雷 . 社会科学数据的创建和使用研究——二次匹配数据采集规则的应用[J]. 图书情报工作, 2021 , 65(10) : 90 -104 . DOI: 10.13266/j.issn.0252-3116.2021.10.010

Abstract

[Purpose/significance] Under the framework of the data life cycle, this paper proposes an innovative method for collecting information on the creation and use of social science data from papers, and deeply studies its basic situation, which provides a new idea for the research of social science data. [Method/process] Based on the papers collected by CSSCI from 2015 to 2020 in the field of logistics research with strong interdisciplinary intersection, this paper constructed thesauruses with generalized and accurate keyword based on the data life cycle through iterative method, collected the relevant information of social science data. Then, combined with the external environmental information of social science data, a comprehensive study of the creation and use of social science data has been carried out. [Result/conclusion] The rules is feasible and efficient in collecting information on the creation and use of social science data. Using Internet has become the main data collection method in social science research. Different research topics have different preferences for data use, and the popularity of data analysis tools is still low.

参考文献

[1] PETERS I, KRAKER P, LEX E, et al. Zenodo in the spotlight of traditional and new metrics[J]. Frontiers in research metrics and analytics, 2017,2(13):1-14.
[2] HE L, NAHAR V. Reuse of scientific data in academic publications[J]. Aslib journal of information management, 2016, 68(4):478-494.
[3] 国务院办公厅. 国务院办公厅关于印发科学数据管理办法的通知[EB/OL].[2020-03-20]. http://www.gov.cn/zhengce/content/201804/02/content_5279272.htm.
[4] 孙建军. 大数据时代人文社会科学如何发展[N]. 光明日报, 2014-07-07(11).
[5] 夏义堃. 人文社会科学数据管理的现实困境与对策分析[J]. 情报科学,2020, 38(9):14-22.
[6] BOLIKOWSKI L, HOUSSOS N, MANGHI P, et al. Data as "first-class citizens"[EB/OL].[2020-08-13]. http://www.dlib.org/dlib/januaryl5/01guest_editorial.html.
[7] NASA. Data & information policy[EB/OL].[2021-01-23]. http://science.nasa.gov/earth-science/earth-science-data/data-information-policy/.
[8] BBSRC. BBSRC data sharing policy[EB/OL].[2021-01-23]. http://www.bbsrc.ac.uk/about/policies/policy-foi/policy/data-sharing-policy/.
[9] 李志芳, 邓仲华. 国内开放科学数据的分布及其特点分析[J]. 情报科学, 2015, 33(3):45-49.
[10] 罗鹏程, 崔海媛, 赵静茹. 基于DataCite的科学数据现状特征研究[J]. 图书情报知识, 2019(3):101-112, 80.
[11] 孟祥保, 钱鹏. 数据生命周期视角下人文社会科学数据特征研究[J]. 图书情报知识, 2017(1):76-88.
[12] 沈婷婷. 人文社科领域科学数据使用特征分析——基于《中国社会科学》样本论文的实证研究[J]. 大学图书馆学报, 2015, 33(3):101-107.
[13] MEADOWS A. To share or not to share? That is the (research data) question[EB/OL].[2020-05-21]. http://scholarlykitchen.sspnet.org/2014/11/11/to-shareor-not-to-share-that-is-the-research-data-question.
[14] 谭春林, 刘清海. 期刊编辑发表论文情况的文本挖掘与分析[J]. 编辑学报, 2019, 31(4):407-410.
[15] 张娜, 柳运昌, 王若男. 基于文本情感分析的社交媒体数据挖掘[J]. 河南城建学院学报, 2019, 28(5):74-79.
[16] 刘玉林, 菅利荣. 基于文本情感分析的电商在线评论数据挖掘[J]. 统计与信息论坛, 2018, 33(12):119-124.
[17] 任恒. 国内智库研究的知识图谱:现状、热点及趋势——基于CSSCI期刊(1998-2016)的文献计量分析[J]. 情报科学, 2018, 36(9):159-166.
[18] 冯亚飞, 胡昌平, 李霜双. 国内学术资源研究的知识图谱与热点主题[J]. 情报科学, 2019, 37(10):3-7, 19.
[19] 俞立平, 王冰, 张再杰. 历时扩散因子与历时相对扩散因子的应用研究——以CSSCI图书馆情报与文献学期刊为例[J]. 情报杂志, 2020, 39(3):156-162.
[20] 师荣华, 刘细文. 基于数据生命周期的图书馆科学数据服务研究[J]. 图书情报工作, 2011,55(1):39-42.
[21] 丁宁, 马浩琴. 国外高校科学数据生命周期管理模型比较研究及借鉴[J]. 图书情报工作, 2013, 57(6):18-22.
[22] 武彤. 基于数据生命周期的美国研究图书馆科学数据开放共享服务研究[J]. 图书与情报, 2019(1):135-144.
[23] CEOS. Data life cycle models and concepts[EB/OL].[2020-04-21]. http://www2.lib.virginia.edu/brown/data/.
[24] STARR J, WILLETT P, FEDERER P, et al. A collaborative framework for data management services:the experience of the university of California[EB/OL].[2020-05-17]. https://escholarship.umassmed.edu/cgi/viewcontent.cgi?article=1014&context=jeslib.
[25] POUCHARD L. Revisiting the data lifecycle with big data curation[J]. International journal of digital curation, 2016, 10(2):176-192.
[26] DCC. Curation lifecycle model[EB/OL].[2020-07-12]. http://www.dcc.ac.uk/resources/curation-lifecycle-mode.
[27] UKDA. Research data lifecycle[EB/OL].[2020-07-12]. http://www.data-archive.ac.uk/create-manage/life-cycle.
[28] 刘敏娟, 张学福, 颜蕴. 基于核心词、突变词与新生词的学科主题演化方法研究[J]. 情报杂志, 2016, 35(12):175-180.
[29] 肖明, 陈嘉勇, 李国俊. 基于CiteSpace研究科学知识图谱的可视化分析[J]. 图书情报工作, 2011, 55(6):91-95.
[30] 侯剑华, 胡志刚. CiteSpace软件应用研究的回顾与展望[J]. 现代情报, 2013, 33(4):99-103.
[31] 陈悦, 陈超美, 刘则渊, 等. CiteSpace知识图谱的方法论功能[J]. 科学学研究, 2015, 33(2):242-253.
[32] 王发明, 朱美娟. 国内区块链研究热点的文献计量分析[J]. 情报杂志, 2017, 36(12):69-74, 28.
[33] 陈悦, 陈超美, 胡志刚, 等. 引文空间分析原理与应用CiteSpace实用指南[M]. 北京:科学出版社, 2014.
[34] HOX J J, BOEIJE H R. Data collection, primary vs. secondary[J]. Encyclopedia of social measurement, 2005, 1:593-599.
[35] 李华杰,史丹,马丽梅.基于大数据方法的经济研究:前沿进展与研究综述[J].经济学家, 2018(6):96-104.
[36] 章成志, 张颖怡. 基于学术论文全文的研究方法实体自动识别研究[J]. 情报学报, 2020, 39(6):589-600.
[37] 王芳, 王向女. 我国情报学研究方法的计量分析:以1999~2008年《情报学报》为例[J]. 情报学报, 2010, 29(4):652-662.
文章导航

/