情报研究

多词共现分析方法的实现及其在研究热点识别中的应用

  • 高继平 ,
  • 丁堃 ,
  • 潘云涛 ,
  • 袁军鹏
展开
  • 1. 中国科学技术信息研究所;
    2. 大连理工大学科学学与科技管理研究所(WISE LAB)
高继平,中国科学技术信息研究所助理研究员,博士,E-mail:gaojp@istic.ac.cn;丁堃,大连理工大学科学学与科技管理研究所(WISELAB)教授;潘云涛,中国科学技术信息研究所研究员,硕士;袁军鹏,中国科学院技术信息研究所研究员,博士.

收稿日期: 2014-10-29

  修回日期: 2014-12-05

  网络出版日期: 2014-12-20

基金资助

本文系"863"计划课题"以科技文献服务为主的搜索引擎研制"(项目编号:2011AA01A206)和中国科学技术信息研究所所内预研项目"基于论文引用专利的技术对科学的影响分析——以CSTPCD数据库为例"(项目编号:YY-201430)研究成果之一.

Implementation of Multiple Words Co-occurrence Analysis and its Application in the Recognition of Research Hotspots

  • Gao Jiping ,
  • Ding Kun ,
  • Pan Yuntao ,
  • Yuan Junpeng
Expand
  • 1. The Institute of Scientific and Technical Information of China, Beijing 100038;
    2. WISE LAB in Dalian University of Technology, Dalian 116024

Received date: 2014-10-29

  Revised date: 2014-12-05

  Online published: 2014-12-20

摘要

在当前词共现分析多关注两词共现分析的基础上,提出多词共现分析方法,并采用关联规则挖掘中的频繁项集抽取法,实现多词共现的抽取和与分析.以我国国家知识产权局专利数据库(SIPOD)中数字信息的传输领域(H04L)为例,抽取和深入分析该领域中词最多的多词集合和频数最大的多词集合.最后,结合当前文献计量学中研究热点的定义与识别,应用多词共现分析方法发现H04L领域中的6个研究热点,进而对这6个研究热点中的部分代表性专利文献进行介绍.

本文引用格式

高继平 , 丁堃 , 潘云涛 , 袁军鹏 . 多词共现分析方法的实现及其在研究热点识别中的应用[J]. 图书情报工作, 2014 , 58(24) : 80 -85,98 . DOI: 10.13266/j.issn.0252-3116.2014.24.013

Abstract

The co-word analysis pays more attention to the two words co-occurrence analysis,the paper proposes multiple words co-occurrence analysis.Based on the frequent item extraction method in the association rule mining,it achieves extraction and analysis of the co-occurrence of multiple words.Taking the field of digital information transmission (HO4L) in the State Intellectual Property Office Database (SIPOD) for example,this paper exacts and deeply analyzes its most frequent words set and the longest words set.At last,based on the analysis and review on the current research hotspots in the bibliometrics,it finds that the six research hotspots in the field of HO4L.The paper introduces part of representative patents on 6 hotspots.

参考文献

[1] Callon M, Law J, Rip A.Mapping out the dynamics of science and technology: Sociology of science in the real world[M].London: Macmillan, 1986.
[2] Callon M, Courtial J, Turner W A, et al.From translations to problematic networks: An introduction to co-word analysis[J].Social Science Information, 1983, 22(2): 191-235.
[3] 滕立, 沈君, 高继平.共词知识网络中的认知结构: 理论, 方法与实证[J].情报学报, 2013, 32(9): 976-989.
[4] He Qin.Knowledge discovery through co-word analysis.[J].Library Trends, 1999, 48(1): 133-159.
[5] 沈君, 王续琨, 高继平, 等.技术坐标视角下的主题分析——以第三代移动通信技术为例[J].情报学报, 2012, 31(6): 603-611.
[6] 王晓光.科学知识网络的形成与演化 (Ⅱ): 共词网络可视化与增长动力学[J].情报学报, 2010(2): 314-322.
[7] 许振亮, 刘则渊, 侯海燕, 等.中国技术创新理论研究前沿共词知识图谱分析[J].图书情报工作, 2009, 53(6): 46-50.
[8] 王众托, 王志平.超网络初探[J].管理学报, 2008, 5(1): 1-8.
[9] 李树青.基于三词共现分析的学者主要研究兴趣识别及个性化外文推荐服务的实现[J].情报学报, 2013, 32(6): 629-639.
[10] 庞弘燊, 方曙, 范炜, 等.基于多重共现的机构科研状况分析方法研究——以中科院国家科学图书馆为例[J].情报学报, 2012, 31(11): 1140-1152.
[11] 刘志辉, 郑彦宁.基于作者关键词耦合分析的研究专业识别方法研究[J].情报学报, 2013, 32(8): 788-796.
[12] Tseng Yuen-Hsien.Automatic thesaurus generation for Chinese documents[J].Journal of the American Society for Information Science and Technology, 2002, 53(13): 1130-1138.
[13] 高继平, 丁堃.基于专利文件知识结构的中文专利知识单元挖掘[J].情报理论与实践, 2011, 34(6): 83-86.
[14] 骆云中, 陈蔚杰, 徐晓琳.专利情报分析与利用[M].上海: 华东理工大学出版社, 2007.
[15] 王星, 张波.基于加权网随机区块模型的学术热点提取算法[J].统计研究, 2013(3): 86-93.
[16] 董坤, 吴红.基于论文-专利整合的3D打印技术研究热点分析[J].情报杂志, 2014(11): 73-76.
[17] 唐琳.从硕士、博士学位论文看北京大学人文地理学研究热点和发展趋势[J].图书情报工作, 2013, 57(S2): 218-223.
[18] 王伟军, 官思发, 李亚芳.知识共享研究热点与前沿的可视化分析[J].图书情报知识, 2012(1): 115-123.
[19] 宗乾进, 袁勤俭, 沈洪洲.国外社交网络研究热点与前沿[J].图书情报知识, 2012(6): 68-75.
[20] 赵蓉英, 王静.社会网络分析 (SNA) 研究热点与前沿的可视化分析[J].图书情报知识, 2011(1): 88-94.
[21] 高继平, 丁堃.专利研究文献的可视化分析[J].情报杂志, 2009(7): 12-16.

文章导航

/