知识组织

连边社团检测算法对共词分析聚类结果的改进研究

  • 孙海生
展开
  • 聊城大学图书馆 聊城 252059
孙海生(ORCID:0000-0002-4513-4307),副研究馆员,硕士,E-mail:sunhaisheng@lcu.edu.cn

收稿日期: 2016-01-27

  修回日期: 2016-04-22

  网络出版日期: 2016-05-20

Study on Improvement of Clustering Results of Co-Word Analysis Based on Link Communities Algorithm

  • Sun Haisheng
Expand
  • Library of Liaocheng University, Liaocheng 252059

Received date: 2016-01-27

  Revised date: 2016-04-22

  Online published: 2016-05-20

摘要

[目的/意义] 传统共词分析的聚类算法存在以下不足:①关键词只能被划归一个聚类;②聚类过程对分类数目的确定缺乏严格判断标准。针对以上问题,采用复杂网络理论进行改进研究。[方法/过程] 采用连边社团检测算法对关键词进行聚类,以科学计量学为例进行实证研究。[结果/结论] 分析结果表明:算法对关键词的聚类结果有较好的改进效果,能够把核心度高的关键词同时划分到不同的研究主题之中,克服传统聚类算法的不足,而且划分密度可为聚类数目的确定提供客观判断依据。

本文引用格式

孙海生 . 连边社团检测算法对共词分析聚类结果的改进研究[J]. 图书情报工作, 2016 , 60(10) : 123 -129 . DOI: 10.13266/j.issn.0252-3116.2016.10.017

Abstract

[Purpose/significance] There are some shortages as follows in the present study on co-word analysis:1) every keyword belonging to only one cluster; 2) lack of strict criteria for determining the number of clusters. Complex network theory is used to solve the above problems.[Method/process] Link communities algorithm is applied to improve result of clustering, and an empirical research of scientometrics is conducted.[Result/conclusion] The results show that the improvement effect on clustering is notable. Key words with high coreness simultaneously belong to several communities, which overcomes the shortages of traditional clustering algorithm. Moreover, partition density provides an objective basis for the determination of the number of clusters.

参考文献

[1] 冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报, 2006(2):88-92.
[2] QIN H. Knowledge discovery through co-word analysis[J].Library trends, 1999,48(1):133-159.
[3] 钟伟金,李佳.共词分析法研究(一)——共词分析的过程与方式[J].情报杂志,2008(5):70-72.
[4] PERSSON O. Bibexcel-co-word analysis[EB/OL].[2012-09-20]. http://www.umu.se/inforsk/Bibexcel.
[5] 钟伟金.共词分析法应用的规范化研究——主题词和关键词的聚类效果对比分析[J].图书情报工作,2011,55(6):114-118.
[6] 杨爱青,马秀峰,张风燕,等.g指数在共词分析主题词选取中的应用研究[J].情报杂志,2012(2):52-55.
[7] 李纲,王忠义.基于语义的共词分析方法研究[J].情报杂志,2011(12):145-149.
[8] 胡昌平,陈果.共词分析中的词语贡献度特征选择研究[J].现代图书情报技术,2013(S1):89-93.
[9] 李纲,李轶.一种基于关键词加权的共词分析方法[J].情报科学, 2011(3):321-324.
[10] 杨彦荣,张阳.加权共词分析法研究[J].情报理论与实践,2011(4):61-63.
[11] 钟伟金,李佳,杨兴菊.共词分析法研究(三)——共词聚类分析法的原理与特点[J].情报杂志,2008(7):118-120.
[12] 薛薇.统计分析教材:SPSS统计分析方法及应用[M].北京:电子工业出版社,2013.
[13] 邵作运,李秀霞.惩罚性矩阵分解及其在共词分析中的应用[J].图书情报工作,2015,59(13):126-133.
[14] 王晓光.科学知识网络的形成与演化(Ⅰ):共词网络方法的提出[J].情报学报,2009,28(4):599-605.
[15] 张斌.共词网络的结构与演化:概念与理论进展.情报杂志[J].2014(7):103-109.
[16] 高继平,丁堃,潘云涛,等.共词网络中连线的重要性分析及其应用[J]. 情报理论与实践,2015(2):79-83.
[17] 冷伏海,王林,李勇.基于文献关键词的三元共词分析方法——以知识发现领域为例[J].情报学报,2011,10(10):1072-1077.
[18] 汪小帆,李翔,陈关荣.网络科学导论[M]. 北京:高等教育出版社,2012.
[19] PALLA G, DERENYI I,FARKAS I,et al. Uncovering the overlapping community structure of complex networks in nature and society[J].Nature,2005,435(7043):814-818.
[20] AHN Y,BAGROW J,LEHMANN S. Link communities reveal multi-scale complexity in networks[J].Nature,2010,466(7307):761-764.
[21] Supplementary information[EB/OL].[2015-10-12]. http://www.nature.com/nature/journal/v466/n7307/full/nature09182.html.
[22] 袁军鹏.科学计量学高级教程[M].北京:科学技术文献出版社,2010.
[23] 孙海生.基于加权网络模型的国际科学合作研究[J].情报杂志,2014(7):91-96.
[24] 蒋盛益,张钰莎,王连喜.数据挖掘基础与应用实例[M].北京:经济科学出版社,2015.
[25] 胡昌平,陈果.科技论文关键词特征及其对共词分析的影响[J].情报学报, 2014, 33(1):23-32.
文章导航

/