图书情报工作 ›› 2014, Vol. 58 ›› Issue (23): 136-142.DOI: 10.13266/j.issn.0252-3116.2014.23.021

• 知识组织 • 上一篇    下一篇

基于中文维基百科的领域概念相关性研究

王娟1,2, 曹树金1 姜灵敏2 胡青3   

  1. 1. 中山大学资讯管理学院;
    2. 广东外语外贸大学思科信息学院;
    3. 大连海事大学信息科学技术学院
  • 收稿日期:2014-10-10 修回日期:2014-11-20 出版日期:2014-12-05 发布日期:2014-12-05
  • 作者简介:王娟, 广东外语外贸大学思科信息学院副教授, E-mail:misisipiwj@126.com;曹树金, 中山大学资讯管理学院院长, 博士生导师;姜灵敏, 广东外语外贸大学思科信息学院院长, 硕士生导师;胡青, 大连海事大学信息科学技术学院讲师.
  • 基金资助:

    本文系国家社会科学基金重大项目"基于特定领域的网络资源知识组织与导航机制研究"(项目编号:12&ZD222)和教育部人文社会科学研究青年基金项目"面向轻博客热点话题情感倾向性分析的研究"(项目编号:12YJC870023)研究成果之一.

Research on Semantic Relatedness of Domain-specific Concepts Based on Chinese Wikipedia

Wang Juan1,2, Cao Shujin1, Jiang Lingmin2, Hu Qing3   

  1. 1. School of Information Management, Sun Yat-Sen University, Guangzhou 510275;
    2. Cisco School of Informatics, Guangdong University of Foreign Studies, Guangzhou 510420;
    3. Computer Science Fundamentals Lab of Information Science and Technology College, Dalian Maritime University, Dalian 116026
  • Received:2014-10-10 Revised:2014-11-20 Online:2014-12-05 Published:2014-12-05

摘要:

以提高领域概念相关性判断的准确度为研究宗旨, 提出综合利用中文维基百科的分类体系结构和概念释义内容进行概念间语义相关度计算的方法.选取中文维基百科分类体系下的图书情报领域的概念为实验对象, 将基于分类信息和文本信息的加权算法与单独基于分类信息的语义距离算法和信息量算法, 以及基于文本信息的文本重叠算法进行对比分析.实验结果表明:加权算法能取得更好的效果, 可为实现面向领域的信息检索、领域本体构建等应用提供重要技术支持.

关键词: 中文维基百科, 领域概念, 语义相关性, 语义关系

Abstract:

In order to improve the accuracy of computing the relatedness of the domain-specific concepts, this paper proposes a new semantic relatedness algorithm using Chinese Wikipedia category architecture and concept interpretation content. The concepts in library and information science in concept-hierarchy of Chinese Wikipedia are taken as experiment objects, and weighted algorithm based on category and text information are compared with other algorithms only based on Chinese Wikipedia category like Relwup and Relseco or on Chinese Wikipedia article like Relstr. The experimental results show that the weighted algorithm is better than the others, and provide important technical support for application such as domain-oriented information retrieval, construction of domain ontology and so on.

Key words: Chinese Wikipedia, domain-specific concept, semantic relatedness, semantic relation

中图分类号: