图书情报工作 ›› 2013, Vol. 57 ›› Issue (22): 126-131,147.DOI: 10.7536/j.issn.0252-3116.2013.22.020

• 知识组织 • 上一篇    下一篇

语法规则和改进关联规则的中文文本非等级关系提取研究

余凡1, 程虹1, 楼雯2   

  1. 1. 武汉大学质量发展战略研究院;
    2. 武汉大学信息管理学院
  • 收稿日期:2013-09-23 修回日期:2013-11-01 出版日期:2013-11-20 发布日期:2013-11-20
  • 作者简介:余凡,武汉大学质量发展战略研究院博士后,E-mail:yufan_22@126.com;程虹,武汉大学质量发展战略研究院院长,教授,博士生导师;楼雯,武汉大学信息管理学院博士研究生。
  • 基金资助:

    本文系国家社会科学基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”(项目编号:11&ZD152)和国家社会科学基金重大项目“我国质量安全评价与网络预警方法研究”(项目编号:11&ZD158)研究成果之一。

Non-hierarchical Relations Extraction of Chinese Texts Based on Grammar Rules and Improved Association Rules

Yu Fan1, Cheng Hong1, Lou Wen2   

  1. 1. Wuhan University Institute of Quality Development Strategy, Wuhan 430072;
    2. School of Information Management, Wuhan University, Wuhan 430072
  • Received:2013-09-23 Revised:2013-11-01 Online:2013-11-20 Published:2013-11-20

摘要:

针对目前适用于中文文本非等级关系提取方法偏少以及关联规则筛选方法忽略了集中出现在部分文本集中的领域词汇关系的问题,通过对中文文本的统计分析,尝试定义一套中文非等级关系提取的规则,同时提出一种加入平均值变量的改进的关联规则。实践证明,基于自定义的语法规则提取方法能够有效地从中文文本中提取出主、谓、宾语,进而提取出非等级关系,改进的关联规则方法能够提取出集中出现在部分文本集中的领域词汇非等级关系。

关键词: 非等级关系提取, 语法规则, 关联规则, 中文文本

Abstract:

There is lack of non-hierarchical relations extraction suitable for Chinese texts. Association Rules do not effectively extract vocabulary relations concentrated in part of the text. This paper defines a set of non-hierarchical relations extraction rules of Chinese texts and an improved association rules based on average value. The practical results show that non-hierarchical relations extraction rules of Chinese texts can efficiently extract subject, predicate and object in Chinese texts, and form the non-hierarchical relations. Improved association rules can extract non-hierarchical relations of the vocabulary concentrated in part of the text.

Key words: non-hierarchical relations extraction, grammar rule, association rule, Chinese text

中图分类号: