图书情报工作 ›› 2019, Vol. 63 ›› Issue (16): 112-120.DOI: 10.13266/j.issn.0252-3116.2019.16.012

• 知识组织 • 上一篇    下一篇

中文超声文本结构化与知识网络构建方法研究

尚小溥1, 许吴环1, 赵红梅1,2, 张润彤1, 朱燊1   

  1. 1. 北京交通大学经济管理学院信息管理系 北京 100044;
    2. 北京大学人民医院 北京 100044
  • 收稿日期:2018-11-20 修回日期:2019-03-22 出版日期:2019-08-20 发布日期:2019-08-20
  • 作者简介:尚小溥(ORCID:0000-0002-7872-5744),讲师,博士,E-mail:sxp@bjtu.edu.cn;许吴环(ORCID:0000-0003-2621-7913),硕士研究生;赵红梅(ORCID:0000-0001-6880-3342),副研究员,硕士;张润彤(ORCID:0000-0003-0246-5058),系主任,教授,博士;朱燊(ORCID:0000-0002-5802-8132),本科。
  • 基金资助:
    本文系国家自然科学基金项目"面向临床决策辅助的电子病历文本结构化方法与知识挖掘研究"(项目编号:61702033)和教育部人文社科项目"基于电子病历文本的临床知识挖掘研究"(项目编号:17YJC870015)研究成果之一。

Research on Structure and Knowledge Network Construction of Chinese Ultrasonic Text

Shang Xiaopu1, Xu Wuhuan1, Zhao Hongmei1,2, Zhang Runtong1, Zhu Shen1   

  1. 1. Department of Information Management, School of Economic Management, Beijing Jiaotong University, Beijing 100044;
    2. Peking University People's Hospital, Beijing 100044
  • Received:2018-11-20 Revised:2019-03-22 Online:2019-08-20 Published:2019-08-20

摘要: [目的/意义]超声检查是判断患者病情的重要依据,目前主要检查数据是以文本形式存在。本文提出一种基于超声检查数据的文本结构化和知识网络构建方法,为进一步挖掘临床知识奠定数据基础。[方法/过程]对自然语言处理技术在超声文本环境下的应用进行改进,包括分词处理、内容定位、结构化识别三个主要步骤,实现对超声文本的切分与标记,并且在此基础上建立其结构化知识网络。[结果/结论]真实数据测试结果显示,本文提出的面向超声检查文本的结构化方法具有较好的性能表现。该方法可以实现对批量超声文本结构化网络的自动构建,能够反映超声文本中结构化内容的层次关系与属性结构等潜在知识。

关键词: 超声文本, 自然语言处理, 文本结构化, 知识网络

Abstract: [Purpose/significance] Ultrasound examination is an important basis for diagnosis, but the major examination data is in the form of text. So, based these data, this paper studies a method that can automatically structure natural language texts and construct knowledge network, which lays the data foundation for further mining clinical knowledge hidden in EMR.[Method/process] This paper improved the application of natural language processing technology in ultrasonic, including three main steps:segmentation processing, content location and structured recognition, to realize the segmentation and labeling of ultrasonic text, and on this basis, the ultrasound examination knowledge network was established.[Result/conclusion] The test results of real data show that the method for structuring ultrasound texts proposed in this paper has better performance. This method can realize the automatic construction of knowledge network of batch ultrasound texts, and can reflect the potential knowledge of hierarchical relationship and attribute structure of structured content in ultrasonic text.

Key words: ultrasonic text, natural language processing, text structuring, knowledge network

中图分类号: