
图书情报工作 ›› 2018, Vol. 62 ›› Issue (5): 115-124.DOI: 10.13266/j.issn.0252-3116.2018.05.013
魏巍1, 郑杜2
收稿日期:
2017-09-07
修回日期:
2017-12-05
出版日期:
2018-03-05
发布日期:
2018-03-05
作者简介:
魏巍(ORCID:0000-0003-3580-8360),讲师,博士,E-mail:503175355@qq.com;郑杜,博士研究生。
基金资助:
Wei Wei1, Zheng Du2
Received:
2017-09-07
Revised:
2017-12-05
Online:
2018-03-05
Published:
2018-03-05
摘要: [目的/意义]社交媒体的出现为医疗健康数据的收集提供了新的途径,应用自然语言处理技术从社交媒体中抽取患者报告的ADR(Adverse Drug Reaction,药物不良反应)信号对于改善药物不良反应监测的临床和科学知识具有很大的潜力。然而,从社会媒体中提取患者报告的ADR信号仍然面临重大挑战。为此,开发一个利用高级自然语言处理技术从健康主题社交媒体中抽取ADR信号的研究模型。[方法/过程]该模型首先采用基于多词典源匹配的方法,从嘈杂的社交媒体中识别医学实体;然后采用最短依存路径核函数为基础的统计学习方法提取药物不良事件;并利用药品安全数据库的语义知识过滤药物的治疗和适用症信息以及否定的药物不良事件;最后,对报告源进行分类剔除传闻等噪音信息。[结果/结论]通过收集糖尿病论坛上的数据对模型的有效性进行验证,结果显示该模型的每一部分都有助于其整体性能的提升。
中图分类号:
魏巍, 郑杜. 融合统计学习和语义过滤的ADR信号抽取模型构建研究[J]. 图书情报工作, 2018, 62(5): 115-124.
Wei Wei, Zheng Du. The Study of Adverse Drug Reaction Signal Extraction Framework Based on the Integrated Statistical Learning and Semantic Filter[J]. LIS, 2018, 62(5): 115-124.
[1] 梁少星,李枫林. 情景感知健康信息服务系统研究现状与展望[J].中华医学图书情报杂志,2014(7):31-36. [2] 王丹. 药品不良反应主动监测及其发展趋势[J]. 中国药物警戒,2015(10):600-602. [3] HARPAZ R,DUMOUCHEL W,SHAH N,et al. Novel data-mining methodologies for adverse drug event discovery and analysis[J].Clinical pharmacology and therapeutics,2012,91(6):1010-1021. [4] LEAMAN R,WOJTULEWICZ L,SULLIVAN R,et al. Towards internet-age pharmacovigilance:extracting adverse drug reactions from user posts to health-related social networks[C]//Proceedings of the 2010 workshop on biomedical natural language processing. Berlin:Association for Computational Linguistics,2010:117-125. [5] BIAN J,TOPALOGLU U,YU F. Towards large-scale twitter mining for drug-related adverse event[C]//Proceedings of the 2012 international workshop on smart health and wellbeing. New York:ACM,2012:25-32. [6] CHEE B,BERLIN R,SCHATZ B. Predicting adverse drug events from personal health messages[C]//AMIA annual symposium proceedings.Bethesda:American Medical Informatics Association,2011:217. [7] 王丽伟. 药物不良事件信息资源整合与数据挖掘研究[D]. 长春:吉林大学,2014. [8] ABEED S,RACHEL G,AZADEH N,et al. Utilizing social media data for pharmacovigilance:a review[J].Journal of biomedical informatics,2015, 54(C):202-212. [9] THOMAS P,NEVES M,SOLT I,et al. Relation extraction for drug-druginteractions using ensemble learning[C]//Proceeding of the 1st challenge task on drug-drug interaction extraction. Huelva:Tranging,2011:11-18. [10] LIU X,CHEN H.A research framework for pharmacovigilance in health social media:identification and evaluation of patient adverse drug event reports[J]. Journal of biomedical informatics,2015,58:268-279. [11] BENTON A,UNGAR L,HILL S, et al. Identifying potential adverse effects using the web:a new approach to medical hypothesis generation[J]. Journal of biomedical informatics,2011,44(6):989-996. [12] YANG C,JIANG L,ZHANG M. Social media mining for drug safety signal detection[C]//Proceedings of the 2012 international workshop on smart health and wellbeing. New York:ACM, 2012:33-40. [13] 代菲,陈盛新,舒丽芯,等. 5种信号挖掘方法在药物不良反应检测中的分析和应用[J].中国医院药学杂志,2012,32(20):1674-1677. [14] BUNESCU R,MOONEY R. A shortest path dependency kernel for relation extraction[C]//Proceedings of the conference on human language technology and empirical methods in natural language processing.Vancouver:Association for Computational Linguistics,2005:724-731. [15] LI J,ZHANG Z,LI X.Kernel-based learning for biomedical relation extraction[J].Journal of the American Society for Information Science and Technology, 2008,59(5):756-769. [16] VINCZE V,SZARVAS G,FARKAS R,et al. The BioScope corpus:biomedical texts annotated for uncertainty, negation and their scopes[J]. BMC bioinformatics,2008,9(S11):1-9. [17] UZUNER Ö,GOLDSTEIN I,LUO Y. Identifying patient smoking status from medical discharge records[J].Journal of the American Medical Informatics Association,2008,15(1):14-24. [18] LIU X,CHEN H. AZDrugMiner:an information extraction system for mining patient-reported adverse drug events in online patient forums[C]//Proceedings of the international conference on smart health(ICSH 2013). Berlin:Springer, 2013:134-150. [19] JOACHIMST.Transductive inference for text classification using support vector machines[C]//Sixteenth international conference on machine learning. San Francisco:Morgan Kaufmann, 1999:200-209. |
[1] | 冯梦莹, 白如江, 张玉洁, 王效岳, 耿振东, 王志民. 面向数字人文的稷下思想自动分类研究[J]. 图书情报工作, 2022, 66(19): 26-35. |
[2] | 庞弘燊, 钟秀梅. 颠覆性技术产生过程的多源数据多特征项可视化研究[J]. 图书情报工作, 2022, 66(19): 122-131. |
[3] | 周丹燕, 唐琼. 变化理论视角下公共图书馆服务项目成效评估研究[J]. 图书情报工作, 2022, 66(16): 48-56. |
[4] | 袁毅, 陶鑫琪, 李瑾萱, 刘娅娴, 汪晓芸, 景香玉. 基于招聘文本实体挖掘的人才供需分析——以人工智能领域为例[J]. 图书情报工作, 2022, 66(14): 101-118. |
[5] | 陆柳杏, 吴丹. 非物质文化遗产领域汉藏双语本体的语义检索策略研究[J]. 图书情报工作, 2022, 66(13): 15-24. |
[6] | 吕源, 陈慧琪, 刘敏榕. 高校知识产权信息服务内容体系构建研究[J]. 图书情报工作, 2022, 66(12): 59-67. |
[7] | 邓胜利, 孙瑾杰. 图书馆参与虚假健康信息治理的价值、阻滞因素和实现路径[J]. 图书情报工作, 2022, 66(9): 14-22. |
[8] | 韩旭, 闵超, 张靖雯. 基于多维特征的引文扩散模式预测研究[J]. 图书情报工作, 2022, 66(9): 82-92. |
[9] | 孟高慧, 宋筱璇, 张潇月, 刘畅. 学习型搜索中的笔记记录行为与学习产出的关联探究[J]. 图书情报工作, 2022, 66(8): 42-54. |
[10] | 仇蓉蓉, 胡昌平. 云计算环境下国家数字学术资源信息安全协同治理框架研究——基于信息生态视角[J]. 图书情报工作, 2022, 66(8): 55-62. |
[11] | 彭亮, 柯平. 高质量发展环境下新一代图书馆统计的国家标准研究[J]. 图书情报工作, 2022, 66(7): 66-74. |
[12] | 何婕君, 闵超. 引文持续增长型论文特征和影响因素研究[J]. 图书情报工作, 2022, 66(7): 110-119. |
[13] | 丁鑫. 科研协同中信息操纵行为的特征及其影响因素研究[J]. 图书情报工作, 2022, 66(6): 78-86. |
[14] | 应峻, 王钰琛, 王森, 赵宇翔, 朱庆华. 面向重大公共卫生事件的智库服务现状及发展建议[J]. 图书情报工作, 2022, 66(4): 4-13. |
[15] | 李嘉兴, 王雷, 宋士杰, 朱庆华. 重大突发公共卫生事件驱动的医疗数据开放治理模式研究[J]. 图书情报工作, 2022, 66(4): 23-32. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||