[目的/意义] 揭示文献核心创新点,自动生成多篇文献综述,帮助科研人员快速掌握文献核心内容,提高科研效率。[方法/过程] 提出一种基于知识基因增强的BERT科技文献自动综述研究方法,分为3个步骤,首先综合考虑主题相似度、论文发表时长和被引次数,提出一种核心文献推荐指数,选取文献综述候选文献;然后对文献综述候选文献中的代表科技文献核心观点的知识基因进行抽取;最后提出一种基于知识基因注意力增强的BERT科技文献自动综述模型,将知识基因融入到注意力机制中,判断语句显著度并进行排序抽取,以获取更多的语义信息。[结果/结论] 经过多组实验,与单纯的BERT相比,本文模型在ROUGE-1分别提高了14.28%;ROUGE-2分别提高了12.13%;ROUGE-L分别提高了17.69%。在ROUGE-1与ROUGE-2测评中基于知识基因增强的BERT科技文献自动综述模型效果均优于TextRank模型。基于知识基因注意力增强的BERT科技文献自动综述能够深入文本内容,挖掘文献核心内容,生成简明扼要的文献综述。
关键词:知识基因|文献综述|自动摘要