[目的/意义] 创新性是对学术论文质量最基本的要求,是学术论文的灵魂,是学术论文评价的核心。知识元是学术论文基本组成单元。基于知识元理论和机器学习相关理论与算法,从学术论文内容层面研究计算机如何智能化地进行创新性评价及其实现过程与方法。[方法/过程] 首先,构建学术论文的研究问题、理论、方法、结论4个知识元本体,接着提出基于知识元的学术论文创新性判断模型。其次,根据学术论文研究特点,构建理论与方法机器分类模型及知识元的抽取规则与抽取方法,建立规则库和知识语料库。最后,基于语义相似度计算方法,根据判断规则和相关权重对学术论文4个维度的创新性进行评分。[结果/结论] 基于知识元抽取的学术论文创新性评分系统的实证结果表明,该智能化评价方法具有一定的可行性,可为学术论文内容创新性智能化评价系统的最终实现提供方法借鉴。
[Purpose/significance] Innovation is the key factor of academic paper evaluation. Based on the knowledge element theory and machine learning theory and algorithm, this paper studies how to intelligently evaluate the innovation of academic papers from the content of paper.[Method/process] Firstly, we constructed 4 knowledge element ontologies of academic papers including ‘research problem ontology’, ‘theory ontology’, ‘method ontology’ and ‘conclusion ontology’, and proposed the model of innovation evaluation. Secondly, we put forward the rules of knowledge element extraction. Word2vec and naive Bayes were used to classify the innovation of theories and methods of academic papers, and SVM model was used to build the rule base of knowledge element extraction. At last, on the basis of the construction of knowledge Meta base of academic papers, we proposed the basic methods of intelligent evaluation of research questions, theories, methods and conclusions of academic papers. We also constructed the process of intelligent evaluation of innovation of academic papers.[Result/conclusion] The feasibility of the methods is verified by the experiment and could provide the references for the realization of intelligently evaluation of academic paper.
[1] 陈建青.对我国学术论文创新性评审的几点思考[J].青年记者,2013(18):33-35.
[2] 王文彦.论创新的层次性[J].河南师范大学学报(哲学社会科学版),2006(1):218-219.
[3] 逯万辉,谭宗颖.学术成果主题新颖性测度方法研究——基于Doc2Vec和HMM算法[J].数据分析与知识发现,2018(3):22-29.
[4] UZZI B, MUKHERJEE S, STRINGER M, et al. Atypical combinations and scientific impact[J]. Science,2013, 342(6157):468-472.
[5] 李冲,苏永建.学术评价:量化模式的反思与超越[J].自然辩证法研究,2017,33(2):59-63.
[6] SELVARAJOO K. Measuring merit:take the risk[J].Science,2015,347:139-140.
[7] 彭琳,杜杏叶.学术期刊开放式同行评议实施调查[J].中国科技期刊研究,2018,29(11):1114-1121.
[8] 贺颖.同行评议专家遴选问题研究[M].北京:中国社会科学出版社,2016.
[9] VIEIRA E S, GOMES J A N F. The peer-review process:the most valued dimensions according to the researcher's scientific career[J]. Research evaluation,2018,27(3):246-261.
[10] 沈阳.一种基于关键词的创新度评价方法[J].情报理论与实践,2007(1):125-127.
[11] 贺婉莹. 基于机器学习的论文学术创新力评价研究[D].南京:南京大学,2019.
[12] 索传军.知识转移视角下的学术论文老化与创新研究[J].图书情报工作, 2014,58(5):5-12.
[13] 杨京,王芳,白如江.一种基于研究主题对比的单篇学术论文创新力评价方法[J].图书情报工作,2018,62(17):75-83.
[14] 阮光册,夏磊. 基于Doc2Vec的期刊论文热点选题识别[J].情报理论与实践,2019,42(4):107-111,106.
[15] 邱均平.评价学:理论·方法·实践[M]. 北京:科学出版社, 2010.
[16] 邱均平,赵岩杰,罗力.科学评价中的论文分类方法研究[J]. 情报学报,2011(5):554-560.
[17] 徐建强,崔慧洁,李小平,等.一种新型学位论文智能评价系统[J].计算机工程,2013,39(7):224-227,232.
[18] 索传军,盖双双.知识元的内涵、结构与描述模型研究[J].中国图书馆学报,2018, 44(4):54-72.
[19] 温有奎,徐国华,赖伯年,等.知识元挖掘[M]. 西安:西安电子科技大学出版社, 2005.
[20] BROOKES B C. The developing cognitive viewpoint in information science[C]//International workshop on the cognitive viewpoint. Ghent:Ghent University, 1977:195-203.
[21] BROOKES B C. The foundations of information science part I. Philosophical aspects[J]. Journal of information science, 1980, 2(3/4):125-133.
[22] 温有奎,焦玉英.基于知识元的知识发现[M]. 西安:西安电子科技大学出版社, 2011.
[23] 温有奎, 徐国华. 知识元链接理论[J]. 情报学报, 2003, 22(6):665-670.
[24] 文庭孝,侯经川,龚蛟腾,等.中文文本知识元的构建及其现实意义[J].中国图书馆学报,2007,33(6):91-95.
[25] 袁名依,谢深泉.基于知识元本体的知识统一表示[J].现代计算机(专业版),2008(5):46-48,57.
[26] 姜永常,杨宏岩,张丽波.基于知识元的知识组织及其系统服务功能研究[J].情报理论与实践,2007(1):37-40.
[27] 方龙,李信,黄永,等.学术文本的结构功能识别——在关键词自动抽取中的应用[J].情报学报,2017,36(6):599-605.
[28] 王忠义,沈雪莹,黄京.基于知识元的中文文本层级分割[J].图书情报工作,2019,63(7):105-115.
[29] 杜慧,徐学可,伍大勇,等.基于情感词向量的微博情感分类[J].中文信息学报,2017,31(3):170-176.
[30] 李惠富,陆光.多类型分类器融合的文本分类方法研究[J].计算机应用研究,2019,36(3):752-755.