图书情报工作 ›› 2018, Vol. 62 ›› Issue (7): 119-124.DOI: 10.13266/j.issn.0252-3116.2018.07.014

• 知识组织 • 上一篇    下一篇

随机森林在高校信息碎片化整合中的应用

张文德1, 程涵1, 刘田2, 曾金晶2   

  1. 1. 福州大学信息管理研究所 福州 350108;
    2. 福建农林大学图书馆 福州 350002
  • 收稿日期:2017-08-26 修回日期:2018-01-07 出版日期:2018-04-05 发布日期:2018-04-05
  • 作者简介:张文德(ORCID:0000-0002-3017-9211),教授,博士生导师,E-mail:zhangwd@fzu.edu.cn;程涵(ORCID:0000-0003-2495-0898),硕士研究生;刘田,馆员;曾金晶,馆员。
  • 基金资助:
    本文系中国高教学会2016年度教育信息化专项课题"基于高校信息碎片化的信息整合构建研究"(项目编号:2016XXZD01)、2016年福建省教育厅中青年项目"基于不含有主键大数据精简的直觉模糊决策方法及其应用研究"(项目编号:JAT160097)和"基于中智集的高校信息系统安全风险评方法研究"(项目编号:JAT160094)研究成果之一。

Application of Random Forest in the Fragmented Integration of University Information

Zhang Wende1, Cheng Han1, Liu Tian2, Zeng Jinjing2   

  1. 1. Institute of Information Management, Fuzhou University, Fuzhou 350108;
    2. Library of Fujian Agriculture and Forestry University, Fuzhou 350002
  • Received:2017-08-26 Revised:2018-01-07 Online:2018-04-05 Published:2018-04-05

摘要: [目的/意义]面对高校信息呈现碎片化的趋势,提出高校信息碎片化整合流程,并应用随机森林算法构建高校信息碎片化整合的特征选择模型。[方法/过程]基于高校信息整合的发展现状与存在问题,分析随机森林算法原理及优势,将其运用到高校信息碎片化整合过程的特征选择模型中,并以高校贫困生认定为例,对该模型加以验证。[结果/结论]随机森林算法在高校信息整合特征选择上表现出较高的准确性和有效性,为高校信息碎片化整合提供了一种新的思路。

关键词: 随机森林, 碎片化, 信息整合, 特征选择

Abstract: [Purpose/significance] Facing the trend of fragmentation of university information, this paper puts forward the integration process of fragmented university information, and applies the random forest algorithm to construct the feature selection model of information-fragmented integration in universities.[Method/process] This paper represents the development, research status and existing problems of university information integration. Furthermore, in this paper, we elaborate the principles and advantages of the random forest algorithm, and use it to the feature selection model of information fragmented integration process in universities. Finally, we validate the model by using the example of identifying the students in the need of financial help.[Result/conclusion] Random forest algorithm shows higher accuracy and validity in the selection of features for integrating university information and therefore provides a new way for the integration of fragmented university information.

Key words: random forest, fragmentation, information integration, feature selection

中图分类号: