[目的/意义] 高校图书馆信息化水平高,但数据挖掘与智慧化水平有待提升。复杂网络以图数据库为存储和图查询的载体,对图结构数据进行统一组织和挖掘。图嵌入、图算法技术相较于传统机器学习方法能够充分挖掘图结构数据中的隐含联系。本研究运用复杂网络技术融合多源数据,探索图嵌入技术、图算法等图结构数据挖掘方法在提升图书馆智慧化水平中的作用。[方法/过程] 首先基于可获取的数据进行数据特征分析与清洗;其次结合数据特征构建复杂网络概念模型,采用Neo4j批量导入技术实现网络构建和存储;最后探索图算法、图嵌入技术在图结构数据挖掘中的应用。[结果/结论] 以图结构融合多源数据构建图书馆复杂网络,并以图数据库作为存储介质。图算法与图嵌入技术在在用户画像分析、精准推荐、智能问答等图书馆智能化应用等方面具有独特优势。
[Purpose/significance] The informatization level of university libraries is high, but the level of data mining and intelligence needs to be improved. The complex network uses graph database as the carrier of storage and graph query to organize and mine graph structure data. Compared with traditional machine learning methods, graph embedding and graph algorithm techniques can discover hidden connections in graph. This study uses complex network to integrate multi-source data and explores the role of graph data mining methods such as graph embedding and graph algorithms in improving library intelligence level.[Method/process] First of all, this study clarifies and analyzes the characteristics of the data based on the available data. Secondly, combined with the characteristics of data, construct a complex network conceptual model, and use Neo4j batch import technology to realize network construction and storage. Finally, explore the application of graph algorithm and graph embedding technology in graph structure data mining.[Result/conclusion] The multi-source data is combined with the graph structure to construct the complex network of the library, and the graph database is used as the storage medium. Graph algorithm and graph embedding technology have unique advantages in user image analysis, accurate recommendation, intelligent QA, and other intelligent applications of the library.
[1] 吴建中. 人工智能与图书馆[J]. 图书与情报, 2017(6):1-5.
[2] 李彩宁, 毕新华, 陈立军. 智慧图书馆服务模式及平台构建研究[J]. 图书馆, 2018(12):1-7.
[3] 布和宝力德. 人工智能技术在图书馆的应用、挑战及发展趋势[J]. 图书与情报, 2017(6):48-54.
[4] 刘晓民. 图书馆——自动化的新纪元[J]. 机器人技术与应用, 1997(1):7-8.
[5] 王展妮, 张国亮. 图书馆机器人应用研究综述[J]. 大学图书馆学报, 2015,33(3):82-87.
[6] 杨九龙, 阳玉堃, 许碧涵. 人工智能在图书馆应用的理论逻辑、现实困境与路径展望[J]. 图书情报工作,2019,63(4):32-38.
[7] 汪小帆,李翔. 复杂网络理论及其应用[M]. 北京:清华大学出版社, 2006:18-46.
[8] 吴智勤, 柳益君, 李仁璞, 等. 基于社交网络的高校图书馆用户画像构建研究[J]. 图书馆学研究, 2018(16):26-30.
[9] 冯蕾, 张宇光, 唐丽. 复杂网络理论在图书馆个性化推荐服务中的应用[J]. 情报理论与实践, 2009,32(2):69-71.
[10] 赵鹏, 蔡庆生, 王清毅, 等. 一种基于复杂网络特征的中文文档关键词抽取算法[J]. 模式识别与人工智能, 2007,20(6):827-831.
[11] 翟东升, 刘鹤, 张杰, 等. 基于图形数据库的专利语义知识库构建技术研究[J]. 现代图书情报技术, 2016(12):66-75.
[12] 李慧, 马小平, 施珺, 等. 复杂网络环境下基于信任传递的推荐模型研究[J]. 自动化学报, 2018,44(2):363-376.
[13] 李晓瑛. 复杂网络理论及其在图书情报领域的应用研究[J]. 情报科学, 2016,34(10):95-98.
[14] 李德毅, 刘常昱, 杜鹢, 等. 不确定性人工智能[J]. 软件学报, 2004(11):1583-1594.
[15] 张帜, 庞国明, 胡佳辉, 等. Neo4j权威指南[M]. 北京:清华大学出版社, 2017:22-38.
[16] 刘知远, 孙茂松, 林衍凯, 等. 知识表示学习研究进展[J]. 计算机研究与发展, 2016,53(2):247-261.
[17] KEMPER C. Managing your data in Neo4j[M]. Berkeley, CA:Apress, 2015:57-67.
[18] 刘海鸥, 姚苏梅, 黄文娜, 等. 基于用户画像的图书馆大数据知识服务情境化推荐[J]. 图书馆学研究, 2018(24):57-63.
[19] 刘海鸥, 孙晶晶, 陈晶, 等. 用户画像模型及其在图书馆领域中的应用[J]. 图书馆理论与实践, 2018(10):92-97.
[20] 陈添源. 高校移动图书馆用户画像构建实证[J]. 图书情报工作, 2018,62(7):38-46.
[21] 吕丹阳. 基于关联图谱的高校图书馆图书个性化推荐方法研究[D]. 武汉:华中科技大学, 2016.
[22] 李民, 王颖纯, 刘燕权. "211工程"高校图书馆馆藏资源推荐系统调查探析[J]. 图书情报工作, 2016,60(9):55-60.
[23] WANG J, HUANG P, ZHAO H, et al. Billion-scale commodity embedding for E-commerce recommendation in Alibaba[C]//Proceedings of the 24th ACM SIGKDD international conference on knowledge discovery & data mining. New York:ACM, 2018:839-848.
[24] GROVER A, LESKOVEC J. node2vec:scalable feature learning for networks[C]//Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. New York:ACM, 2016:855-864.
[25] WANG D, CUI P, ZHU W. Structural deep network embedding[C]//Proceedings of the 22nd ACM SIGKDD international conference on knowledge discovery and data mining. New York:ACM, 2016:1225-1234.
[26] TANG J, QU M, WANG M, et al. LINE:large-scale information network embedding[C]//Proceedings of the 24th international conference on World Wide Web. New York:ACM, 2015:1067-1077
[27] 来云. 图书馆智能化咨询问答机器人系统设计与语料技术研究[J]. 现代情报, 2017,37(11):121-124.
[28] 沈奎林, 邵波, 赵华. 利用微信构建图书馆智能问答系统[J]. 图书馆学研究, 2015(8):75-80.
[29] BORDES A, WESTON J, USUNIER N. Open question answering with weakly supervised embedding models[C]//Joint European conference on machine learning and knowledge discovery in databases. Berlin, Heidelberg:Springer, 2014:165-180.
[30] BORDES A, CHOPRA S, WESTON J. Question answering with subgraph embeddings[C]//Proceedings of the 2014 conference on empirical methods in natural language processing. Doha:EMNLP, 2014:615-620.