理论研究

文本相似度视角下我国大数据政策比较研究

  • 张涛 ,
  • 马海群 ,
  • 易扬
展开
  • 1. 黑龙江大学信息与网络中心 哈尔滨 150080;
    2. 黑龙江大学信息资源管理研究中心 哈尔滨 150080;
    3. 黑龙江大学数学科学学院 哈尔滨 150080
张涛(ORCID:0000-0002-3367-4541)高级工程师,博士研究生,E-mail:zhangtao@hlju.edu.cn;马海群(ORCID:0000-0002-2091-7620)教授,博士,博士生导师;易扬(ORCID:0000-0001-5496-644X),硕士研究生。

收稿日期: 2019-09-30

  修回日期: 2020-01-31

  网络出版日期: 2020-06-20

基金资助

本文系黑龙江省哲学社会科学研究规划项目"智能+视阈下基于语料库的数据政策模型构建与实证研究"(项目编号:19TBQ073)和国家社会科学基金重点项目"开放数据与数据安全的政策协同研究"(项目编号:15ATQ008)研究成果之一。

Comparative Analysis of China's Big Data Policies from the Perspective of Text Similarity

  • Zhang Tao ,
  • Ma Haiqun ,
  • Yi Yang
Expand
  • 1. Information and Network Center, Heilongjiang University, Harbin 150080;
    2. Research Center of Information Resource Management, Heilongjiang University, Harbin 150080;
    3. Department of Mathematics, Heilongjiang University, Harbin 150080

Received date: 2019-09-30

  Revised date: 2020-01-31

  Online published: 2020-06-20

摘要

[目的/意义] 大数据政策的制定与实施是国家推动大数据产业发展的重要手段,因此对大数据的政策研究也受到了社会广泛关注。[方法/过程] 以文本相似度为视角对国务院发布的《促进大数据发展行动纲要》和我国22个地区发布的大数据政策文本进行比较研究。[结果/结论] 数据表明:广东省、福建省所制定的政策最为完整和全面,数据开放共享和安全保障在各地区大数据政策制定层面整体关注最高,呈现出相似性,在内蒙古自治区、四川省等地区大数据政策制定中区域特色较为突出,呈现出差异性。随着各地区相继颁布人工智能政策,未来对人工智能视域下大数据政策的研究将成为新方向。

本文引用格式

张涛 , 马海群 , 易扬 . 文本相似度视角下我国大数据政策比较研究[J]. 图书情报工作, 2020 , 64(12) : 26 -37 . DOI: 10.13266/j.issn.0252-3116.2020.12.004

Abstract

[Purpose/significance] The formulation and implementation of big data policies is an important means for the country to promote the development of the big data industry. Therefore, research on big data policies has received widespread attention from the society.[Method/process] From the perspective of text similarity, the article compares the Big Data Development Action Plan issued by the State Council and the texts of big data policies released in 22 regions.[Result/conclusion] Data shows:the policies formulated by Guangdong Province and Fujian Province are the most complete and comprehensive;open data sharing and security guarantees the highest overall attention in the formulation of big data policies in various regions, showing similarity;regional characteristics are more prominent, showing differences. With the successive release of artificial intelligence policies in various regions, future research on big data policies under the vision of artificial intelligence will become a new direction.

参考文献

[1] 裴雷,孙建军,周兆韬.政策文本计算——一种新的政策文本解读方式[J].图书与情报,2016(6):47-55.
[2] 张勇进,王璟璇.主要发达国家大数据政策比较研究[J].中国行政管理,2014(12):113-117.
[3] 汤志伟,龚泽鹏,郭雨晖.基于二维分析框架的中美开放政府数据政策比较研究[J].中国行政管理,2017(7):41-48.
[4] 王本刚,马海群.开放政府数据的政策比较研究[J].情报资料工作,2017(6):33-40.
[5] 赵远.内蒙古与十省(市)大数据政策比较研究——基于"目标-工具"二维分析框架[D].呼和浩特:内蒙古大学,2019.
[6] ZUIDERWIJK A, JANSSEN M.Open data policies, their implementation and impact:a framework for comparison[J]. Government information quarterly,2014,31(1):17-29.
[7] CHATZINIKOLAOU E, FAULWETTER S, MAVRAKI D, et al.Datapolicy and data sharing agreement in the Life Watch Greeceresearch infrastructure[J].Biodiversity data journal,2016(4):e10849.
[8] TATIANA-CAMELIA D.The comparative method for policy studies:the thorny aspects[J].Holistica -journal of business and public administration, 2019,10(1):56-67.
[9] LIN D. An information-theoretic definition of similarity[C]//Proceedings of the 15th international conference on machine learning. San Francisco:Margan Kaufmann,1998:296-304.
[10] 陈二静,姜恩波.文本相似度计算方法研究综述[J]. 数据分析与知识发现, 2017(6):1-11.
[11] 黄文彬,车尚锟.计算文本相似度的方法体系与应用分析[J]. 情报理论与实践, 2019,42(11):128-134.
[12] 李琳,李辉.一种基于概念向量空间的文本相似度计算方法[J]. 数据分析与知识发现, 2018(5):47-58.
[13] 曹祺,赵伟,张英杰,等.基于Doc2Vec的专利文件相似度检测方法的对比研究[J].图书情报工作, 2018,62(13):74-81.
[14] 张文萍,黎春兰. 基于文本空间表示模型的文本相似度计算研究[J].现代情报, 2013,33(2):21-24.
[15] 马海群,张涛. 文献信息视阈下面向智慧服务的语料库构建研究[J].情报理论与实践, 2019,42(6):124-130.
[16] 中国科学院计算技术研究所.ICTCLAS2016[EB/OL].[2019-09-28]. http://ictclas.nlpir.org/.
[17] 张涛,马海群. 一种基于LDA主题模型的政策文本聚类方法研究[J].数据分析与知识发现, 2018(9):59-65.
[18] 武永亮,赵书良,李长镜,等.基于TF_IDF和余弦相似度的文本分类方法[J].中文信息学报,2017,31(5):138-145.
[19] 李樵. 我国促进大数据发展政策工具选择体系结构及其优化策略研究[J].图书情报工作,2018,62(11):5-15.
[20] 张涛,蔡庆平,马海群.一种基于政策文本计算的政策内容分析方法实证研究[J]. 信息资源管理学报,2019(1):66-76.
[21] 连玉明. 中国大数据发展报告[M]. 北京:社会科学文献出版社,2019.
[22] 刘亚亚,曲婉,冯海红.中国大数据政策体系演化研究[J].科研管理, 2019,40(5):13-23.
[23] 黄如花, 温芳芳.我国政府数据开放共享的政策框架与内容:国家层面政策文本的内容分析[J].图书情报工作, 2017,61(20):12-25.
[24] 张会平,郭宁,汤玺楷.推进逻辑与未来进路:我国政务大数据政策的文本分析[J].情报杂志,2018(3):152-157,192.
[25] 汤志伟,雷鸿竹,周维.中美人工智能产业政策的比较研究——基于目标、工具与执行的内容分析[J].情报杂志,2019(10):73-80.
文章导航

/