图书情报工作 ›› 2013, Vol. 57 ›› Issue (05): 120-123.DOI: 10.7536/j.issn.0252-3116.2013.05.021

• 知识组织 • 上一篇    下一篇

基于视觉语言模型的图像语义挖掘研究

金聪1, 刘金安1, 金枢炜2   

  1. 1. 华中师范大学计算机学院;
    2. 武汉大学物理科学与技术学院
  • 收稿日期:2012-10-09 修回日期:2013-02-12 出版日期:2013-03-05 发布日期:2013-03-05
  • 作者简介:金聪,华中师范大学计算机学院教授,博士,E-mail:jincong26@yahoo.com.cn;刘金安,华中师范大学计算机学院实验员;金枢炜,武汉大学物理科学与技术学院本科生。
  • 基金资助:

    本文系教育部人文社会科学研究规划基金项目"中国古代小说图像的语义研究"(项目编号:11YJAZH040)研究成果之一。

Research on Images Semantic Mining Based on Visual Language Model

Jin Cong1, Liu Jinan1, Jin Shuwei2   

  1. 1. School of Computer, Central China Normal University, Wuhan 430079;
    2. School of Physics & Technology, Wuhan University, Wuhan 430072
  • Received:2012-10-09 Revised:2013-02-12 Online:2013-03-05 Published:2013-03-05

摘要:

针对图像的特性,给出一种图像的二元视觉语言模型,在此基础上提出一种新的图像语义挖掘方法。该方法将每幅图像表示成一个由视觉单词构成的矩阵,通过计算每个视觉单词的权重,按照权重的大小对视觉单词进行选择,利用选择后的视觉单词集合,构建图像的视觉语言模型;之后,按照贝叶斯公式,建立基于视觉语言模型的图像语义挖掘方法。实验结果表明,该方法在图像语义描述能力和区分性方面是有效的,能充分反映人对图像内容的理解,具有很好的应用价值。

关键词: 视觉语言模型, 图像语义, 语义挖掘, 性能优化

Abstract:

For the features of images, this paper proposes a binary visual language model of the image and a new image semantic mining method. Firstly, it presents each image as a matrix constituted by the visual words, selects the visual words by calculating their weighting value and develops a new image visual language model. According to the Bayesian formula, this paper establishes the image semantic mining method based on visual language model. The experimental result shows that this method is effective in the descriptive ability and distinction of image semantic, fully reflects the understanding of image content and has a very good application value.

Key words: visual language model, image semantic, semantic mining, performance optimal

中图分类号: