基于启发式规则的多媒体主题信息挖掘

Heuristic Rules Based Multimedia Information Mining

下载PDF

导出

摘要随着Internet的发展,Web上信息呈爆炸式增长趋势,呈现方式也愈发多种多样,这就给多媒体内容的检索,信息提取等计算机处理带来了巨大困难。针对信息提取后,网页的多媒体内容的不一致性,本文提出了一种Web网页多媒体信息提取的融合算法。该算法通过对图像和文本的语义融合,判断信息提取后的网页中的各种形态的内容是否一致,并通过网页中的文字更加准确地表示图片所传达的内容。对来自30个网站的307个网页进行测试后的实验表明,本文提出的方法是可行的。 With the development of Internet, the presentations of the Web documents are also diverse, processing, such as multimedia information retrieval, information on the Web has been exploded and the the later brings tremendous troubles for the information information extraction etc. Considering the multimedia content＇ s incoherence after the web information extraction, a fusion method of the web multimedia content is proposed. This method can judge if the web＇ s multimedia contents are coherence via fusing the image semantic and the text semantic. Testing on 307 web pages from 30 web sites shows that the method is effective.

作者邱鹍封化民庞宗强宋国森

机构地区燕山大学信息工程学院北京电子科技学院信息安全与保密重点实验室

出处《北京电子科技学院学报》 2007年第2期65-69,73,共6页 Journal of Beijing Electronic Science And Technology Institute

基金国家自然科学基金资助项目(60472082)

关键词内容挖掘融合模型自信息量 Content mining fusion model self-information

分类号 TP274.2 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献5

1葛加银,黄萱菁,吴立德.基于实体名的文本自动综述研究[J].计算机科学,2004,31(9):161-164. 被引量：2
2席萌,郭巧.基于语境关联的Web信息过滤算法[J].华中科技大学学报（自然科学版）,2003,31(S1):102-104. 被引量：1
3陈晓红,秦杨.基于Web数据挖掘的高效关联规则研究[J].计算机工程与科学,2005,27(11):48-51. 被引量：9
4伏晓,骆斌,陈世福.基于语义的Web挖掘[J].计算机科学,2005,32(3):202-206. 被引量：6
5刘华.文本分类相似度模型和概率模型的实现与比较[J].现代图书情报技术,2006(4):53-55. 被引量：5

二级参考文献43

1张宇,刘挺,文勖.基于改进贝叶斯模型的问题分类[J].中文信息学报,2005,19(2):100-105. 被引量：47
2[1]Mani I. Automatic Summarization. Amsterdam/Philadephia: John Benjamins Publishing Company, 2001
3[2]Goldstein J,Kantrowitz M,Mittal V O,Carbonell J. Summarizing Text Documents: Sentence Selection and Evaluation Metrics. In:Proc. of SIGIR-99 ,Berkeley ,CA ,Aug. 1999
4[3]McKeown,Kathleen R,Radev D R. Generating Summaries of Multiple News Articles. In: Proc. of ACM Conference on Research and Development in Information Retrieval, SIGIR'95. Seattle,WA,July 1995
5[4]http://tides. nist. gov/
6[5]http://www. ldc. upenn. edu/Projects/TDT3/topics. html
7[6]Baldwin B,et al. An evaluation road map for summarization research. TIDES,July 2000
8Hotho A,Maedche A,Staab S. Ontology-based text clustering. In:Proc. of the IJCAI-2001 Workshop "Text Learning: Beyond Supervision", August, Seattle, USA, 2001
9Chakrabarti S,et al. Automatic resource compilation by analyzing hyperlink structure and assciated text. In:Proc. of the 7th Worldwide web conf. (WWW7), 1998,30(1-7): 65-74
10hakrabarti S,van den Berg M,Dom B. Focused crawling: Anew approach to topic-speci. c web resource discovery. In: Proc. of the 8th World-wide web conf. (WWW8), 31 (11-16), Toronto, May 1999. 1623-1640

共引文献18

1赵志滨,贾岩峰,姚兰,鲍玉斌.含有丰富结构化数据的Web页面分类技术的研究[J].计算机研究与发展,2013,50(S1):53-60. 被引量：5
2杨先奇,郑汉垣,张庞.规则挖掘时的概念提升[J].现代经济信息,2010(1):204-205.
3曾小宁.基于XML的Web挖掘[J].广西教育学院学报,2007(2):72-74.
4黄崇本,程光华,龚松杰.一种基于RDF数据空间的智能信息检索系统架构[J].情报杂志,2007,26(12):127-129. 被引量：2
5李垒,李怀刚.基于语义网络的Web挖掘[J].广西轻工业,2008,24(2):52-53.
6廉佐政,邓文新,吕洪柱.基于语义的Web挖掘信息智能获取研究[J].齐齐哈尔大学学报（自然科学版）,2008,24(6):40-43. 被引量：2
7王晓静,张晋.基于web数据挖掘的Apriori算法及其优化算法研究[J].辽宁大学学报（自然科学版）,2009,36(4):335-337. 被引量：4
8杨洁,安建成.关于Web Page的语义挖掘研究[J].电脑开发与应用,2011,24(2):13-15.
9张小丰.面向Web的数据挖掘技术在网站优化中的个性化推荐方法的研究与应用[J].制造业自动化,2012(1):145-147. 被引量：1
10宋淑彩,祁爱华,王剑雄.面向Web的数据挖掘技术在网站优化中的个性化推荐方法的研究与应用[J].科技通报,2012,28(2):117-119. 被引量：49

北京电子科技学院学报

2007年第2期

浏览历史

内容加载中请稍等...

基于启发式规则的多媒体主题信息挖掘

参考文献5

二级参考文献43

共引文献18

相关作者

相关机构

相关主题

浏览历史