基于本体的Web信息抽取研究综述被引量：2

A Review of Web Information Extraction Based on Ontology

导出

摘要基于本体的Web信息抽取就是以所构建的本体为核心,利用本体中已定义的概念、分类层次、关系、函数、公理和实例及一些必需的外部资料对Web页面进行信息提取,得到结构化的知识并保存的过程,这一技术已经成为国内外研究的热点之一。文章介绍了信息抽取的历史,给出了基于本体的Web信息抽取一般体系结构模型及相关实现,系统地分析比较了各种基于本体的Web信息抽取方法,指出了目前这些方法实现的关键、得到的结果及其不足之处,展望了Web信息抽取发展的方向。 Web information extraction based on ontology has become one of the hotspots at home and abroad. The method realizes web page information extraction by means of the concept, classification level, relations, functions, axioms, instances defined in the ontology, and some required external data. And the structured knowledge is acquired and saved. The history of information extraction is introduced. And the general model and the realization methods of web information extraction based on ontology are analyzed. Finally, the future of web information extraction is forecasted.

作者金燕

机构地区郑州大学信息管理系

出处《图书馆学研究》 CSSCI 北大核心 2012年第16期2-6,共5页 Research on Library Science

基金河南省软科学研究计划项目"基于语义Web的企业知识检索方法创新研究"(项目编号:112400450172) 河南省高等学校青年骨干教师基金资助项目"Web2.0环境下网络信息检索机制及其优化研究"(项目编号:2010GGJS-011)的研究成果之一

关键词 WEB信息抽取本体研究综述 web information extraction ontology research review

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献19

1毕蕾,沈洁,徐法艳,魏榴花,朱燕,孙荣霜.领域本体指导的Web商品信息抽取[J].计算机工程与设计,2008,29(24):6393-6396. 被引量：9
2刘鹏博,车海燕,陈伟.知识抽取技术综述[J].计算机应用研究,2010,27(9):3222-3226. 被引量：15
3黄婵,罗艳梅.基于领域本体的Web页面信息抽取[J].实验室研究与探索,2011,30(1):62-65. 被引量：4
4柳佳刚,陈山,黄樱.一种改进的基于本体的Web信息抽取[J].计算机工程,2010,36(4):39-41. 被引量：7
5梁晗,陈群秀,吴平博.基于事件框架的信息抽取系统[J].中文信息学报,2006,20(2):40-46. 被引量：38
6黄骥,姜利群,殷兆麟.一种新型的基于样本的Web信息检索技术[J].微计算机信息,2009,25(3):238-239. 被引量：5
7王海涛,曹存根,高颖.基于领域本体的半结构化文本知识自动获取方法的设计和实现[J].计算机学报,2005,28(12):2010-2018. 被引量：31
8荆涛,左万利,孙吉贵,车海燕.中文网页语义标注：由句子到RDF表示[J].计算机研究与发展,2008,45(7):1221-1231. 被引量：31
9周明建,高济,李飞.基于本体论的Web信息抽取[J].计算机辅助设计与图形学学报,2004,16(4):535-541. 被引量：34
10张鑫,陈梅,王翰虎,王嫣然.基于视觉特征和领域本体的Web信息抽取[J].计算机技术与发展,2011,21(2):58-61. 被引量：5

二级参考文献197

1王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
2郑冬冬,赵朋朋,崔志明.Deep Web爬虫研究与设计[J].清华大学学报（自然科学版）,2005,45(S1):1896-1902. 被引量：28
3荆涛,左万利.基于可视布局信息的网页噪音去除算法[J].华南理工大学学报（自然科学版）,2004,32(z1):84-87. 被引量：21
4周明建,高济,李飞.基于本体论的Web信息抽取[J].计算机辅助设计与图形学学报,2004,16(4):535-541. 被引量：34
5陈兰,左志宏,熊毅,孟令谦.一种新的基于Ontology的信息抽取方法[J].计算机应用研究,2004,21(8):155-157. 被引量：18
6冯长远,普杰信.Web文本特征选择算法的研究[J].计算机应用研究,2005,22(7):36-38. 被引量：8
7崔继馨,张鹏,杨文柱.基于DOM的Web信息抽取[J].河北农业大学学报,2005,28(3):90-93. 被引量：12
8杜波,田怀凤,王立,陆汝占.基于多策略的专业领域术语抽取器的设计[J].计算机工程,2005,31(14):159-160. 被引量：26
9车海燕,孙吉贵,荆涛,白曦.一个基于本体主题的中文知识获取方法[J].计算机科学与探索,2007,1(2):206-215. 被引量：5
10郑家恒,卢娇丽.关键词抽取方法的研究[J].计算机工程,2005,31(18):194-196. 被引量：41

共引文献695

1郭崇慧,许蒙.一种基于众包模式的试题知识点标注方法[J].信息与管理研究,2019,0(6):64-72. 被引量：3
2陈德彦,赵宏,张霞.专家视图与本体视图的语义映射方法[J].软件学报,2020(9):2855-2882. 被引量：6
3葛艳,杜坤钰,杜军威,陈卓.基于混合神经网络的实体关系抽取方法研究[J].中文信息学报,2021,35(10):81-89. 被引量：3
4吴婷,孔芳.基于图注意力卷积神经网络的文档级关系抽取[J].中文信息学报,2021,35(10):73-80. 被引量：11
5刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：23
6盛泳潘,付雪峰,吴天星.基于开放域抽取的多文档概念图构建研究[J].计算机应用研究,2020,37(1):19-25. 被引量：2
7路威,赵丽君.兵要知识图谱的构建与应用研究[J].测绘地理信息,2022,47(4):119-123. 被引量：3
8沈芳婷,于艳华,李志强,李劼.基于Attention-Comprehension OpenTag的人物属性抽取算法[J].新一代信息技术,2022,5(6):1-5.
9胡金柱,舒江波,陈志伟,杜志强,窦桂琴.基于本体构件的工作流检索研究[J].四川大学学报（工程科学版）,2007,39(S1):64-67.
10王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10

同被引文献15

1郑长松,傅彦,佘莉.基于模板的Web信息自动提取方法[J].计算机应用研究,2009,26(2):570-572. 被引量：10
2时达明,林鸿飞,赵晶.基于模板化的Blog信息抽取[J].计算机工程与应用,2008,44(9):156-158. 被引量：5
3曹冬林,廖祥文,许洪波,白硕.基于网页格式信息量的博客文章和评论抽取模型[J].软件学报,2009,20(5):1282-1291. 被引量：15
4陈治昂,周知予,李大学.一种基于模板的快速网页文本自动抽取算法[J].计算机应用研究,2009,26(7):2646-2649. 被引量：11
5张彦超,刘云,李勇,沈波.基于自动生成模板的Web信息抽取技术[J].北京交通大学学报,2009,33(5):40-45. 被引量：13
6黄锋,吴华瑞.一种自适应的Web信息抽取规则自动生成方法[J].广西师范大学学报（自然科学版）,2010,28(1):127-130. 被引量：5
7吴恒亮.基于本体和DOM树的Web信息抽取技术研究[J].情报科学,2010,28(7):1055-1059. 被引量：3
8胡少荣,孟嗣仪,刘云,张彦超,丁飞.网页信息自动抽取技术的研究[J].铁路计算机应用,2010,19(9):37-40. 被引量：4
9王权,施韶亭.Web信息抽取技术在统一检索系统中的应用研究[J].计算机应用与软件,2010,27(10):120-122. 被引量：7
10陈钊,张冬梅.Web信息抽取技术综述[J].计算机应用研究,2010,27(12):4401-4405. 被引量：22

引证文献2

1李宝密.基于自动生成模板的Web信息抽取技术[J].网络安全技术与应用,2016(9):56-56. 被引量：3
2E CHANG.Implementation of a weblog extraction system with an improved template extraction technique[J].Chinese Journal of Library and Information Science,2013(1):52-63.

二级引证文献3

1陈俊洁.web信息提取技术与应用的研究[J].数字技术与应用,2017,35(9):114-114. 被引量：2
2殷复莲,徐荣阁,刘志心,冀美琪.影视节目扁平化标签获取技术研究[J].软件导刊,2019,18(7):150-153. 被引量：1
3柏志安,廖健,曾剑平.基于DOM树与模板的自适应网络信息抽取方法[J].计算机应用与软件,2022,39(8):15-20. 被引量：2

1马德春.让文档招之即来[J].电脑爱好者,2006,0(5):37-37.
2林树宽,柳帅,陈祖龙,乔建忠.基于分类层次偏好树和用户间信任度的位置推荐方法[J].小型微型计算机系统,2015,36(8):1677-1681. 被引量：4
3乔百友,谢可心,王国仁.TH-Ring: 一种基于语义的结构化P2P网络[J].计算机研究与发展,2007,44(z3):107-112.
4安婧,王星,沈小林.一种网络查找算法的设计与实现[J].山西电子技术,2009(2):61-63.
5乔百友,王国仁.Super-Peer网络中基于语义的分簇算法研究[J].小型微型计算机系统,2008,29(2):213-218. 被引量：1
6乔百友,王国仁,邢云龙,王彩荣.一种基于语义的super-peer网络构建方法[J].东北大学学报（自然科学版）,2008,29(1):61-64.
7乔百友,王国仁,丁琳琳.TBSN:一种基于分类层次的P2P网络[J].计算机研究与发展,2008,45(5):803-809. 被引量：5
8乔百友,王国仁,谢可心.一种支持分类数据源查找的语义覆盖网络(英文)[J].Journal of Southeast University(English Edition),2007,23(3):322-326. 被引量：1
9袁琴,杨小虎.基于本体分类的Web服务合成的研究及应用[J].计算机工程,2007,33(2):79-81. 被引量：3
10王鸿洁,常国岑,李学军,杜金柱.军事通用仿真模型及其集成框架研究[J].系统仿真学报,2007,19(3):486-490. 被引量：15

图书馆学研究

2012年第16期

浏览历史

内容加载中请稍等...

基于本体的Web信息抽取研究综述被引量：2

参考文献19

二级参考文献197

共引文献695

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于本体的Web信息抽取研究综述 被引量：2

参考文献19

二级参考文献197

共引文献695

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于本体的Web信息抽取研究综述被引量：2