基于Web的网页信息抽取方法的研究被引量：4

The Research of Web Pages Information Extraction Based on Web

下载PDF

导出

摘要 WWW的迅速发展,使其日益成为人们查找有用数据的重要来源。本文介绍了一种基于Web的信息抽取的实现方法,能够按照规则模式重复地将半结构化网页中的信息自动抽取出来。 The rapid development of the World Wide Web makes it become more and more important sources for people to look for useful data. This paper introduces a method of information extraction from the Web, which can extract information by regulation pattern from semi-strnctured web pages repeatedly and automatically.

作者冯伟华苗长芬

机构地区中国烟草总公司郑州烟草研究院新乡师范高等专科学校计算机科学系

出处《洛阳工业高等专科学校学报》 2005年第3期30-31,共2页 Journal of Luoyang Technology College

关键词信息抽取规则模式 Information extraction Regulation Pattern

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1IonMuslea, Steve Minton, and Craig A.Knoblock. A hierarchical approach to wrapper induction[C].Proceedings of the Third International Conference on Autonomous Agents,Seattle,WA,1999.221-227.
2G.Wiederhold. Mediators in the architecture of Future Information Systems [J].IEEE Computer, 1992,(3).
3黄豫清,戚广志,张福炎.从WEB文档中构造半结构化信息的抽取器[J].软件学报,2000,11(1):73-78. 被引量：47

二级参考文献1

1Ham mar J，SIGMOD Record，1997年，26卷，2期，18页

共引文献46

1明廷波,左志宏,史永刚,林琳.Web信息抽取中基于神经网络的规则学习方法[J].南京大学学报（自然科学版）,2005,41(z1):1-6. 被引量：1
2胡晓江,苑伟政,朱名铨.IIE环境下数字民航的虚拟数据仓库研究[J].小型微型计算机系统,2003,24(1):68-71. 被引量：4
3GU Ning.A Semantic Approach for Web Document Processing[J].Journal of Shanghai University(English Edition),2001,5(z1):82-85.
4李文奇,张忠能.页面包装器自动生成的改进算法[J].计算机工程与应用,2004,40(22):113-115. 被引量：3
5李泽文.基于Web的数据挖掘技术[J].现代计算机,2004,10(7):29-33. 被引量：10
6刘金红,夏阳,陆余良.基于Ontology的网络元数据抽取系统的研究与实现[J].安徽电子信息职业技术学院学报,2004,3(5):10-13. 被引量：3
7程渤,浮花玲,杨国纬.基于工作流及集成中间件技术的电力信息一体化设计及实现[J].电力系统自动化,2004,28(19):80-83. 被引量：15
8许建潮,侯锟.Web信息的自主抽取方法[J].计算机工程与应用,2005,41(14):185-189. 被引量：15
9张阔,徐鹏,李涓子,王克宏.基于优化层次聚类的文档逻辑结构抽取[J].清华大学学报（自然科学版）,2005,45(4):471-474. 被引量：2
10谢维成,吕先竞,宋玉忠.基于HTML或MXL描述的Web页信息抽取技术研究[J].情报科学,2005,23(9):1398-1402. 被引量：2

同被引文献41

1张智雄.信息抽取技术及其在数字图书馆中的应用前景分析[J].现代图书情报技术,2004(6):1-5. 被引量：26
2胡克林,张凤荣,吕贻忠,王茹,徐艳.北京市大兴区土壤重金属含量的空间分布特征[J].环境科学学报,2004,24(3):463-468. 被引量：169
3刘金红,夏阳,陆余良.基于Ontology的网络元数据抽取系统的研究与实现[J].安徽电子信息职业技术学院学报,2004,3(5):10-13. 被引量：3
4何江,米娜,匡运臣,樊庆云,王霞,李朝生,王新伟,关伟,李桂海.黄河沉积物对稀土元素的吸附特性研究[J].环境科学学报,2004,24(4):607-612. 被引量：8
5李向阳,张亚非.一种网上图书信息抽取方法[J].情报学报,2004,23(6):655-660. 被引量：6
6刘剑兰,朱东华.信息抽取技术在情报监测中的应用[J].情报学报,2004,23(6):661-666. 被引量：6
7章明奎.污染土壤中重金属的优势流迁移[J].环境科学学报,2005,25(2):192-197. 被引量：19
8奚伟鹏,李昕,蒋凯,武港山.面向网上论坛的信息抽取技术[J].计算机工程,2005,31(4):66-68. 被引量：8
9朱继保,陈繁荣,卢龙,谢兴华.广东凡口Pb-Zn尾矿中重金属的表生地球化学行为及其对矿山环境修复的启示[J].环境科学学报,2005,25(3):414-422. 被引量：41
10王亮,朱征宇.基于扩展标记图的Web信息抽取器[J].计算机工程,2005,31(8):159-161. 被引量：2

引证文献4

1LI Yu,WANG Yan-bin,GOU Xin,SU Yi-bing,WANG Gang.Risk assessment of heavy metals in soils and vegetables around nonferrous metals mining and smelting sites,Baiyin,China[J].Journal of Environmental Sciences,2006,18(6):1124-1134. 被引量：84
2黄永文,李广建.数字图书馆中的ETL应用研究综述[J].现代图书情报技术,2007(12):1-5. 被引量：6
3赵金仿,赵艳,缪建明.网页信息抽取及其自动文本分类的实现[J].计算机技术与发展,2008,18(10):37-39. 被引量：7
4Mingxin Wang,Ning Wang,Boran Wang,Can Tian,Yanchun Liang,Guozhong Zhao,Xiaosong Han.The BBC News Hunter:A Novel Crawler for BBC News[J].国际计算机前沿大会会议论文集,2016(2):63-64.

二级引证文献97

1陈伟,王婷.白银市污灌区土壤-小麦系统镉赋存特征及其健康风险评价[J].核农学报,2020,0(4):878-886. 被引量：8
2LIU Quanji HU Chengxiao TAN Qiling SUN Xuecheng SU Jingjun LIANG Yuexiang.Effects of As on As uptake, speciation, and nutrient uptake by winter wheat (Triticum aestivum L.) under hydroponic conditions[J].Journal of Environmental Sciences,2008,20(3):326-331. 被引量：6
3李泽琴,侯佳渝,王奖臻.矿山环境土壤重金属污染潜在生态风险评价模型探讨[J].地球科学进展,2008,23(5):509-516. 被引量：36
4秦文淑,邹晓锦,仇荣亮.广州市蔬菜重金属污染现状及对人体健康风险分析[J].农业环境科学学报,2008,27(4):1638-1642. 被引量：82
5邹晓锦,仇荣亮,周小勇,黄穗虹.蔬菜重金属暴露接触对大宝山矿区及周边居民的健康风险[J].地理研究,2008,27(4):855-862. 被引量：24
6李军辉,卢瑛,尹伟,聂呈荣,吴大付,张朝,陈春霞,董飞.佛山市某工业区周边蔬菜重金属富集特征的研究[J].华南农业大学学报,2008,29(4):17-20. 被引量：12
7SHI Rong,JIA Yongfeng,WANG Chengzhi Institute of Applied Ecology,Chinese Academy of Sciences,Shenyang 110016,China.Competitive and cooperative adsorption of arsenate and citrate on goethite[J].Journal of Environmental Sciences,2009,21(1):106-112. 被引量：5
8尹伟,卢瑛,甘海华,李军辉,吴大付,陈春霞,张朝.佛山市某工业区周边蔬菜地土壤重金属含量与评价[J].农业环境科学学报,2009,28(3):508-512. 被引量：25
9周登,戴玉刚,付涛.基于树结构的Web信息抽取[J].计算机技术与发展,2009,19(9):38-41. 被引量：3
10甘雨,陈炳丰.自动分类和自动摘要在应急预案管理中的应用[J].现代计算机,2009,15(10):99-102.

1朱晴,姜利群,张言辉.半结构化的Deep Web信息抽取技术[J].电脑知识与技术（过刊）,2010,0(15):4312-4313.
2杨静,顾君忠,刘盈盈.用XML构造网络化多媒体课件[J].华东师范大学学报（自然科学版）,2000(2):28-36. 被引量：15
3李卫东.基于DOM的半结构化网页信息抽取算法[J].河北省科学院学报,2009,26(1):21-24. 被引量：2
4燕敏,岳萍,杜开峰.基于语义和版式的网上人物信息提取[J].微计算机信息,2010,26(12):145-147.
5于琨,蔡智,糜仲春,蔡庆生.基于路径学习的信息自动抽取方法[J].小型微型计算机系统,2003,24(12):2147-2149. 被引量：7
6邓健爽,郑启伦,彭宏,林旭东.基于关键词聚类和节点距离的网页信息抽取[J].计算机科学,2007,34(4):213-216. 被引量：8
7刘佳宾,陈超,邵正荣,吉翔华.基于机器学习的科技文摘关键词自动提取方法[J].计算机工程与应用,2007,43(14):170-172. 被引量：15
8蔡霞,张森,周宇.模式发现在Web抽取中的应用及设计[J].控制工程,2003,10(3):227-229. 被引量：7
9朱永生,王军.基于Web内容的一种数据自动抽取方法[J].计算机技术与发展,2012,22(5):87-89. 被引量：3
10温家凯.一种基于维基百科的多语种翻译词汇自动抽取方法[J].企业科技与发展,2016(7):129-133.

洛阳工业高等专科学校学报

2005年第3期

浏览历史

内容加载中请稍等...

基于Web的网页信息抽取方法的研究被引量：4

参考文献3

二级参考文献1

共引文献46

同被引文献41

引证文献4

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于Web的网页信息抽取方法的研究 被引量：4

参考文献3

二级参考文献1

共引文献46

同被引文献41

引证文献4

二级引证文献97

相关作者

相关机构

相关主题

浏览历史

基于Web的网页信息抽取方法的研究被引量：4