基于XML的Web信息提取技术研究被引量：1

Study on Web Information Extraction Technology Based on XML

下载PDF

导出

摘要研究Web信息提取技术,提出数据获取、规则定义和规则执行3个步骤的基于XML的半结构化Web信息提取方法,为进一步满足Web信息提取提供了一种高效的新方法。 Studies on extraction technology of Web information extraction technology, proposes data acquisition, definition of rules and rules administer for the object-based half-structured of Web information extraction based on XML, provides efficient methods for the further information extraction.

作者张宗平李海雁

机构地区广东出入境检验检疫局信息中心

出处《现代计算机》 2007年第8期29-30,共2页 Modern Computer

关键词 WEB XML 半结构化信息提取 Web XML Half-Structured Information Extraction

分类号 TP393.09 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1邹涛,王继成,张福炎.基于WWW的资料搜集系统的设计与实现[J].情报学报,1999,18(3):195-201. 被引量：32
2陈玉芳,葛燧和.一个基于XML的WEB数据收集模型的研究[J].计算机工程与应用,2004,40(10):150-152. 被引量：18
3姚全珠,李献令,孟丽.基于XML的构件库管理框架的研究与实现[J].计算机工程与应用,2006,42(21):78-80. 被引量：8
4陈红叶.基于HTML和XML的信息提取方法研究[J].微机发展,2003,13(a02):54-55. 被引量：3
5宋中山,曾广平.基于XML的Web数据挖掘技术[J].中南民族大学学报（自然科学版）,2005,24(1):64-67. 被引量：7
6李效东,顾毓清.基于DOM的Web信息提取[J].计算机学报,2002,25(5):526-533. 被引量：101

二级参考文献43

1徐振航,刘莉芹.XML与面向Web的数据挖掘技术[J].软件世界,2000(10):120-122. 被引量：16
2Jackson J Myllymaki J.基于Web的数据挖掘:自动抽取用HTM、XML和Java编写的信息[J／0L].http:／／www.IBM.com.2001.6.,.
3孟小峰.数据挖掘走向Internet .微电脑世界,2001,(52).
4Mobasher B,Jain N,Han E H,Srivastava J. 1996, Web Mining: Pattern Discovery from World Wide Web Transactions[ R]. Technical Report 96 - 050,1996.
5Jussi Myllymak.Effective Web Data Extraction with standard XML Technologies.http://www.research.ibm.com/people/j/jussi/papers/ANDES/ANDES.pdf.
6Raymond Kosala,Heodrid Blocked.Web Mining Research :A Survey.ACM SIGKDD,2000-07.
7Oualnid H,Karmouch A.Converting Web pages into well-formed XML documents.Communications,1999,ICC'99,1999 IEEE International Conference on,1999; 1:676～680.
8W3C.Extensible Markup Language(XML).http://www.w3.org/xml/156 2004.10计算机工程与应用.
9W3C.Resource Description Framework(RDF) Schema Specification 1.0.http://www.w3.org/TR/2000/CR-rdf-schema20000327,2000-03-27.
10Stefan Haustein.Utilisting an Ontology Based Repository to Connect Web Miners and Application Agents.http://www-ai.cs.uni-dortmund.de.

共引文献162

1王丽,唐建雄.基于DOM和网页模板的Web信息抽取[J].电脑知识与技术（过刊）,2007(18):1617-1619. 被引量：1
2杨桢,赵燕平,朱东华.基于正则表达式的信息抽取系统在国防技术监测中的应用[J].北京理工大学学报,2006,26(z1):74-78. 被引量：9
3欧健文,董守斌,蔡斌.模板化网页主题信息的提取方法[J].清华大学学报（自然科学版）,2005,45(S1):1743-1747. 被引量：70
4赵燕平,朱东华.科技信息的网络动态监测和信息自动获取技术研究[J].科学学研究,2003,21(z1):230-237. 被引量：6
5刘春霞.浅谈数据挖掘技术[J].科技信息,2008(28).
6孙皓,董守斌.基于标签密度的自适应正文提取方法[J].郑州大学学报（理学版）,2009,41(1):44-47. 被引量：3
7宋聚平,王永成.搜索引擎中的信息存储技术[J].计算机工程,2000,26(S1):716-720.
8罗小玲.网络学术信息资源的检索方法[J].现代图书情报技术,2003(S1):73-74. 被引量：2
9王茹,宋瀚涛,陆玉昌.网页数据自动抽取系统[J].计算机工程与应用,2004,40(19):135-138. 被引量：8
10王茹,宋瀚涛,陆玉昌.基于树自动机的网页数据抽取[J].北京理工大学学报,2004,24(9):790-793. 被引量：6

同被引文献8

1林敬州,范凌,龚志强.如何高效监管空港出入境快件工作[J].中国检验检疫,2007(5):28-29. 被引量：2
2张宗平,张咏.网络数字视频监控系统设计与实现[J].甘肃科技,2007,23(9):24-26. 被引量：7
3张宗平.基于RFID的监管信息系统的设计与实现[J].微计算机信息,2008,24(23):247-248. 被引量：9
4张宗平,马冰冰,莫灵江.基于ASP.NET的网络培训系统的研究[J].现代计算机,2011,17(13):52-54. 被引量：3
5胡建光,罗时龙,张宗平.基于Webwork+Spring+iBATIS的企业信用管理应用研究[J].现代计算机,2011,17(14):59-62. 被引量：2
6顾晓磊.江苏入境国际邮件检疫监管质量分析[J].商场现代化,2012(9):3-3. 被引量：2
7张宗平,张咏,胡建光,罗时龙.检验检疫区域数据交换中心应用研究[J].现代计算机（中旬刊）,2013(12):51-53. 被引量：1
8梁振宇,王金丽.国际邮寄物进出境检疫工作势在必行[J].吉林农业,2015(1):125-125. 被引量：1

引证文献1

1张宗平,莫灵江,黄坚.国际邮件快件检验检疫监管系统应用研究[J].现代计算机,2016,22(19):69-72. 被引量：1

二级引证文献1

1皋司虎,魏晓娟,李宝明.首都机场口岸入境非法检快件检验检疫风险管理模式初探[J].检验检疫学刊,2018,28(2):42-46.

1竺卫东,何志均.一种适合于主动数据库的事务模型——基于图的事务模型及其并行机制[J].计算机应用研究,1998,15(5):22-24.
2刘辉,麻志毅,邵维忠.一种基于图转换的模型重构描述语言[J].软件学报,2009,20(8):2087-2101. 被引量：5
3左万利,刘居红,张宗来.主动规则执行终止性分析算法的修正[J].吉林大学自然科学学报,2000(2):32-36. 被引量：1
4张鹏,闻扬,谢歆.支持多协议的工作流体系结构[J].控制工程,2010,17(S3):198-200.
5冯玉才,何英华.一种关系数据库系统中主动规则的实现策略[J].华中理工大学学报,1999,27(10):50-52. 被引量：2
6唐红雨.用Visual FoxPro5.0实现PowerPoint2000中的动态效果[J].镇江高专学报,2002,15(2):52-54.
7董永权,李庆忠,丁艳辉,彭朝晖.A Query Interface Matching Approach Based on Extended Evidence Theory for Deep Web[J].Journal of Computer Science & Technology,2010,25(3):537-547. 被引量：2
8肖兵,卢炎生,瞿彬彬.ECA规则中复合事件的CCPN建模与检测[J].计算机工程与设计,2005,26(9):2297-2299. 被引量：1
9胡勤友,施朝健,陈海山,危强.基于Jess规则的数据库通知服务[J].上海海事大学学报,2006,27(1):44-48. 被引量：5
10徐长醒,刘云生,许贵平.基于图的主动数据库E-RG规则执行模型研究[J].小型微型计算机系统,2002,23(5):600-602. 被引量：1

现代计算机

2007年第8期

浏览历史

内容加载中请稍等...

基于XML的Web信息提取技术研究被引量：1

参考文献6

二级参考文献43

共引文献162

同被引文献8

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于XML的Web信息提取技术研究 被引量：1

参考文献6

二级参考文献43

共引文献162

同被引文献8

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于XML的Web信息提取技术研究被引量：1