网页信息自动提取的设计与实现被引量：1

下载PDF

导出

摘要网页信息自动提取是一种重要的网络应用技术,用于提取各类网页的专门信息。网页信息自动提取的设计基于网页的半结构化特征,其流程是先获取HTML源文件,然后去掉HTML标记和无关信息,再进行语义匹配,提取信息到特定的数据结构,进行CSV格式化输出,就可以得到所需的信息。在网站企业化、网店普遍化和网络购物盛行的背景下,推广和应用网页信息自动提取技术,有着重要的经济价值和意义。

作者栗勇兵韩平董启雄

机构地区装备学院信息管理中心

出处《计算机光盘软件与应用》 2012年第18期187-188,共2页 Computer CD Software and Application

关键词网页信息提取设计

分类号 TP311.1 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

同被引文献4

1王存昕,蒋文蓉.针对淘宝商家客户管理系统的研究与开发[J].上海第二工业大学学报,2011,28(2):165-170. 被引量：2
2朱向彩,万齐飞.基于网络爬虫的优惠商品搜索平台研究[J].周口师范学院学报,2014,31(2):129-131. 被引量：1
3刘宇.网络交易数据挖掘分析系统设计[J].电脑编程技巧与维护,2014(23):50-51. 被引量：3
4王伟.网络数据采集[J].电子制作,2014,22(6X):173-174. 被引量：1

引证文献1

1陈阳.基于淘宝某商品销售量监控系统[J].科技经济市场,2016(2):170-171. 被引量：2

二级引证文献2

1孔庆华.C2C模式下的淘宝创业网上销售管理系统设计与实现[J].电子设计工程,2017,25(15):19-21. 被引量：3
2张梦凡,冯涛.基于电子商务链面向淘宝创业者的网上销售管理系统设计[J].风景名胜,2019(2):297-298.

1黄光芳.正则表达式在远程网页下载中的应用[J].计算机与信息技术,2007(3):72-74. 被引量：2
2李蕾,王劲林,白鹤,胡晶晶.基于FFT的网页正文提取算法研究与实现[J].计算机工程与应用,2007,43(30):148-151. 被引量：15
3裘宗燕,程羽心,隗刚,张欣.C++程序的格式化输出[J].Internet信息世界,2002(11):86-89.
4郭翠英.格式化输出XML文档的通用解决方案[J].山西青年管理干部学院学报,2011,24(4):99-102. 被引量：1
5芮学来.用VB6.0实现抗压强度成果的格式化输出[J].科技视界,2013(27):79-79.
6袁辽东.Flash动画任我下[J].网络与信息,2004,18(5):87-87.
7陈晓军.调高安全级别轻松复制网页[J].电脑爱好者,2011(13):22-22.
8杨建华.怎样实现.NET/C#的格式化输出[J].电脑编程技巧与维护,2010(23):88-89.
9邵瑛,陆月明.基于优化正则表达式的文本告警信息的提取和分析[J].微型电脑应用,2010(5):16-18. 被引量：2
10杨小献,赵云娣,谢自美.基于规则的柔性综合统计报表技术[J].计算机应用研究,2005,22(12):54-56. 被引量：5

计算机光盘软件与应用

2012年第18期

浏览历史

内容加载中请稍等...

网页信息自动提取的设计与实现被引量：1

同被引文献4

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

网页信息自动提取的设计与实现 被引量：1

同被引文献4

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

网页信息自动提取的设计与实现被引量：1