期刊文献+

网页信息自动提取的设计与实现 被引量:1

下载PDF
导出
摘要 网页信息自动提取是一种重要的网络应用技术,用于提取各类网页的专门信息。网页信息自动提取的设计基于网页的半结构化特征,其流程是先获取HTML源文件,然后去掉HTML标记和无关信息,再进行语义匹配,提取信息到特定的数据结构,进行CSV格式化输出,就可以得到所需的信息。在网站企业化、网店普遍化和网络购物盛行的背景下,推广和应用网页信息自动提取技术,有着重要的经济价值和意义。
出处 《计算机光盘软件与应用》 2012年第18期187-188,共2页 Computer CD Software and Application
  • 相关文献

同被引文献4

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部