期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于Boost.Regex的网页信息抽取
被引量:
1
下载PDF
职称材料
导出
摘要
正则表达式是一种用于字符串模式匹配和替换的强有力工具。介绍了在VC++中如何配置Boost.Regex,实现基于正则表达式网页信息抽取类CHtmlcodeIE,从而完成了网页信息高效抽取。
作者
吴鹏飞
马凤娟
出处
《电脑编程技巧与维护》
2009年第15期49-52,63,共5页
Computer Programming Skills & Maintenance
关键词
正则表达式
Boost.Regex
网页
信息抽取
VC++
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
8
参考文献
4
共引文献
31
同被引文献
5
引证文献
1
二级引证文献
39
参考文献
4
1
杜冬梅,许彩欣,苏健.
浅谈正则表达式在web系统中的应用[J]
.计算机系统应用,2007,16(8):87-90.
被引量:23
2
程冲,黄水清.
利用正则表达式解析新闻网页的算法研究[J]
.农业图书情报学刊,2005,17(4):5-8.
被引量:7
3
Boost.Regex[OL].http://www.boost.org.2008.
4
曹光琦.
Boost.Regex——C++正则表达式快速入门[J]
.程序员,2004(4):78-81.
被引量:4
二级参考文献
8
1
The Single UNIX Specification, Version 2 [OL].http://www. opengroup.org/onlinepubs/007908799/xbd/re.html
2
吕晓波.正则表达式使用详解[OL].http://dev.csdn.net/article/8/8254.shtm,.
3
SUN公司.The Java Tutorial[OL].http:http://ava.sun.com/docs/books/tutorial/index.html,.
4
程冲.基于Java平台的网络信息检索定题服务系统研究报告[Z].南京农业大学,2004..
5
[美]埃克尔(Eckel,B.)陈昊鹏 等译,Java编程思想,第3版,机械工业出版社,2005.
6
耿详义,张跃平,java2实用教程[M].清华大学出版社,2006[3].
7
闫宏飞,李晓明.
关于中国Web的大小、形状和结构[J]
.计算机研究与发展,2002,39(8):958-967.
被引量:17
8
周源远,王继成,郑刚,张福炎.
Web页面清洗技术的研究与实现[J]
.计算机工程,2002,28(9):48-50.
被引量:20
共引文献
31
1
赵仁杰,李众立.
网页清洗系统基于静态正则表达式的实现[J]
.微计算机信息,2007,23(36):226-227.
被引量:5
2
高丙坤,成战刚,李倩.
基于正则表达式的信息滤除算法[J]
.现代计算机,2008,14(2):54-55.
被引量:6
3
谷俊.
基于互联网的信息采集系统的设计与实现[J]
.情报探索,2008(12):65-67.
4
李超峰,干峰,胡珊.
正则表达式在医院信息系统中的应用研究[J]
.医学信息,2009,22(1):1-3.
被引量:1
5
李宏伟,张志远.
Web实体提取在垂直搜索中的应用研究[J]
.新技术新工艺,2008(12):62-65.
6
王红卫,马红,张素智,赵宇.
基于预定义模式的Web网页结构化数据抽取[J]
.郑州轻工业学院学报(自然科学版),2008,23(6):1-3.
被引量:1
7
李宏伟,史培中,张素智.
一种高效Web数据抽取包装器的设计与实现[J]
.计算机技术与发展,2009,19(2):123-126.
被引量:2
8
李宏伟,史培中,张素智.
一种可行的Web数据抽取包装器的设计方法[J]
.计算机应用与软件,2009,26(3):110-113.
被引量:3
9
白琳.
正则表达式在动态网页开发中的应用[J]
.湖南科技学院学报,2009,30(4):134-136.
被引量:2
10
丁浩,李跃华.
广告审查系统中绝对化词语自动审查的实现[J]
.电脑知识与技术,2009,5(10):7934-7936.
同被引文献
5
1
杨桢,赵燕平,朱东华.
基于正则表达式的信息抽取系统在国防技术监测中的应用[J]
.北京理工大学学报,2006,26(z1):74-78.
被引量:9
2
崔继馨,张鹏,杨文柱.
基于DOM的Web信息抽取[J]
.河北农业大学学报,2005,28(3):90-93.
被引量:12
3
蒲筱哥.
基于Web的信息抽取技术研究综述[J]
.现代情报,2007,27(10):215-219.
被引量:18
4
张静,张妍.
正则表达式及其在信息抽取中的应用[J]
.电脑知识与技术,2009,5(5X):3867-3868.
被引量:14
5
杨文柱,徐林昊,陈少飞,郝亚南,李天柱.
基于XPath的Web信息抽取的设计与实现[J]
.计算机工程,2003,29(16):82-83.
被引量:6
引证文献
1
1
胡军伟,秦奕青,张伟.
正则表达式在Web信息抽取中的应用[J]
.北京信息科技大学学报(自然科学版),2011,26(6):86-89.
被引量:39
二级引证文献
39
1
汪材印.
正则表达式在网络蜘蛛抽取问答系统信息中的应用[J]
.宿州学院学报,2012,27(5):32-35.
2
李良杰,牟永敏,张志华.
面向嵌入式系统函数动态调用路径拆分与匹配[J]
.数据通信,2012(4):22-25.
3
罗佳,叶猛,江舟.
基于网络侧的手机隐私泄露检测方案及实现[J]
.电视技术,2013,37(5):99-102.
被引量:1
4
袁志.
在线题库的一种便捷录入方法及其实现[J]
.软件工程师,2014(9):29-31.
被引量:2
5
陈大业,刘佳,卢凤晖,李丙辉.
基于Web的坐标数据解析方法[J]
.邮电设计技术,2015(5):43-47.
被引量:2
6
邓炳光,郭慧兰,张治中.
移动互联网用户行为分析系统中聚焦爬虫的设计与实现[J]
.重庆邮电大学学报(自然科学版),2015,27(3):359-365.
被引量:4
7
张兵,汤进,罗斌.
基于超链接和DOM结构树的网页标题实时抽取方法[J]
.计算机与现代化,2015(8):84-88.
被引量:2
8
雷东升,翟东升,张杰,李阳.
专利数据自动采集系统的设计与构建[J]
.情报探索,2015(10):56-60.
9
陈丽娜,方沩,司海平,曹永生.
农作物种质资源本体构建研究[J]
.作物学报,2016,42(3):407-414.
被引量:1
10
梁小鸥,杨咏.
浅析正则表达式在教材信息收集中的应用[J]
.电脑知识与技术,2016,0(6):156-157.
被引量:2
1
曹光琦.
Boost.Regex——C++正则表达式快速入门[J]
.程序员,2004(4):78-81.
被引量:4
2
常猛.
正则表达式的Web应用[J]
.商情,2009(8):30-30.
3
姜文志,范洪达.
字符串模式匹配[J]
.交通与计算机,1989(4):92-93.
4
王金江.
字符串模式匹配的新算法[J]
.科技信息,2007(34):85-85.
被引量:2
5
巫喜红.
字符串模式匹配算法性能测试[J]
.嘉应学院学报,2006,24(6):87-90.
被引量:1
6
陈芳,沈虹,张霞.
一种字符串模式匹配算法的实现[J]
.西安工业大学学报,2007,27(3):272-273.
被引量:3
7
蒋文沛.
对字符串模式匹配KMP算法的探讨[J]
.南宁师范高等专科学校学报,2001,18(2):72-74.
被引量:5
8
刘建荣,喻涛.
浅谈字符串模式匹配的常用算法[J]
.信息通信,2014,27(5):99-99.
被引量:1
9
王婷婷.
字符串模糊匹配算法的探讨[J]
.现代计算机,2012,18(1):12-15.
被引量:3
10
张燕飞,李亚琼.
有关KMP模式匹配算法的探索[J]
.计算机光盘软件与应用,2014,17(8):92-92.
电脑编程技巧与维护
2009年 第15期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部