期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
互联网中XML网页的链接解析与信息采集
被引量:
2
Link Analysis and Info - mining of Internet Resources Based on XML/XSL
下载PDF
职称材料
导出
摘要
文章分析和介绍对互联网中XML+XSL网页资源链接解析和内容采集的方法,包括传统HTML中链接解析、XML转换为HTML后链接解析、手工定制下XML链接解析和传统HTML信息采集、XML信息抽取、XML转换为HT- ML的信息采集等。
作者
杜义华
焦文彬
机构地区
中国科学院计算机网络信息中心
出处
《计算机系统应用》
2005年第7期24-26,共3页
Computer Systems & Applications
关键词
信息采集
XML
互联网
解析
链接
HTML
网页资源
信息抽取
传统
定制
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
6
参考文献
4
共引文献
8
同被引文献
16
引证文献
2
二级引证文献
7
参考文献
4
1
Neel Sundaresan, Jeonghee Yi Mining, the Web for Relations, http :∥www9. org/w9cdrom/363/363.html.
2
Eric Ward, How Search Engines Use Link Analysis,http:∥searchenginewatch. com/searchday/article.php/2158431.
3
.XSL教程[EB/OL].http:∥www-900.ibm.com/devebperWorks/cn/xml/ccidnet/xslfund/index2. shtml,.
4
杜义华,及俊川.
通用互联网信息采集系统的设计与初步实现[J]
.计算机应用研究,2005,22(1):187-189.
被引量:9
二级参考文献
6
1
网景盛世技术开发中心.WebCateCPS互联网情报采集软件[EB/OL].http://www.webcate.net/solution.htm,2002-10.
2
中国期刊网CNKI数字图书馆.Ⅲ网络信息集成系统[EB/OL].http://211.151.90.152/3i/product.htm,2003-10.
3
魏子忠,张尧学.
一种基于Agent的因特网信息获取系统[J]
.计算机工程与设计,2001,22(2):23-26.
被引量:3
4
郭红,郭朝珍,苏群.
多网站信息采集与异构信息集成应用[J]
.福州大学学报(自然科学版),2001,29(5):24-27.
被引量:3
5
傅欣.
第三代搜索引擎的智能化趋势研究[J]
.现代图书情报技术,2002(6):28-30.
被引量:24
6
肖建华,蒋明,何瑗,柏文阳.
二次搜索系统的设计与实现[J]
.计算机应用研究,2003,20(9):123-126.
被引量:29
共引文献
8
1
杜义华,张亚.
网站信息管理发布系统设计与应用[J]
.计算机系统应用,2005,14(1):9-11.
被引量:12
2
李涛,王润孝,魏薇,罗志清.
基于LonWorks的设备管理系统的设计与实现——以铁路水电设备为例[J]
.制造业自动化,2006,28(10):37-39.
被引量:1
3
陈娟.
构建基于关联规则的网络行为挖掘系统[J]
.科学技术与工程,2007,7(13):3292-3295.
被引量:3
4
陈艳春.
竞争情报采集系统研究[J]
.石家庄铁道学院学报,2008,21(2):59-63.
5
杨艺,代春艳.
基于IOCC的定题Web信息发现机制研究[J]
.计算机工程与设计,2008,29(22):5906-5909.
被引量:1
6
刘瑛.
XML网页的链接解析与信息采集研究[J]
.硅谷,2010,3(10):89-89.
7
陈永江,仲兆满,陈宗华.
HTMLUNIT在网络信息采集系统中的应用[J]
.淮海工学院学报(自然科学版),2013,22(4):31-35.
被引量:1
8
谷俊,翁佳,许鑫.
面向情报获取的主题采集工具设计与实现[J]
.图书情报工作,2014,58(20):91-99.
被引量:2
同被引文献
16
1
史胜辉.
Ajax技术在WEB客户端开发中的应用[J]
.中国管理信息化(综合版),2006,9(6):88-90.
被引量:18
2
黄玲,陈龙.
基于网页分块的正文信息提取方法[J]
.计算机应用,2008,28(S2):326-328.
被引量:13
3
王琦,唐世渭,杨冬青,王腾蛟.
基于DOM的网页主题信息自动提取[J]
.计算机研究与发展,2004,41(10):1786-1792.
被引量:81
4
吕铁强,于满泉,孟庆发,周立德.
基于网页分块的个性化信息采集的研究与设计[J]
.微电子学与计算机,2005,22(10):120-123.
被引量:10
5
邱云飞,丁晓超.
基于Java实现模型动态调用[J]
.微计算机应用,2005,26(6):757-759.
被引量:2
6
张晶,陈褔生.
知识管理中的基于XML的知识存储[J]
.计算机应用研究,2006,23(1):69-70.
被引量:7
7
甘永成,陶舟.
e-Learning、知识管理与虚拟学习社区[J]
.电化教育研究,2006,27(1):18-22.
被引量:46
8
俞茜,刘运华.
基于知识管理理论的网络课程设计研究[J]
.远程教育杂志,2006,24(1):36-38.
被引量:2
9
李玉东,许晓兵.
知识管理与企业的网上学习系统[J]
.成都信息工程学院学报,2006,21(1):139-143.
被引量:2
10
李魁,程学旗,郭岩,张凯.
WWW论坛中的动态网页采集[J]
.计算机工程,2007,33(6):80-82.
被引量:11
引证文献
2
1
丁晓超,包振强.
面向软件开发技能的网络化教学平台设计[J]
.微计算机应用,2008,29(1):19-23.
2
胡凌云,胡桂兰,徐勇,李龙澍.
基于Web的新闻文本分类技术的研究[J]
.安徽大学学报(自然科学版),2010,34(6):66-70.
被引量:7
二级引证文献
7
1
陈建国.
基于Web结构的网站新闻采集系统的设计与实现[J]
.井冈山大学学报(自然科学版),2012,33(2):54-57.
被引量:3
2
薛春香,张玉芳.
面向新闻领域的中文文本分类研究综述[J]
.图书情报工作,2013,57(14):134-139.
被引量:24
3
李湘东,巴志超,黄莉.
基于加权隐含狄利克雷分配模型的新闻话题挖掘方法[J]
.计算机应用,2014,34(5):1354-1359.
被引量:14
4
卢玲,杨武,刘恒洋.
差错网络的文本分类反馈校正方法[J]
.重庆邮电大学学报(自然科学版),2014,26(6):790-795.
被引量:1
5
张兵,汤进,罗斌.
基于超链接和DOM结构树的网页标题实时抽取方法[J]
.计算机与现代化,2015(8):84-88.
被引量:2
6
兰秋军,李卫康,刘文星.
不同情境下中文文本分类模型的表现及选择[J]
.湖南大学学报(自然科学版),2016,43(4):141-146.
被引量:4
7
吴国祥.
网络挖掘研究综述[J]
.电脑知识与技术(过刊),2011,17(11X):7876-7877.
1
刘瑛.
XML网页的链接解析与信息采集研究[J]
.硅谷,2010,3(10):89-89.
2
卢壮.
新一代面向XML网页搜索引擎的模型[J]
.计算机系统应用,2001,10(7):39-41.
被引量:9
3
惠普推出新型FlowMFP数码多功能一体机[J]
.金融电子化,2012(12):94-95.
4
王必尧,王劲林,刘学.
基于优先级的视频内容采集策略研究[J]
.网络新媒体技术,2012,1(4):1-5.
5
罗清磊,李卫华.
利用Java实现基于XML的Web上的数据库挖掘Agent[J]
.现代计算机,2002,8(1):13-16.
被引量:1
6
江腾蛟,万常选.
针对XML文档集的关键词检索结果排序[J]
.计算机工程,2007,33(2):59-61.
被引量:3
7
单劼,王纯.
浅谈布隆过滤器在内容管理系统中的应用[J]
.软件,2016,37(1):28-31.
被引量:1
8
邢玲,史杏荣.
基于UCL的网页自动标引技术[J]
.计算机工程与应用,2004,40(17):148-151.
被引量:6
9
袁家政,须德,鲍泓.
基于结构与文本关键词相关度的XML网页分类研究[J]
.计算机研究与发展,2006,43(8):1361-1367.
被引量:13
10
王香港,刘功申,李生红.
高性能互联网信息监控系统的研究和实现[J]
.微计算机信息,2008,24(27):90-92.
被引量:8
计算机系统应用
2005年 第7期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部