期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于DIV标签树的网页主题信息抽取方法
被引量:
1
1
作者
欧阳柳波
杨柱
易显
《计算机系统应用》
2010年第7期193-196,139,共5页
随着CSS+DIV布局方式逐渐成为网页结构布局的主流,对此类网页进行高效的主题信息抽取已成为专业搜索引擎的迫切任务之一。提出一种基于DIV标签树的网页主题信息抽取方法,首先根据DIV标签把HTML文档解析成DIV森林,然后过滤掉DIV标签树中...
随着CSS+DIV布局方式逐渐成为网页结构布局的主流,对此类网页进行高效的主题信息抽取已成为专业搜索引擎的迫切任务之一。提出一种基于DIV标签树的网页主题信息抽取方法,首先根据DIV标签把HTML文档解析成DIV森林,然后过滤掉DIV标签树中的噪声结点并且建立STU-DIV模型树,最后通过主题相关度分析和剪枝算法,剪掉与主题信息无关的DIV标签树。通过对多个新闻网站的网页进行分析处理,实验证明此方法能够有效地抽取新闻网页的主题信息。
展开更多
关键词
主题信息抽取
DIV标签树
STU-DIV模型树
主题相关度
剪枝算法
下载PDF
职称材料
面向用户体验的大型网站网页分类更新策略
被引量:
1
2
作者
欧阳柳波
易显
+1 位作者
李学勇
杨柱
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第9期18-21,共4页
针对大型网站的网页特征,综合考虑网页时新性(更新度)、重要性及对Web服务器的友好性等因素,设计了一种面向用户体验的分类网页更新策略(三类别更新策略).根据网页变化的快慢,将网页分成速变、多变及少变3类,然后根据用户行为确定不同...
针对大型网站的网页特征,综合考虑网页时新性(更新度)、重要性及对Web服务器的友好性等因素,设计了一种面向用户体验的分类网页更新策略(三类别更新策略).根据网页变化的快慢,将网页分成速变、多变及少变3类,然后根据用户行为确定不同类别网页的更新速度和更新时间段,从而实现分类网页更新.实例分析表明,这种策略提高了搜索引擎中大型网站网页更新的效率,缓解了Web服务器的压力,并可保证用户对于检索结果的及时性和正确性.
展开更多
关键词
互联网
搜索引擎
网页变化
网页更新
用户体验
原文传递
题名
基于DIV标签树的网页主题信息抽取方法
被引量:
1
1
作者
欧阳柳波
杨柱
易显
机构
湖南大学软件学院
出处
《计算机系统应用》
2010年第7期193-196,139,共5页
基金
国家自然科学基金(60970098
60803024)
文摘
随着CSS+DIV布局方式逐渐成为网页结构布局的主流,对此类网页进行高效的主题信息抽取已成为专业搜索引擎的迫切任务之一。提出一种基于DIV标签树的网页主题信息抽取方法,首先根据DIV标签把HTML文档解析成DIV森林,然后过滤掉DIV标签树中的噪声结点并且建立STU-DIV模型树,最后通过主题相关度分析和剪枝算法,剪掉与主题信息无关的DIV标签树。通过对多个新闻网站的网页进行分析处理,实验证明此方法能够有效地抽取新闻网页的主题信息。
关键词
主题信息抽取
DIV标签树
STU-DIV模型树
主题相关度
剪枝算法
Keywords
extraction of topic information
DIV tag-tree
STU-DIV model-tree
topic corelation
Cut-Tree algorithm
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向用户体验的大型网站网页分类更新策略
被引量:
1
2
作者
欧阳柳波
易显
李学勇
杨柱
机构
湖南大学软件学院
中南大学信息科学与工程学院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第9期18-21,共4页
基金
国家自然科学基金资助项目(60970098
60803024)
文摘
针对大型网站的网页特征,综合考虑网页时新性(更新度)、重要性及对Web服务器的友好性等因素,设计了一种面向用户体验的分类网页更新策略(三类别更新策略).根据网页变化的快慢,将网页分成速变、多变及少变3类,然后根据用户行为确定不同类别网页的更新速度和更新时间段,从而实现分类网页更新.实例分析表明,这种策略提高了搜索引擎中大型网站网页更新的效率,缓解了Web服务器的压力,并可保证用户对于检索结果的及时性和正确性.
关键词
互联网
搜索引擎
网页变化
网页更新
用户体验
Keywords
internet
search engines
webpage change
webpage refresh
user's experience
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于DIV标签树的网页主题信息抽取方法
欧阳柳波
杨柱
易显
《计算机系统应用》
2010
1
下载PDF
职称材料
2
面向用户体验的大型网站网页分类更新策略
欧阳柳波
易显
李学勇
杨柱
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部