期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于分块重要性模型与Xpath的Web信息抽取的研究
1
作者
庞秋奔
顾平
杨小梅
《计算机与现代化》
2009年第8期73-75,79,共4页
网页分块方法使得Web信息抽取的单位由页面缩小为块。文中研究了网页分块的主要方法与基于学习的分块重要性模型,对Xpath的Web抽取方法进行分析。结合两者的优势提出一种基于分块重要性模型与Xpath结合的Web信息抽取方法,探讨了其设计过...
网页分块方法使得Web信息抽取的单位由页面缩小为块。文中研究了网页分块的主要方法与基于学习的分块重要性模型,对Xpath的Web抽取方法进行分析。结合两者的优势提出一种基于分块重要性模型与Xpath结合的Web信息抽取方法,探讨了其设计过程,并给出形式化描述与实验结果,结果表明该方法适合于抽取多记录型的网页。
展开更多
关键词
网页分块
块重要性权重
XPATH
web
信息抽取
下载PDF
职称材料
基于页面分块模型的PageRank算法研究
被引量:
4
2
作者
白似雪
刘华斌
《南昌大学学报(工科版)》
CAS
2008年第2期179-183,共5页
提出了一个基于页面分块重要性模型的PageRank改进算法。该算法考虑同一页面内属于不同分块的出链接有着不同的重要性,故对不同分块的出链接赋予相应的权重,从而更合理、更公正、更有效地计算页面的PageRank值。与以往的PageRank算法及...
提出了一个基于页面分块重要性模型的PageRank改进算法。该算法考虑同一页面内属于不同分块的出链接有着不同的重要性,故对不同分块的出链接赋予相应的权重,从而更合理、更公正、更有效地计算页面的PageRank值。与以往的PageRank算法及其改进算法相比,该算法以基于视觉特征的页面分块算法为核心,更好地反映了网页的特性,符合了用户的使用习惯,具有良好的效果。
展开更多
关键词
PAGERANK
页面分块重要性模型
链接分析
主题漂移
支持向量机
下载PDF
职称材料
面向导航型网页关键词自动抽取的视觉模型与算法
3
作者
彭浩
蔡美玲
+2 位作者
陈继锋
刘炽
余炳锐
《计算机应用》
CSCD
北大核心
2012年第8期2360-2363,2368,共5页
导航型网页中往往包含了大量的噪声信息,为自动提取网页中的关键词带来了较大的困难。为此,提出一个新的网页表示模型PIX-PAGE和导航型网页关键词自动抽取算法P-KEA。PIX-PAGE模型利用提出的区域合并算法,将一张网页分割为适当粒度的区...
导航型网页中往往包含了大量的噪声信息,为自动提取网页中的关键词带来了较大的困难。为此,提出一个新的网页表示模型PIX-PAGE和导航型网页关键词自动抽取算法P-KEA。PIX-PAGE模型利用提出的区域合并算法,将一张网页分割为适当粒度的区域;然后,依据人类视觉特点,对各区域进行视觉"奇异性"量化,同时利用奇异性传递规则进一步强化关键词相关区域的视觉"奇异性"。P-KEA根据PIX-PAGE模型模型的视觉量化结果,能够较准确地找到视觉突出区域中的关键词。实验结果表明,与基于DocView模型的算法DVM相比,P-KEA的准确率平均提高了20.9%。
展开更多
关键词
区域合并
视觉量化
网页表示模型
关键词自动抽取
下载PDF
职称材料
利用分块重要度进行中文网页分类的研究
4
作者
段昕
马军
宋玲
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2006年第3期1-4,共4页
由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作.但网页可以划分成不同的块,对分类而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网...
由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作.但网页可以划分成不同的块,对分类而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网页分块技术,并通过实验验证了基于分块重要度的主题网页分类法的分类质量优于传统的主题网页分类法.
展开更多
关键词
网页分割
块重要度
网页分类
下载PDF
职称材料
题名
基于分块重要性模型与Xpath的Web信息抽取的研究
1
作者
庞秋奔
顾平
杨小梅
机构
广西大学计算机电子信息学院
出处
《计算机与现代化》
2009年第8期73-75,79,共4页
文摘
网页分块方法使得Web信息抽取的单位由页面缩小为块。文中研究了网页分块的主要方法与基于学习的分块重要性模型,对Xpath的Web抽取方法进行分析。结合两者的优势提出一种基于分块重要性模型与Xpath结合的Web信息抽取方法,探讨了其设计过程,并给出形式化描述与实验结果,结果表明该方法适合于抽取多记录型的网页。
关键词
网页分块
块重要性权重
XPATH
web
信息抽取
Keywords
page segment
value of
block
importance
Xpath
web
in
for
mation extraction
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于页面分块模型的PageRank算法研究
被引量:
4
2
作者
白似雪
刘华斌
机构
南昌大学计算机科学与技术系
出处
《南昌大学学报(工科版)》
CAS
2008年第2期179-183,共5页
基金
江西省教育厅科技计划资助项目(赣教技字[2006]36号)
文摘
提出了一个基于页面分块重要性模型的PageRank改进算法。该算法考虑同一页面内属于不同分块的出链接有着不同的重要性,故对不同分块的出链接赋予相应的权重,从而更合理、更公正、更有效地计算页面的PageRank值。与以往的PageRank算法及其改进算法相比,该算法以基于视觉特征的页面分块算法为核心,更好地反映了网页的特性,符合了用户的使用习惯,具有良好的效果。
关键词
PAGERANK
页面分块重要性模型
链接分析
主题漂移
支持向量机
Keywords
PageRank
block importance models for web pages
link analysis
topic drift
SVM
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向导航型网页关键词自动抽取的视觉模型与算法
3
作者
彭浩
蔡美玲
陈继锋
刘炽
余炳锐
机构
湖南涉外经济学院计算机科学与技术学院
中南大学信息科学与工程学院
中国电力出版社用电技术出版中心
出处
《计算机应用》
CSCD
北大核心
2012年第8期2360-2363,2368,共5页
基金
国家自然科学基金资助项目(60803024)
湖南省自然科学基金资助项目(10JJ6092)
+1 种基金
湖南省大学生研究性学习和创新性实验计划项目(湘教通[2011]272号
编号:393)
文摘
导航型网页中往往包含了大量的噪声信息,为自动提取网页中的关键词带来了较大的困难。为此,提出一个新的网页表示模型PIX-PAGE和导航型网页关键词自动抽取算法P-KEA。PIX-PAGE模型利用提出的区域合并算法,将一张网页分割为适当粒度的区域;然后,依据人类视觉特点,对各区域进行视觉"奇异性"量化,同时利用奇异性传递规则进一步强化关键词相关区域的视觉"奇异性"。P-KEA根据PIX-PAGE模型模型的视觉量化结果,能够较准确地找到视觉突出区域中的关键词。实验结果表明,与基于DocView模型的算法DVM相比,P-KEA的准确率平均提高了20.9%。
关键词
区域合并
视觉量化
网页表示模型
关键词自动抽取
Keywords
block
composition
visual characteristic measurement
web
page representation model
automatic keywordsextraction
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
利用分块重要度进行中文网页分类的研究
4
作者
段昕
马军
宋玲
机构
山东大学计算机科学与技术学院
山东建筑大学计算机科学与技术系
出处
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2006年第3期1-4,共4页
基金
教育部骨干教师基金资助项目(教技司[2000]65)
文摘
由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作.但网页可以划分成不同的块,对分类而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网页分块技术,并通过实验验证了基于分块重要度的主题网页分类法的分类质量优于传统的主题网页分类法.
关键词
网页分割
块重要度
网页分类
Keywords
web
-page segmentation
importance
of
block
web
-page classification
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于分块重要性模型与Xpath的Web信息抽取的研究
庞秋奔
顾平
杨小梅
《计算机与现代化》
2009
0
下载PDF
职称材料
2
基于页面分块模型的PageRank算法研究
白似雪
刘华斌
《南昌大学学报(工科版)》
CAS
2008
4
下载PDF
职称材料
3
面向导航型网页关键词自动抽取的视觉模型与算法
彭浩
蔡美玲
陈继锋
刘炽
余炳锐
《计算机应用》
CSCD
北大核心
2012
0
下载PDF
职称材料
4
利用分块重要度进行中文网页分类的研究
段昕
马军
宋玲
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2006
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部