期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多种策略的页面内容提取算法
被引量:
4
1
作者
高琰
谷士文
谭立球
《西南交通大学学报》
EI
CSCD
北大核心
2007年第4期473-477,共5页
针对W eb页面存在与主题无关的噪音的问题,提出了基于页面结构与页面内容相结合的多策略页面内容提取算法.该算法根据改进的VIPS(基于视觉信息的页面分割算法)生成页面的块结构树,通过定义内聚度阈值和块结构树的最大深度,实现了块结构...
针对W eb页面存在与主题无关的噪音的问题,提出了基于页面结构与页面内容相结合的多策略页面内容提取算法.该算法根据改进的VIPS(基于视觉信息的页面分割算法)生成页面的块结构树,通过定义内聚度阈值和块结构树的最大深度,实现了块结构树中不同区域内不同分块粒度的要求;根据W eb页面提供的结构信息和内容信息提取块结构树叶子节点中的"主题"块和"主题相关"块;最后,对主题块和主题相关块的内容进行合并,提取页面的主要内容.实验表明,对任意下载、不同内容类型的页面,该算法都能有效地提取页面内容.
展开更多
关键词
vips
(基于视觉信息的页面分割算法)
内聚度
最大深度
内容信息
结构信息
下载PDF
职称材料
一种新颖的CRE用户评论信息抽取技术
被引量:
2
2
作者
李慧
张舒
+2 位作者
顾天竺
陈晓红
吴颜
《计算机应用》
CSCD
北大核心
2006年第10期2509-2512,共4页
准确挖掘商务网站中的用户评论对于商家进行有效的推荐具有重要意义。提出了一种新颖的用户评论抽取(CRE)算法进行评论信息的抽取。该算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。实验结果证明了该算法具...
准确挖掘商务网站中的用户评论对于商家进行有效的推荐具有重要意义。提出了一种新颖的用户评论抽取(CRE)算法进行评论信息的抽取。该算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。实验结果证明了该算法具有较高的查全率与查准率。
展开更多
关键词
用户评论抽取
信息抽取
基于视觉的页面分块
下载PDF
职称材料
基于广义隐马尔可夫模型的网页信息抽取方法
被引量:
3
3
作者
王静
姚勇
刘志镜
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2007年第11期49-52,共4页
针对网页所特有的基于版面结构的特点,利用基于视觉的网页分割算法VIPS对网页分块,得到一种新的状态转移序列,取代了传统的状态转移序列。通过二阶Markov链改进广义隐马尔可夫模型(GHMM)的状态转移和输出观测值假设条件,提出了二阶的广...
针对网页所特有的基于版面结构的特点,利用基于视觉的网页分割算法VIPS对网页分块,得到一种新的状态转移序列,取代了传统的状态转移序列。通过二阶Markov链改进广义隐马尔可夫模型(GHMM)的状态转移和输出观测值假设条件,提出了二阶的广义隐马尔可夫模型。最后通过实验说明改进的GHMM对于网页信息抽取有很高的精确率。
展开更多
关键词
基于视觉的网页分割
广义隐马尔可夫模型
二阶Markov链
WEB信息抽取
下载PDF
职称材料
题名
基于多种策略的页面内容提取算法
被引量:
4
1
作者
高琰
谷士文
谭立球
机构
中南大学信息科学与工程学院
出处
《西南交通大学学报》
EI
CSCD
北大核心
2007年第4期473-477,共5页
文摘
针对W eb页面存在与主题无关的噪音的问题,提出了基于页面结构与页面内容相结合的多策略页面内容提取算法.该算法根据改进的VIPS(基于视觉信息的页面分割算法)生成页面的块结构树,通过定义内聚度阈值和块结构树的最大深度,实现了块结构树中不同区域内不同分块粒度的要求;根据W eb页面提供的结构信息和内容信息提取块结构树叶子节点中的"主题"块和"主题相关"块;最后,对主题块和主题相关块的内容进行合并,提取页面的主要内容.实验表明,对任意下载、不同内容类型的页面,该算法都能有效地提取页面内容.
关键词
vips
(基于视觉信息的页面分割算法)
内聚度
最大深度
内容信息
结构信息
Keywords
vips ( visual based page segment)
degree of coherence
maximum depth
content information
structure information
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种新颖的CRE用户评论信息抽取技术
被引量:
2
2
作者
李慧
张舒
顾天竺
陈晓红
吴颜
机构
淮海工学院计算机科学系
扬州大学信息工程学院
出处
《计算机应用》
CSCD
北大核心
2006年第10期2509-2512,共4页
基金
江苏省自然科学基金项目资助项目(BK2005046)
文摘
准确挖掘商务网站中的用户评论对于商家进行有效的推荐具有重要意义。提出了一种新颖的用户评论抽取(CRE)算法进行评论信息的抽取。该算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。实验结果证明了该算法具有较高的查全率与查准率。
关键词
用户评论抽取
信息抽取
基于视觉的页面分块
Keywords
Customer Review Extraction(CRE)
information extraction
Vision-
based
page
segment
ation(
vips
)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于广义隐马尔可夫模型的网页信息抽取方法
被引量:
3
3
作者
王静
姚勇
刘志镜
机构
西安电子科技大学计算机学院
出处
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2007年第11期49-52,共4页
基金
国家自然科学基金资助项目(60573139)
文摘
针对网页所特有的基于版面结构的特点,利用基于视觉的网页分割算法VIPS对网页分块,得到一种新的状态转移序列,取代了传统的状态转移序列。通过二阶Markov链改进广义隐马尔可夫模型(GHMM)的状态转移和输出观测值假设条件,提出了二阶的广义隐马尔可夫模型。最后通过实验说明改进的GHMM对于网页信息抽取有很高的精确率。
关键词
基于视觉的网页分割
广义隐马尔可夫模型
二阶Markov链
WEB信息抽取
Keywords
vision
based
page
segment
ation(
vips
)
generalized hidden Markov model (GHMM)
second-order Markov chain
Web information extraction(IE)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多种策略的页面内容提取算法
高琰
谷士文
谭立球
《西南交通大学学报》
EI
CSCD
北大核心
2007
4
下载PDF
职称材料
2
一种新颖的CRE用户评论信息抽取技术
李慧
张舒
顾天竺
陈晓红
吴颜
《计算机应用》
CSCD
北大核心
2006
2
下载PDF
职称材料
3
基于广义隐马尔可夫模型的网页信息抽取方法
王静
姚勇
刘志镜
《山东大学学报(理学版)》
CAS
CSCD
北大核心
2007
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部