期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于扩展DOM树的XML SCHEMA文档转换为数据库模式算法
1
作者
刘必广
《武夷学院学报》
2011年第2期56-60,共5页
通过分析XML文档转换成数据库文件存在的问题,提出基于扩展DOM树的XML Schema文档转换为数据库模式的算法。提出了扩展DOM树的概念。描述了由XML Schema文档生成扩展DOM树算法。说明了路径键的概念及其作用。实现了将扩展DOM树转换成数...
通过分析XML文档转换成数据库文件存在的问题,提出基于扩展DOM树的XML Schema文档转换为数据库模式的算法。提出了扩展DOM树的概念。描述了由XML Schema文档生成扩展DOM树算法。说明了路径键的概念及其作用。实现了将扩展DOM树转换成数据库模式的算法。实现过程使用了反向扫描优化和特殊元素处理规则。
展开更多
关键词
XML
SCHEMA
扩展dom树
路径键
数据库模式
下载PDF
职称材料
一种基于扩展DOM树的Web数据自动抽取方法
被引量:
1
2
作者
陈远斌
《应用科技》
CAS
2009年第8期52-55,共4页
Web数据抽取是当前的一个研究热点,目前还没有统一有效的抽取方法.在此提出一种研究思路,首先将Web页面的DOM树进行扩展,添加视觉特征和链接特征.然后计算多个相似页面的扩展DOM树中节点和子树的新颖度,接着由新颖度识别对象数据并且依...
Web数据抽取是当前的一个研究热点,目前还没有统一有效的抽取方法.在此提出一种研究思路,首先将Web页面的DOM树进行扩展,添加视觉特征和链接特征.然后计算多个相似页面的扩展DOM树中节点和子树的新颖度,接着由新颖度识别对象数据并且依据数据项角色抽取出数据,最后将对象数据保存为XML文档.通过实验分析,验证了这个方法具有较好的抽取效果.
展开更多
关键词
WEB数据抽取
扩展dom树
新颖度
下载PDF
职称材料
基于DOM模型扩展的Web信息提取
被引量:
21
3
作者
顾韵华
田伟
《计算机科学》
CSCD
北大核心
2009年第11期235-237,289,共4页
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的...
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的特点。提取结果除可以直接用于Web浏览外,还可用于互联网数据挖掘、基于主题的搜索引擎等应用中。
展开更多
关键词
文档对象模型
WEB信息提取
影响度因子
dom
树
扩展
下载PDF
职称材料
基于隐马尔可夫模型的Web信息抽取
被引量:
6
4
作者
刘亚清
陈荣
《计算机工程》
CAS
CSCD
北大核心
2009年第18期25-27,共3页
针对Web信息抽取领域中存在的"项缺失"和"项无序"问题,提出一种基于隐马尔可夫模型的Web信息抽取方法。将Web文档解析为一棵扩展的DOM树,映射待抽取的信息项为状态,映射待抽取的信息项在扩展DOM树中的路径为词汇,...
针对Web信息抽取领域中存在的"项缺失"和"项无序"问题,提出一种基于隐马尔可夫模型的Web信息抽取方法。将Web文档解析为一棵扩展的DOM树,映射待抽取的信息项为状态,映射待抽取的信息项在扩展DOM树中的路径为词汇,使用归纳算法构造隐马尔可夫模型。实验结果证明该方法可以获得更好的抽取性能。
展开更多
关键词
信息抽取
隐马尔可夫模型
扩展dom树
下载PDF
职称材料
题名
基于扩展DOM树的XML SCHEMA文档转换为数据库模式算法
1
作者
刘必广
机构
福建交通职业技术学院
出处
《武夷学院学报》
2011年第2期56-60,共5页
基金
福建省教育厅科技项目(JA10284)
文摘
通过分析XML文档转换成数据库文件存在的问题,提出基于扩展DOM树的XML Schema文档转换为数据库模式的算法。提出了扩展DOM树的概念。描述了由XML Schema文档生成扩展DOM树算法。说明了路径键的概念及其作用。实现了将扩展DOM树转换成数据库模式的算法。实现过程使用了反向扫描优化和特殊元素处理规则。
关键词
XML
SCHEMA
扩展dom树
路径键
数据库模式
Keywords
XML Schema
Extended
dom
tree
Path Key
Database schema
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种基于扩展DOM树的Web数据自动抽取方法
被引量:
1
2
作者
陈远斌
机构
哈尔滨工程大学网络信息中心
出处
《应用科技》
CAS
2009年第8期52-55,共4页
文摘
Web数据抽取是当前的一个研究热点,目前还没有统一有效的抽取方法.在此提出一种研究思路,首先将Web页面的DOM树进行扩展,添加视觉特征和链接特征.然后计算多个相似页面的扩展DOM树中节点和子树的新颖度,接着由新颖度识别对象数据并且依据数据项角色抽取出数据,最后将对象数据保存为XML文档.通过实验分析,验证了这个方法具有较好的抽取效果.
关键词
WEB数据抽取
扩展dom树
新颖度
Keywords
Web data extraction
expended
dom
tree
novelty degree
分类号
TN742.1 [电子电信—电路与系统]
下载PDF
职称材料
题名
基于DOM模型扩展的Web信息提取
被引量:
21
3
作者
顾韵华
田伟
机构
南京信息工程大学计算机与软件学院
出处
《计算机科学》
CSCD
北大核心
2009年第11期235-237,289,共4页
基金
江苏省产业技术研究与开发基金项目(苏发改高技发[2006]1106号)资助
文摘
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的特点。提取结果除可以直接用于Web浏览外,还可用于互联网数据挖掘、基于主题的搜索引擎等应用中。
关键词
文档对象模型
WEB信息提取
影响度因子
dom
树
扩展
Keywords
dom
, Extraction of information from Web pages, Influence degree, Extended
dom
tree
分类号
TP309.2 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于隐马尔可夫模型的Web信息抽取
被引量:
6
4
作者
刘亚清
陈荣
机构
大连海事大学信息科学技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第18期25-27,共3页
基金
国家自然科学基金资助项目(60775028)
大连市科技局基金资助重大项目(2007A14GX042)
文摘
针对Web信息抽取领域中存在的"项缺失"和"项无序"问题,提出一种基于隐马尔可夫模型的Web信息抽取方法。将Web文档解析为一棵扩展的DOM树,映射待抽取的信息项为状态,映射待抽取的信息项在扩展DOM树中的路径为词汇,使用归纳算法构造隐马尔可夫模型。实验结果证明该方法可以获得更好的抽取性能。
关键词
信息抽取
隐马尔可夫模型
扩展dom树
Keywords
information extraction
Hidden Markov ModeI(HMM)
extended
dom
tree
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于扩展DOM树的XML SCHEMA文档转换为数据库模式算法
刘必广
《武夷学院学报》
2011
0
下载PDF
职称材料
2
一种基于扩展DOM树的Web数据自动抽取方法
陈远斌
《应用科技》
CAS
2009
1
下载PDF
职称材料
3
基于DOM模型扩展的Web信息提取
顾韵华
田伟
《计算机科学》
CSCD
北大核心
2009
21
下载PDF
职称材料
4
基于隐马尔可夫模型的Web信息抽取
刘亚清
陈荣
《计算机工程》
CAS
CSCD
北大核心
2009
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部