期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于扩展DOM树的XML SCHEMA文档转换为数据库模式算法
1
作者 刘必广 《武夷学院学报》 2011年第2期56-60,共5页
通过分析XML文档转换成数据库文件存在的问题,提出基于扩展DOM树的XML Schema文档转换为数据库模式的算法。提出了扩展DOM树的概念。描述了由XML Schema文档生成扩展DOM树算法。说明了路径键的概念及其作用。实现了将扩展DOM树转换成数... 通过分析XML文档转换成数据库文件存在的问题,提出基于扩展DOM树的XML Schema文档转换为数据库模式的算法。提出了扩展DOM树的概念。描述了由XML Schema文档生成扩展DOM树算法。说明了路径键的概念及其作用。实现了将扩展DOM树转换成数据库模式的算法。实现过程使用了反向扫描优化和特殊元素处理规则。 展开更多
关键词 XML SCHEMA 扩展dom树 路径键 数据库模式
下载PDF
一种基于扩展DOM树的Web数据自动抽取方法 被引量:1
2
作者 陈远斌 《应用科技》 CAS 2009年第8期52-55,共4页
Web数据抽取是当前的一个研究热点,目前还没有统一有效的抽取方法.在此提出一种研究思路,首先将Web页面的DOM树进行扩展,添加视觉特征和链接特征.然后计算多个相似页面的扩展DOM树中节点和子树的新颖度,接着由新颖度识别对象数据并且依... Web数据抽取是当前的一个研究热点,目前还没有统一有效的抽取方法.在此提出一种研究思路,首先将Web页面的DOM树进行扩展,添加视觉特征和链接特征.然后计算多个相似页面的扩展DOM树中节点和子树的新颖度,接着由新颖度识别对象数据并且依据数据项角色抽取出数据,最后将对象数据保存为XML文档.通过实验分析,验证了这个方法具有较好的抽取效果. 展开更多
关键词 WEB数据抽取 扩展dom树 新颖度
下载PDF
基于DOM模型扩展的Web信息提取 被引量:21
3
作者 顾韵华 田伟 《计算机科学》 CSCD 北大核心 2009年第11期235-237,289,共4页
提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的... 提出了一种基于DOM模型扩展的Web信息提取方法。将Web页面表示为DOM树结构,对DOM树结点进行语义扩展并计算其影响度因子,依据结点的影响度因子进行剪枝,进而提取Web页面信息内容。该方法不要求对网页的结构有预先认识,具有自动和通用的特点。提取结果除可以直接用于Web浏览外,还可用于互联网数据挖掘、基于主题的搜索引擎等应用中。 展开更多
关键词 文档对象模型 WEB信息提取 影响度因子 dom扩展
下载PDF
基于隐马尔可夫模型的Web信息抽取 被引量:6
4
作者 刘亚清 陈荣 《计算机工程》 CAS CSCD 北大核心 2009年第18期25-27,共3页
针对Web信息抽取领域中存在的"项缺失"和"项无序"问题,提出一种基于隐马尔可夫模型的Web信息抽取方法。将Web文档解析为一棵扩展的DOM树,映射待抽取的信息项为状态,映射待抽取的信息项在扩展DOM树中的路径为词汇,... 针对Web信息抽取领域中存在的"项缺失"和"项无序"问题,提出一种基于隐马尔可夫模型的Web信息抽取方法。将Web文档解析为一棵扩展的DOM树,映射待抽取的信息项为状态,映射待抽取的信息项在扩展DOM树中的路径为词汇,使用归纳算法构造隐马尔可夫模型。实验结果证明该方法可以获得更好的抽取性能。 展开更多
关键词 信息抽取 隐马尔可夫模型 扩展dom树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部