期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
半结构化文档集的结构模式提取的研究与实现 被引量:5
1
作者 杨建武 陈晓鸥 《计算机工程》 CAS CSCD 北大核心 2001年第10期19-21,113,共4页
提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应... 提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应用于实际系统中。 展开更多
关键词 半结构化文档 结构模式提取 WEB INTERNET
下载PDF
半结构化数据与关系数据的比较研究 被引量:3
2
作者 庄毅 徐海力 《计算机与现代化》 2004年第1期29-30,37,共3页
围绕将半结构化数据(XML)与关系数据的比较及两者在性能上问题,进行了一些讨论。并通过一个试验程序,具体考察了半结构化数据和关系数据在处理较大规模数据(1万条记录以上)时性能上的差异。最后,对于其在这个领域内的应用,给出了一些探... 围绕将半结构化数据(XML)与关系数据的比较及两者在性能上问题,进行了一些讨论。并通过一个试验程序,具体考察了半结构化数据和关系数据在处理较大规模数据(1万条记录以上)时性能上的差异。最后,对于其在这个领域内的应用,给出了一些探讨性的结论。 展开更多
关键词 结构化数据 关系数据 半结构化文档 数据库 计算机
下载PDF
数字图书馆中基于XML的搜索引擎设计 被引量:1
3
作者 韩毅 《情报科学》 CSSCI 北大核心 2003年第12期1320-1322,共3页
数字图书馆在 WWW上进行相应的信息展示与提供 ,基于 HTML 的文档标记使信息查寻遇到了很大的挑战。本文提出了基于 XML 的搜索引擎逻辑结构 ,并对其中的关键技术进行了研究 ,提出了对 XML半结构化文档建立索引和查寻时采用的数据结构... 数字图书馆在 WWW上进行相应的信息展示与提供 ,基于 HTML 的文档标记使信息查寻遇到了很大的挑战。本文提出了基于 XML 的搜索引擎逻辑结构 ,并对其中的关键技术进行了研究 ,提出了对 XML半结构化文档建立索引和查寻时采用的数据结构和算法 ,使得数字图书馆在 WWW上开展深层次信息提供成为可能 ,并且也使图书馆原有的 MARC信息资源能得到充分利用。 展开更多
关键词 数字图书馆 XML 搜索引擎 HTML 半结构化文档 网络信息检索 信息组织
下载PDF
XML数据库的并行RPE查询 被引量:1
4
作者 胡军安 于亚新 +1 位作者 王国仁 于戈 《计算机科学》 CSCD 北大核心 2003年第3期120-122,共3页
Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of ... Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of new Web applications. By extending the query processing strategy for centralized environments, we designand implement a parallel query processing method based on RPE. The experimental results show that the method hasgood speedup and scaleup performance in the case of heavy workload. 展开更多
关键词 XML 数据库 并行RPE查询 数据查询 数据模型 半结构化文档
下载PDF
采用树自动机推理技术的信息抽取方法 被引量:2
5
作者 谭鹏许 张来顺 《计算机工程与应用》 CSCD 北大核心 2010年第16期153-156,共4页
提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是... 提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是否抽取网页信息。该方法充分利用了网页文档的树状结构,依托树自动机将传统的以单一结构途径的信息抽取方法与文法推理原则相结合,得到信息抽取规则。实验证明,该方法与同类抽取方法相比,样本学习时间以及抽取所需时间上均有所缩短。 展开更多
关键词 树自动机推理算法 结构化(结构化)文档 无秩树自动机 信息抽取 KLH树
下载PDF
基于XML的档案袋数据管理技术初探
6
作者 李庆 刘智勇 《五邑大学学报(自然科学版)》 CAS 2003年第2期47-53,共7页
对档案袋数据管理技术(APDM)体系结构的建立、层次文档的形成和管理关键性技术进行了研究,提出了针对这种半结构化文档的存储方法和索引策略。
关键词 档案袋数据管理系统 体系结构 信息管理 XML 半结构化文档 层次文档 数据库
下载PDF
基于Petri网的遥感流程自动形式化建模方法研究
7
作者 乔保军 何思源 杜莹 《河南大学学报(自然科学版)》 CAS 2023年第3期328-339,共12页
传统遥感数据处理流程分散且独立,缺乏形式化语义模型,更没有通用的遥感数据处理流程自动形式化建模方法,难以进行有效分析和验证,不利于实现计算机对遥感数据处理流程的自动控制.针对以上问题,本文结合Petri网建模的相关研究成果,构建... 传统遥感数据处理流程分散且独立,缺乏形式化语义模型,更没有通用的遥感数据处理流程自动形式化建模方法,难以进行有效分析和验证,不利于实现计算机对遥感数据处理流程的自动控制.针对以上问题,本文结合Petri网建模的相关研究成果,构建适合遥感数据处理流程的形式化描述模型RSDP_Net(Remote Sensing Data Processing Net),并研究其验证方法;设计一种基于自然语言的半结构化文档描述遥感数据处理流程,并开发由该文档向RSDP_Net的自动转化工具,从而达到实现自动构建遥感数据处理流程形式化模型的目的.最后,以遥感数据提取植被面积流程为例,使用该方法自动生成流程形式化模型. 展开更多
关键词 遥感数据处理流程 形式化建模 PETRI网 半结构化文档
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部