期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
海量多版本文档的加权持久性top-k检索
1
作者 兰超 张勇 邢春晓 《计算机研究与发展》 EI CSCD 北大核心 2013年第S2期121-131,共11页
提出并研究了针对海量多版本文档的加权持久性top-k检索问题.加权持久性top-k检索能够返回在一个限定时间区间内与查询关键词组持续相关的k个结果,并且考虑不同时间区间有不同的权重.针对这一问题,把现有时空查询和针对多版本文档查询... 提出并研究了针对海量多版本文档的加权持久性top-k检索问题.加权持久性top-k检索能够返回在一个限定时间区间内与查询关键词组持续相关的k个结果,并且考虑不同时间区间有不同的权重.针对这一问题,把现有时空查询和针对多版本文档查询的方法进行扩展,使其支持加权持久性top-k检索问题,并分析总结了该方法的缺点,进而又提出了一种新的基于时间区间窗口的算法.基于时间区间窗口的算法能够支持多种经典top-k算法并有效地解决加权持久性top-k检索问题.最后使用Wikipedia多版本数据进行了一系列性能试验,对比测试了基于区间窗口的算法和扩展算法.结果表明区间窗口算法在各个测试下的效率和可扩展性明显优于扩展算法. 展开更多
关键词 多版本文档 TOP-K查询 时态查询 文书类档案 多版本查询
下载PDF
数据起源在多版本文档检索中的应用
2
作者 陈悦 董红斌 +1 位作者 谭成予 梁意文 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第5期730-744,共15页
随着计算机的普及和大数据时代的来临,个人计算机中文档的版本数急剧增加,用户想要迅速找到所需的文档绝非易事.相关研究表明,文件的起源信息可以为用户提供快速定位目标文档的线索.已有的一些基于数据起源的检索方式,其起源粒度多数是... 随着计算机的普及和大数据时代的来临,个人计算机中文档的版本数急剧增加,用户想要迅速找到所需的文档绝非易事.相关研究表明,文件的起源信息可以为用户提供快速定位目标文档的线索.已有的一些基于数据起源的检索方式,其起源粒度多数是文件级的.但对于内容相关性较高的文档来说,文件级的起源信息无法清晰地描述内容间的关联关系,也就无法给予用户充分的帮助.基于PROV模型,针对文档版本的变化建立内容级的起源概念模型,并给出了起源词汇表.在资源描述框架(resource description framework, RDF)语言的基础上建立了起源信息的查询访问机制,并给出了可视化方案,为用户提供直观的信息表达.结果表明,该方法通过对文档检索结果的扩展和解释,可以为用户提供更有价值的帮助信息,从而达到快速锁定目标文件的目的,提高工作效率. 展开更多
关键词 多版本文档 文档检索 数据起源 PROV模型
下载PDF
Word文档多版本存储一学就会
3
作者 杨尚群 《中国传媒科技》 2002年第6期48-49,共2页
为了说明多版本存储的好处,我先列举三个例子,是用户在编辑Word文档时经常遇到的问题: (1)经常写稿件的人会有这样的体会,在写好稿件第一稿后,可能还要经过几次修改才能最终定稿,从而出现第二稿、第三稿等多个版本的稿件。如果每次修改... 为了说明多版本存储的好处,我先列举三个例子,是用户在编辑Word文档时经常遇到的问题: (1)经常写稿件的人会有这样的体会,在写好稿件第一稿后,可能还要经过几次修改才能最终定稿,从而出现第二稿、第三稿等多个版本的稿件。如果每次修改的文稿都要保留的话,同一个稿件就会被保存成多个文件,为今后的文件管理带来麻烦。 (2)有时稿件写到一半。 展开更多
关键词 WORD文档 多版本文档 文档存储 操作
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部