期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
用带权重的pq-gram算法计算XML文档相似度
被引量:
1
1
作者
王成勇
杜庆伟
+1 位作者
孙静
孙振
《计算机与现代化》
2015年第3期20-25,共6页
XML文档聚类是高效管理XML文档的重要手段,XML文档相似度计算正是其中的关键步骤。pq-gram算法是解决XML文档相似度计算问题的有效手段,但忽略了XML文档结点的有序性。带权重的pq-gram算法是在此基础上,依据XML文档的结构性,首先为结点...
XML文档聚类是高效管理XML文档的重要手段,XML文档相似度计算正是其中的关键步骤。pq-gram算法是解决XML文档相似度计算问题的有效手段,但忽略了XML文档结点的有序性。带权重的pq-gram算法是在此基础上,依据XML文档的结构性,首先为结点赋予相应权重,然后基于结点的权重对pq-gram赋予权重,最后将设定的权重应用到XML文档相似度计算中。实验结果表明,带权重的pq-gram算法更好地描述结点在XML文档相似度计算中的贡献度,提高了XML文档相似度计算的精度。
展开更多
关键词
XML文档
计算相似度
pq-gram
权重
下载PDF
职称材料
XCluster:基于聚类支持查询的XML多文档压缩方法
被引量:
3
2
作者
赵明
骆吉洲
+1 位作者
李建中
高宏
《计算机研究与发展》
EI
CSCD
北大核心
2010年第5期804-814,共11页
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩...
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩方法大都仅压缩单文档中的冗余信息.利用XML文档间的相似性,提出一种支持查询的多XML文档压缩存储方法XCluster.XCluster先利用XML有根有序标签树上改进的pq-gram近似距离对XML文档集进行层次聚类;然后合并每个聚类结果子集中文档的结构得到结构代表并进行字典编码压缩;同时合并不同文档内同一标签下的值内容,并根据其数据类型进行相应编码压缩.实验结果表明,在真实和生成的XML多文档数据集上,XCluster比XGrind和XQilla具有更好的压缩效果和查询效率.
展开更多
关键词
树型XML
XML压缩
pq-gram
层次聚类
查询处理
下载PDF
职称材料
题名
用带权重的pq-gram算法计算XML文档相似度
被引量:
1
1
作者
王成勇
杜庆伟
孙静
孙振
机构
南京航空航天大学计算机科学与技术学院
出处
《计算机与现代化》
2015年第3期20-25,共6页
基金
国家自然科学基金资助项目(61202350)
文摘
XML文档聚类是高效管理XML文档的重要手段,XML文档相似度计算正是其中的关键步骤。pq-gram算法是解决XML文档相似度计算问题的有效手段,但忽略了XML文档结点的有序性。带权重的pq-gram算法是在此基础上,依据XML文档的结构性,首先为结点赋予相应权重,然后基于结点的权重对pq-gram赋予权重,最后将设定的权重应用到XML文档相似度计算中。实验结果表明,带权重的pq-gram算法更好地描述结点在XML文档相似度计算中的贡献度,提高了XML文档相似度计算的精度。
关键词
XML文档
计算相似度
pq-gram
权重
Keywords
XML documents
calculate similarity
pq-gram
weight
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
XCluster:基于聚类支持查询的XML多文档压缩方法
被引量:
3
2
作者
赵明
骆吉洲
李建中
高宏
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第5期804-814,共11页
基金
国家"九七三"重点基础研究发展计划基金项目(2006CB303000)
国家自然科学基金重点项目(60533110)
+4 种基金
国家自然科学基金项目(60703012
60773068)
黑龙江省青年科技专项资金项目(QC06C033)
国家"八六三"高技术研究发展计划基金项目(2009AA01Z149)
NSFC/RGC联合科研基金项目(60831160525)~~
文摘
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩方法大都仅压缩单文档中的冗余信息.利用XML文档间的相似性,提出一种支持查询的多XML文档压缩存储方法XCluster.XCluster先利用XML有根有序标签树上改进的pq-gram近似距离对XML文档集进行层次聚类;然后合并每个聚类结果子集中文档的结构得到结构代表并进行字典编码压缩;同时合并不同文档内同一标签下的值内容,并根据其数据类型进行相应编码压缩.实验结果表明,在真实和生成的XML多文档数据集上,XCluster比XGrind和XQilla具有更好的压缩效果和查询效率.
关键词
树型XML
XML压缩
pq-gram
层次聚类
查询处理
Keywords
tree-structured XML
XML compression
pq-gram
hierarchy clustering
query processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
用带权重的pq-gram算法计算XML文档相似度
王成勇
杜庆伟
孙静
孙振
《计算机与现代化》
2015
1
下载PDF
职称材料
2
XCluster:基于聚类支持查询的XML多文档压缩方法
赵明
骆吉洲
李建中
高宏
《计算机研究与发展》
EI
CSCD
北大核心
2010
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部