-
题名基于XPath分解XML文档的完整性检查
被引量:1
- 1
-
-
作者
刘宝龙
刘念
陈桦
-
机构
西安工业大学计算机科学与工程学院
-
出处
《西安工业大学学报》
CAS
2012年第8期674-678,共5页
-
基金
陕西省教育厅科研计划项目(12JK0728)
-
文摘
利用XPath路径表达式实现XML数据的分解,并提出建立一个XML数据完整性检查池来提供分解后的XML数据完整性检查.利用XPath表达式,在保持子文档有效性的同时易于实现XML文档的分解.利用建立的数据完整性检查池,用户可以检查所得数据的完整性,而不需要和其他用户的协作.该方法为细粒度安全环境中对XML文档的保护及发布提供了新的思路,为XML应用奠定了安全基础.
-
关键词
XPATH
完整性检查池
dom-hash
文档类型定义
-
Keywords
XPath
integrity-checking pool
dom-hash
document type definition
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名FPC:大规模网页的快速增量聚类
被引量:3
- 2
-
-
作者
余钧
郭岩
张凯
刘林
刘悦
俞晓明
程学旗
-
机构
中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室
中国科学院大学
中国信息安全评测中心
-
出处
《中文信息学报》
CSCD
北大核心
2016年第2期182-188,共7页
-
基金
国家973计划(2012CB316303
2013CB329602)
+4 种基金
国家863计划(2014AA015204)
国家自然科学基金(61232010
61425016
61572473
61572467)
-
文摘
面向结构相似的网页聚类是网络数据挖掘的一项重要技术。传统的网页聚类没有给出网页簇中心的表示方式,在计算点簇间和簇簇间相似度时需要计算多个点对的相似度,这种聚类算法一般比使用簇中心的聚类算法慢,难以满足大规模快速增量聚类的需求。针对此问题,该文提出一种快速增量网页聚类方法FPC(Fast Page Clustering)。在该方法中,先提出一种新的计算网页相似度的方法,其计算速度是简单树匹配算法的500倍;给出一种网页簇中心的表示方式,在此基础上使用Kmeans算法的一个变种MKmeans(Merge-Kmeans)进行聚类,在聚类算法层面上提高效率;使用局部敏感哈希技术,从数量庞大的网页类集中快速找出最相似的类,在增量合并层面上提高效率。
-
关键词
DOM树分层向量
网页簇中心
局部敏感哈希
快速增量聚类
-
Keywords
DOM tree layered vectors
web page cluster center
local sensitive hashing
fast incremental clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-