期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
XML文档相似性的仿真研究 被引量:1
1
作者 陆翠明 李芳 athena i vakali 《计算机仿真》 CSCD 2005年第12期300-302,310,共4页
XML文档相似性的计算是XML文档分类中的一个难题。文中描述了一种基于结构的方法,通过序列化模式挖掘方法,挖掘出两个文档之间的最大相似路径,从而可以通过计算最大相似的路径的节点数目和所有路径的节点数目的比值,得到两个文档之间的... XML文档相似性的计算是XML文档分类中的一个难题。文中描述了一种基于结构的方法,通过序列化模式挖掘方法,挖掘出两个文档之间的最大相似路径,从而可以通过计算最大相似的路径的节点数目和所有路径的节点数目的比值,得到两个文档之间的相似度。文章提出了一种新的最小化XML文档的方法,并且综合考虑了文档节点的语义相似度和结构相似度,从而进一步地提高了计算文档相似度的精度。实验表明,该方法有着良好的应用前景。 展开更多
关键词 扩展标识语言 信息检索 数据挖掘 序列化模式挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部