期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于关键字语义信息的XML文档分类 被引量:6
1
作者 张利军 李战怀 +2 位作者 陈群 娄颖 李宁 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第6期1510-1514,共5页
针对XML数据半结构化的特点及传统的tf-idf方法仅考虑关键字在文档中出现的频率和包含关键字的文档数,而未考虑XML文档中关键字语义信息的不足,提出了一种新的关键字权重度量方法。该方法充分考虑了XML文档中关键字所出现的路径、路径... 针对XML数据半结构化的特点及传统的tf-idf方法仅考虑关键字在文档中出现的频率和包含关键字的文档数,而未考虑XML文档中关键字语义信息的不足,提出了一种新的关键字权重度量方法。该方法充分考虑了XML文档中关键字所出现的路径、路径包含关键字的个数、包含路径的文档个数、路径的层次等影响关键字语义的因素,用于计算关键字权重,从而提高了关键字权重度量的准确性。在多个数据集上的实验结果表明,将该方法应用于XML文档的分类时,与传统的tf-idf方法和基于规则的方法相比,分类的查全率、查对率及F1均有所提高。 展开更多
关键词 计算机软件 半结构化数据 XML挖掘 XML分类 关键字语义 权重度量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部