-
题名基于XML的检索结果聚类方法
被引量:5
- 1
-
-
作者
余宏
万常选
-
机构
南昌师范高等专科学校信息中心
江西财经大学信息管理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第1期85-86,90,共3页
-
基金
国家自然科学基金资助项目(60763001)
国家社会科学基金资助项目(07BTQ025)
-
文摘
针对XML文档的半结构化特点,提出一种建模XML检索结果片段的新思路,设计综合内容和结构语义信息度量相应文档相似性的方法,给出一种适应检索结果聚类应用需求的动态均值软聚类算法。实验表明,面向XML的检索结果聚类方法聚类效果优于传统方法。
-
关键词
xml检索结果聚类
结构语义相似度
内容相似度
聚类算法
-
Keywords
xml retrieval result clustering
structure semantic similarity
content similarity
clustering algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于检索结果聚类的XML伪相关文档查找
被引量:1
- 2
-
-
作者
钟敏娟
万常选
刘德喜
廖述梅
-
机构
江西财经大学信息管理学院
江西财经大学数据与知识工程江西省高校重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2013年第10期172-177,共6页
-
基金
国家自然基金项目(61173146
61262035
+1 种基金
60763001)
国家社会科学基金(12CTQ042)资助
-
文摘
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。
-
关键词
信息检索
xml伪相关反馈
xml检索结果聚类
簇标签
排序模型
-
Keywords
Information retrieval, xml pseudo-relevance feedback, xml search results clustering, Cluster label, Ran-king model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-