题名 搜索引擎中的聚类浏览技术
被引量:9
1
作者
李红梅
丁振国
周水生
周利华
机构
西安电子科技大学计算机学院
西安电子科技大学理学院
出处
《中文信息学报》
CSCD
北大核心
2008年第3期56-63,共8页
基金
国家自然科学基金资助项目(60603098)
文摘
搜索引擎大多以文档列表的形式将搜索结果显示给用户,随着Web文档数量的剧增,使得用户查找相关信息变得越来越困难,一种解决方法是对搜索结果进行聚类提高其可浏览性。搜索引擎的聚类浏览技术能使用户在更高的主题层次上查看搜索结果,方便地找到感兴趣的信息。本文介绍了搜索引擎的聚类浏览技术对聚类算法的基本要求及其分类方法,研究分析了主要聚类算法及其改进方法的特点,讨论了对聚类质量的评价,最后指出了聚类浏览技术的发展趋势。
关键词
计算机应用
中文信息处理
搜索引擎
文档聚 类
信息检索
聚类标识
Keywords
computer application
Chinese information processing
search engine
document clustering
information retrieval
cluster label
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于支持向量聚类的多分量线性调频信号检测
被引量:4
2
作者
王令欢
马红光
张欣豫
张葛祥
机构
第二炮兵工程学院
西南交通大学电气工程学院
出处
《电子与信息学报》
EI
CSCD
北大核心
2007年第11期2661-2664,共4页
基金
国家自然科学家基金(60572143)资助课题
文摘
为了精确获取多分量线性调频(Linear FM,LFM)信号中分量的数量,该文引入支持向量聚类(Support Vector Clustering,SVC)算法对LFM信号的Radon-时频分析结果进行聚类分析,完成多个分量的检测;并通过减少SVC算法中输入集样本数量和改进聚类标识方法为"直接聚类标识"法,提高了SVC算法的计算效率。仿真结果表明:在较低信噪比条件下,Radon-时频分析和SVC结合的方法可有效地检测多分量LFM信号中分量数和进行参数估计。
关键词
支持向量聚 类
聚类标识
信号检测
参数估计
Keywords
Support Vector Clustering(SVC)
Cluster labeling
Signal detection
Parameter estimation
分类号
TN911.23
[电子电信—通信与信息系统]
题名 基于频繁子树模式的GML文档结构聚类算法
3
作者
朱颖雯
吉根林
孙勤红
机构
三江学院计算机基础部
南京师范大学计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2011年第1期144-146,149,共4页
基金
国家自然科学基金No.40871176~~
文摘
提出了一种基于频繁子树模式的GML文档结构聚类算法GCFS(GML Clustering based on Frequent Subtree patterns),与其他相关算法不同,该算法首先挖掘GML文档集合中的最大与闭合频繁Induced子树,并将其作为聚类特征,根据频繁子树的大小赋予不同的权值,采用余弦函数定义相似度,利用K-Means算法对聚类特征进行聚类。实验结果表明算法GCFS是有效的,具有较高的聚类效率,性能优于其他同类算法。
关键词
地理标识 语言(GML)结构聚 类
最大频繁Induced子树
闭合频繁Induced子树
Keywords
Geography Markup Language(GML) clustering by structure
maximal frequent Induced subtrees
closed frequent Induced subtrees
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 健康素养概念结构和主题趋势的多视角分析
被引量:1
4
作者
戴静
姚强
杜建
许培扬
张士靖
机构
华中科技大学同济医学院医药卫生管理学院
中国医学科学院医学信息研究所
出处
《预防医学情报杂志》
CAS
2012年第6期477-481,共5页
基金
教育部人文社科基金项目(07JA870011)
文摘
目的利用多视角分析方法揭示健康素养的概念结构和主题趋势。方法基于WoS的作者共被引、关键词共现和PubMed的作者合作,利用CiteSpace软件,从被引文献和引证文献2个角度分别对共被引聚类进行标识,确定健康素养领域研究的概念结构和主题趋势(1995-2010)。结果精神健康素养和功能性健康素养是健康素养的2个独立的研究领域。同时发现公共卫生视角的健康素养和健康素养测量工具研究是近年来2个最活跃的研究领域。结论应用不同来源的信息,对共引聚类分析后可能会得到不同的结论。
关键词
多视角共被引分析
健康素养
聚类标识
概念结构
主题趋势
Keywords
and co-authorship in PubMed
CiteSpace were used to identify the labeling co-citation clusters from two aspects(cited and citing items) respectively
and the conceptual structures and thematic trends of health literacy research(1995-2010) were determined.Results Mental health literacy and functional health literacy are two separated research areas in health literacy research and practice.It is also identified that another two areas of research
research on health literacy of public health and its measuring tool
were the most active in recent years.Conclusion Application of different sources of information will lead different conclusions to co-citation cluster analysis. Key wordsmultiple-perspective co-citation analysis
health literacy
cluster labels
conceptual structure
thematic trend
分类号
G35
[文化科学—情报学]