期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
文本聚类算法初探
被引量:
2
下载PDF
职称材料
导出
摘要
文本聚类是数据挖掘的核心技术,能帮助用户有效地导航、总结和组织文本信息。本文通过对文本聚类的应用研究,探讨了几种聚类算法的原理与特点,提出并分析了K-means算法与层次凝聚算法的具体实现步骤。
作者
马军红
机构地区
西安外事学院工学院
出处
《电子世界》
2012年第6期71-72,共2页
Electronics World
关键词
文本聚类
聚类算法
K-MEANS
分类号
TP391.12 [自动化与计算机技术—计算机应用技术]
引文网络
相关文献
节点文献
二级参考文献
37
参考文献
3
共引文献
39
同被引文献
11
引证文献
2
二级引证文献
8
参考文献
3
1
冯少荣,肖文俊.
基于语义距离的高效文本聚类算法[J]
.华南理工大学学报(自然科学版),2008,36(5):30-37.
被引量:15
2
丘志宏,宫雷光.
利用上下文提高文本聚类的效果[J]
.中文信息学报,2007,21(6):109-115.
被引量:9
3
尉景辉,何丕廉,孙越恒.
基于K-Means的文本层次聚类算法研究[J]
.计算机应用,2005,25(10):2323-2324.
被引量:18
二级参考文献
37
1
袁方,杨柳,张红霞.
基于k-近邻方法的渐进式中文文本分类技术[J]
.华南理工大学学报(自然科学版),2004,32(z1):88-91.
被引量:7
2
董振东.
语义关系的表达和知识系统的建造[J]
.语言文字应用,1998(3):79-85.
被引量:58
3
李凡,林爱武,陈国社.
一种基于VSM文本分类系统的设计与实现[J]
.华中科技大学学报(自然科学版),2005,33(3):53-55.
被引量:19
4
李向军,徐国华,刘立平.
一种文本聚类算法[J]
.西北大学学报(自然科学版),2005,35(2):155-158.
被引量:3
5
王建会,王雷,胡运发.
词语间依存关系的定量识别[J]
.中文信息学报,2005,19(4):31-38.
被引量:3
6
丁月华,文贵华,郭炜强.
基于核向量空间模型的专利分类[J]
.华南理工大学学报(自然科学版),2005,33(8):58-61.
被引量:12
7
刘远超,王晓龙,徐志明,关毅.
文档聚类综述[J]
.中文信息学报,2006,20(3):55-62.
被引量:65
8
任江涛,孙婧昊,施潇潇,黄焕宇,印鉴.
一种用于文本聚类的改进的K均值算法[J]
.计算机应用,2006,26(B06):73-75.
被引量:24
9
索红光,刘玉树,曹淑英.
一种基于词汇链的关键词抽取方法[J]
.中文信息学报,2006,20(6):25-30.
被引量:88
10
赵世奇,刘挺,李生.
一种基于主题的文本聚类方法[J]
.中文信息学报,2007,21(2):58-62.
被引量:23
共引文献
39
1
龚静,李英杰.
文本聚类算法的分析与比较[J]
.湖南环境生物职业技术学院学报,2006,12(3):283-286.
被引量:2
2
索红光,杨涛.
基于互信息的Web文档聚类方法[J]
.广西师范大学学报(自然科学版),2007,25(2):131-134.
被引量:3
3
吴启明,易云飞.
文本聚类综述[J]
.河池学院学报,2008,28(2):86-91.
被引量:21
4
毛嘉莉.
基于K-means的文本聚类算法[J]
.计算机系统应用,2009,18(10):85-87.
被引量:9
5
马秀麟,金海燕.
基于关键词标注的教学论坛内容组织方法研究[J]
.现代教育技术,2009,19(12):87-90.
被引量:5
6
肖凤,郑海健,卢闯.
基于聚类分析的银行客户关系管理策略研究[J]
.技术经济,2010,29(1):87-93.
被引量:14
7
易军凯,温万造.
基于智能模式匹配的数据恢复方法研究[J]
.微计算机信息,2010,26(4):20-21.
被引量:1
8
苏冲,陈清才,王晓龙,孟宪军.
基于最大频繁项集的搜索引擎查询结果聚类算法[J]
.中文信息学报,2010,24(2):58-67.
被引量:5
9
唐俊.
SSC软聚类算法在面向查询的多文档文摘中的应用[J]
.计算机工程与科学,2010,32(6):112-114.
10
马素琴,施化吉,李星毅.
基于语义列表的中文文本聚类算法[J]
.计算机应用研究,2010,27(5):1697-1699.
被引量:1
同被引文献
11
1
常青.
文本挖掘 挖掘知识[J]
.中国计算机用户,2004(24):49-50.
被引量:10
2
刘泉凤,陆蓓,王小华.
文本挖掘中聚类算法的比较研究[J]
.计算机时代,2005(6):7-8.
被引量:8
3
唐晓波,房小可.
基于文本聚类与LDA相融合的微博主题检索模型研究[J]
.情报理论与实践,2013,36(8):85-90.
被引量:44
4
江浩,陈兴蜀,杜敏.
基于主题聚簇评价的论坛热点话题挖掘[J]
.计算机应用,2013,33(11):3071-3075.
被引量:5
5
杨平,王丹,赵文兵.
微博网站中面向主题的权威信息搜索技术研究[J]
.计算机科学与探索,2013,7(12):1135-1145.
被引量:2
6
王振振,何明,杜永萍.
基于LDA主题模型的文本相似度计算[J]
.计算机科学,2013,40(12):229-232.
被引量:91
7
林鸿飞,马雅彬.
基于聚类的文本过滤模型[J]
.大连理工大学学报,2002,42(2):249-252.
被引量:9
8
李湘东,张娇,袁满.
基于LDA模型的科技期刊主题演化研究[J]
.情报杂志,2014,33(7):115-121.
被引量:65
9
焦潞林,彭岩,林云.
面向网络舆情的文本知识发现算法对比研究[J]
.山东大学学报(理学版),2014,49(9):62-68.
被引量:1
10
王鹏,高铖,陈晓美.
基于LDA模型的文本聚类研究[J]
.情报科学,2015,33(1):63-68.
被引量:64
引证文献
2
1
张浩.
基于向量空间模型的层次聚类算法在文本挖掘中的应用[J]
.温州职业技术学院学报,2013,13(1):84-86.
被引量:1
2
李霄野,李春生,李龙,张可佳.
基于LDA模型的文本聚类检索[J]
.计算机与现代化,2018(6):7-11.
被引量:7
二级引证文献
8
1
彭阳,左锋,余芳强,张铭.
“工业互联网+”建筑工程文档的知识网络研究[J]
.建筑经济,2021,42(S01):411-414.
2
杨秀璋.
基于LDA模型和文本聚类的水族文献主题挖掘研究[J]
.现代计算机,2019,25(5):13-17.
被引量:16
3
杨俊峰,尹光花.
基于word2vec和CNN的短文本聚类研究[J]
.信息与电脑,2019,31(24):20-22.
被引量:4
4
王英杰.
基于TF-IDF的网络地理文本信息分类研究[J]
.科学技术创新,2020(10):76-77.
被引量:2
5
张秀云.
基于用户日志双向聚类的跨语言信息检索系统设计[J]
.现代电子技术,2021,44(24):158-162.
被引量:2
6
汤妙佳,沙建.
基于层次聚类算法的烟草违法区域划分研究[J]
.电子技术与软件工程,2022(12):33-37.
被引量:2
7
彭阳,余芳强.
工程资料的自动分类和智能搜索技术探析[J]
.福建建筑,2022(7):105-108.
8
陈邦举.
基于12328热线数据的城市交通与公路物流业务研究[J]
.公路,2024,69(5):356-364.
1
曾志雄.
一种有效的基于划分和层次的混合聚类算法[J]
.计算机应用,2007,27(7):1692-1694.
被引量:15
2
闵敏.
层次凝聚算法在商品个性化推荐中的应用[J]
.电脑知识与技术,2006,1(7):171-172.
被引量:1
3
席泓.
数据聚类算法的改进及其应用[J]
.电脑开发与应用,2006,19(11):7-8.
4
张儒良,王翰虎.
一种有效的聚类分析算法的研究[J]
.计算机时代,2004(9):34-35.
被引量:2
5
梁力图,陆璐.
基于用户会话的Web应用性能测试方法的研究[J]
.计算机科学,2014,41(11):46-49.
被引量:2
6
郭晓娟,刘晓霞,李晓玲.
层次聚类算法的改进及分析[J]
.计算机应用与软件,2008,25(6):243-244.
被引量:7
7
张儒良,王翰虎.
基于数据挖掘技术的试卷质量聚类分析系统[J]
.贵州大学学报(自然科学版),2004,21(4):393-396.
电子世界
2012年 第6期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部