基于频繁词序列的层次文本聚类算法研究
摘要
提出一种基于频繁词序列的层次文本聚类算法,该算法考虑频繁词的次序关系和频繁词序列的文本频繁的重要性,构造了一种更合理的层次关系。实验证明,基于频繁词序列的层次文本聚类算法能够提高文本聚类的精确度。
出处
《计算机时代》
2009年第4期44-46,共3页
Computer Era
二级参考文献12
-
1[1]Feng Jianlin,Liu Huijun, Long Hao, Fang Qiong. SAT: Sentence As Association Transaction for Text Classification. Submitted for publication
-
2[2]Agrawal R, Srikant R. Fast Algorithms for Mining Association Rules. In:Proc. of the 2oth Very Large Data Bases,1994. 487~499
-
3[3]Borgelt C,Kruse R. Induction of Association Rules: Apriori Implementation. Otto-von-Guericke-University of Magdeburg, Germany
-
4[4]Berkhin P. Survey Of Clustering Data Mining Techniques. Accrue Software, Inc
-
5[5]Beil F,Ester M,Xu X. Frequent term-based text clustering. In:Proc. of ACM SIGKDD, 2002
-
6[6]Yiu Man Lung, Mamoulis N. Frequent-Pattern based Iterative Projected Clustering. University of Hong Kong
-
7[7]Wang B K. Hierarchical Document Clustering Using Frequent Itemsets. In:Proc. of SIAM Intl. Conf. on Data Mining, 2003
-
8[8]Steinbach M, Karypis G. A Comparison of Document Clustering Techniques. In:Proc. of ACM SIGKDD Text Mining Workshop,2000
-
9[9]The Reuters21578 collection. http:∥kdd. ics. uci. edu/databases/reuters21578/reuters21578. html
-
10[10]Dubes R C,Jain A K. Algorithms for Clustering Data. Prentice Hall, 1988
-
1周兵,李家国,吴贯锋,刘扬.面向遥感产品生产的可视化数据流模型[J].河南大学学报(自然科学版),2013,43(1):74-78. 被引量:9
-
2李永忠,徐静,赵博,杨鸽.基于变长系统调用序列模式的入侵检测方法研究[J].江苏科技大学学报(自然科学版),2007,21(3):36-41. 被引量:2
-
3慕建君.一种形式化分析安全协议的新模型[J].西安电子科技大学学报,2006,33(3):381-385. 被引量:2
-
4胡学钢,张圆圆.一种挖掘带时间约束序列模式的改进算法[J].智能系统学报,2007,2(2):89-93.
-
5胡学钢,张圆圆.一种序列模式发现的新方法[J].计算机应用研究,2008,25(4):1003-1005. 被引量:1
-
6陈睿,王作新.面向对象数据库中的次序关系[J].计算机研究与发展,1997,34(1):19-27. 被引量:2
-
7王福宏,彭勤科,李乃捷.基于不定长系统调用序列模式的入侵检测方法[J].计算机工程,2006,32(20):143-146. 被引量:2
-
8柳海燕.基于C#的折半查找算法动态演示程序[J].电脑知识与技术(过刊),2011,17(8X):5639-5641.
-
9王文星,闻立杰,谭士杰.基于完全有限前缀的完备日志生成算法[J].计算机集成制造系统,2011,17(8):1692-1702.
-
10查海平,王建民,闻立杰.一种Petri网模型完备日志生成算法[J].系统仿真学报,2007,19(A01):271-274. 被引量:4