-
题名模糊聚类算法在汉语文本聚类中的应用
被引量:11
- 1
-
-
作者
李家福
陆建江
张亚非
-
机构
解放军理工大学通信工程学院
解放军理工大学理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2002年第4期15-16,33,共3页
-
基金
国家自然科学基金项目(69975024)
国家自然科学基金重点项目(69931040)
-
文摘
应用一种新的分词算法对汉语文本进行分词,该算法具备不使用词典和语法知识、不使用汉语词法规则、无监督等特点。采用模糊聚类算法对汉语文本进行聚类,该模糊聚类算法优于普通的聚类算法,聚类结果能充分体现汉语文本的多样性和大量性的特点。
-
关键词
汉语文本聚类
模糊聚类算法
汉字信息处理
计算机
模糊C-原型算法
-
Keywords
Document cluster
Word segmentation
Fuzzy c-archetype algorithm
Non-Euclidean relational data
CompetitiveaggIomeration aIgorithm
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语文本聚类及其算法设计
被引量:3
- 2
-
-
作者
陈炯
范卓华
张虎
-
机构
山西综合职业技术学院电子分院
山西大学计算机与信息技术学院
-
出处
《山西电子技术》
2005年第2期29-30,45,共3页
-
文摘
主要针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,同时结合基于人进行聚类判断所遵循的基本原则,即聚类中对象间距离应小于聚类间距离,设计了一种有效的聚类算法,实验结果表明算法是有效的。
-
关键词
代表点
聚类簇
聚类中心
汉语文本聚类
算法设计
聚类分析法
-
Keywords
clustering
representative point
clustering cluster
clustering center
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-