期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于单词相似度的文本聚类
被引量:
9
1
作者
李星毅
曾路平
施化吉
《计算机工程与设计》
CSCD
北大核心
2009年第8期1966-1968,共3页
研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点。针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然...
研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点。针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然后利用产生的单词类作为向量空间的项表示文本降低了向量空间的维度,最后采用基于划分聚类方法对文本聚类。实验结果表明,相对于传统基于向量空间模型的聚类算法,该算法具有较好的聚类效果。
展开更多
关键词
文本聚
类
单词
相似度
向量
空间
模型
单词类向量空间
文本表示
下载PDF
职称材料
题名
基于单词相似度的文本聚类
被引量:
9
1
作者
李星毅
曾路平
施化吉
机构
江苏大学计算机科学与通信工程学院
北京交通大学电子信息工程学院
南京航空航天大学计算机应用研究所
出处
《计算机工程与设计》
CSCD
北大核心
2009年第8期1966-1968,共3页
基金
国家火炬计划基金项目(2004EB33006[0])
江苏省高校自然科学指导性计划基金项目(05JKD520050)
文摘
研究了现有的基于向量空间模型的文本聚类算法,发现这些算法都存在数据维度过高和忽略了单词之间语义关系的缺点。针对这些问题,提出一种基于单词相似度的文本聚类算法,该算法首先利用单词相似度对单词进行分类获得单词间的语义关系,然后利用产生的单词类作为向量空间的项表示文本降低了向量空间的维度,最后采用基于划分聚类方法对文本聚类。实验结果表明,相对于传统基于向量空间模型的聚类算法,该算法具有较好的聚类效果。
关键词
文本聚
类
单词
相似度
向量
空间
模型
单词类向量空间
文本表示
Keywords
text clustering
word similarity
vector space model
word cluster vector space
text respresentation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于单词相似度的文本聚类
李星毅
曾路平
施化吉
《计算机工程与设计》
CSCD
北大核心
2009
9
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部