期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于主题词频数特征的文本主题划分 被引量:11
1
作者 康恺 林坤辉 周昌乐 《计算机应用》 CSCD 北大核心 2006年第8期1993-1995,共3页
目前文本分类所采用的文本—词频矩阵具有词频维数过大和过于稀疏两个特点,给计算造成了一定困难。为解决这一问题,从用户使用搜索引擎时选择所需文本的心理出发,提出了一种基于主题词频数特征的文本主题划分方法。该方法首先根据统计... 目前文本分类所采用的文本—词频矩阵具有词频维数过大和过于稀疏两个特点,给计算造成了一定困难。为解决这一问题,从用户使用搜索引擎时选择所需文本的心理出发,提出了一种基于主题词频数特征的文本主题划分方法。该方法首先根据统计方法筛选各文本类的主题词,然后以主题词类替代单个词作为特征采用模糊C-均值(FCM)算法施行文本聚类。实验获得了较好的主题划分效果,并与一种基于词聚类的文本聚类方法进行了过程及结果中多个方面的比较,得出了一些在实施要点和应用背景上较有意义的结论。 展开更多
关键词 搜索引擎 文本聚类 模糊C-均值 主题词筛选
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部