期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于和声搜索机制的特征选择与文本聚类分析
1
作者 王永刚 李靖 +2 位作者 王文慧 曹传剑 王晓燕 《计算机工程与设计》 北大核心 2022年第2期472-478,共7页
针对文本信息特征冗余多、噪声大问题,提出基于和声搜索机制的文本特征选择算法。以词频逆文本频率指数为目标函数评估特征词条;在初始文档集中通过和声搜索的记忆考虑、纵向倾角调整和随机选择3种特征选择新解更新规则,迭代搜索最优特... 针对文本信息特征冗余多、噪声大问题,提出基于和声搜索机制的文本特征选择算法。以词频逆文本频率指数为目标函数评估特征词条;在初始文档集中通过和声搜索的记忆考虑、纵向倾角调整和随机选择3种特征选择新解更新规则,迭代搜索最优特征子集;以最优特征子集为基础,以K均值进行文本聚类。利用4种典型文档数据集进行仿真实验,实验结果表明,该算法可以有效降低文本特征维度,聚类准确率更高。 展开更多
关键词 特征选择 文本 和声搜索机制 k均值文本聚类 特征子集
下载PDF
融入新的特征选择机制的文本数据聚类算法 被引量:2
2
作者 田夏利 熊莹 《计算机工程与设计》 北大核心 2021年第3期734-741,共8页
文本信息中包括许多无用特征,这种噪声特征会影响文本聚类效果,为此提出一种基于粒子群优化的文本特征选择算法。利用词频逆文本频率指数为目标函数评估每个文档的文本特征,从初始文档数据集中求解新的有用特征最优子集;以该最优有用特... 文本信息中包括许多无用特征,这种噪声特征会影响文本聚类效果,为此提出一种基于粒子群优化的文本特征选择算法。利用词频逆文本频率指数为目标函数评估每个文档的文本特征,从初始文档数据集中求解新的有用特征最优子集;以该最优有用特征子集作为K均值聚类的输入进行文本聚类,得到最优文本聚类结果。利用文档数据集进行聚类测试,其结果表明,在多项评估指标上算法表现得更加优秀,在特征选择规模上降低了初始文档特征规模。 展开更多
关键词 特征选择 文本 粒子群优化 k均值文本聚类 目标函数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部