期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于遗传FCM算法的文本聚类 被引量:5
1
作者 况夯 罗军 《计算机应用》 CSCD 北大核心 2009年第2期558-560,564,共4页
提出了基于遗传FCM算法的文本聚类方法,首先采用LSI方法对文本特征进行降维,然后通过聚类有效性分析得到文本的类别数,最后采用遗传FCM算法对文本进行聚类。该方法较好地克服了FCM算法收敛于局部最优的缺陷,很好地解决了FCM算法对初始... 提出了基于遗传FCM算法的文本聚类方法,首先采用LSI方法对文本特征进行降维,然后通过聚类有效性分析得到文本的类别数,最后采用遗传FCM算法对文本进行聚类。该方法较好地克服了FCM算法收敛于局部最优的缺陷,很好地解决了FCM算法对初始聚类中心敏感的问题。实验结果表明该方法具有较好的聚类性能。 展开更多
关键词 文本聚类 特征选择 潜在语义索引 遗传算法 模糊C均值聚类
下载PDF
基于Boosting算法集成遗传模糊分类器的文本分类 被引量:1
2
作者 罗军 况夯 《计算机应用》 CSCD 北大核心 2008年第9期2386-2388,2391,共4页
提出一种新颖的基于Boosting模糊分类的文本分类方法。首先采用潜在语义索引(LSI)对文本特征进行选择;然后提出Boosting算法集成模糊分类器学习,在每轮迭代训练过程中,算法通过调整训练样本的分布,利用遗传算法产生分类规则。减少分类... 提出一种新颖的基于Boosting模糊分类的文本分类方法。首先采用潜在语义索引(LSI)对文本特征进行选择;然后提出Boosting算法集成模糊分类器学习,在每轮迭代训练过程中,算法通过调整训练样本的分布,利用遗传算法产生分类规则。减少分类规则能够正确分类样本的权值,使得新产生的分类规则重点考虑难于分类的样本。实验结果表明,该文本分类算法具有良好分类的性能。 展开更多
关键词 模糊分类 特征选择 潜在语义索引 BOOSTING算法 文本分类
下载PDF
基于潜在语义索引的文本特征词权重计算方法 被引量:17
3
作者 李媛媛 马永强 《计算机应用》 CSCD 北大核心 2008年第6期1460-1462,1466,共4页
潜在语义索引具有可计算性强,需要人参与少等优点。对其中重要的优化过程——权重计算,进行了深入分析。针对目前应用最广泛的TF-IDF方法中,采用线性处理的不合理性以及难以突出对文本内容起关键性作用的特征的缺点,提出了一种基于"... 潜在语义索引具有可计算性强,需要人参与少等优点。对其中重要的优化过程——权重计算,进行了深入分析。针对目前应用最广泛的TF-IDF方法中,采用线性处理的不合理性以及难以突出对文本内容起关键性作用的特征的缺点,提出了一种基于"Sigmiod函数"和"位置因子"的新权重方案。突出了文本中不同特征词的重要程度,更有利于潜在语义空间的构造。通过实验平台"中文潜在语义索引分析系统"的测试结果表明,该权重方法更利于基于潜在语义的检索性能的提高。 展开更多
关键词 潜在语义索引 Sigmiod函数 位置因子 权重算法
下载PDF
XML文档聚类中基于语义的特征词权重计算方法
4
作者 龙鹏飞 石奇 《长沙理工大学学报(自然科学版)》 CAS 2015年第2期72-77,共6页
在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率... 在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率因子"和"长度因子"的新权重方案。并在建立向量空间模型时引入LSI理论,在词条之间搭建了语义关系,减少了原词-文档矩阵中包含的噪声,聚类速度和精度都有所提高。在IEEE无类别信息数据集上试验表明,与同类相似度计算方法和聚类方法相比,本研究方法在聚类速度和效果上都有所提高和改善。 展开更多
关键词 潜在语义索引 检索结果聚类 权重算法 聚类算法
下载PDF
大容量文本检索算法
5
作者 赵亚慧 《延边大学学报(自然科学版)》 CAS 2009年第1期60-63,共4页
基于潜在语义索引技术提出一种大容量文本的快速检索算法.首先,利用奇异值分解方法对向量空间模型进行改进,充分考虑词项之间的相关性,在低维空间中表示待检索文本的各个段落与查询文本;其次,利用随机分块查询算法,以查询文本和待检索... 基于潜在语义索引技术提出一种大容量文本的快速检索算法.首先,利用奇异值分解方法对向量空间模型进行改进,充分考虑词项之间的相关性,在低维空间中表示待检索文本的各个段落与查询文本;其次,利用随机分块查询算法,以查询文本和待检索文本各段落之间的余弦相似度作为适应度函数进行检索,输出相似度超过阈值的候选段落;最后,通过仿真实验验证了该方法的有效性.实验结果表明,该算法可以根据段落的语义进行文档的搜索,可以为查询大容量文档提供有效的手段. 展开更多
关键词 文本信息检索 潜在语义索引 随机分块查询算法
下载PDF
一种平面区域的剖分 被引量:1
6
作者 王绍钧 《微细加工技术》 1994年第2期9-15,共7页
本文提出一种图形剖分算法,可将任意条折线围成的平面区域,划分为一个互相不交的子域的集合。这种子域是LSI掩模版加工设备可加工的。由此,LSI掩模版图的设计,可避免受到加工设备的限制,使图样不论如何复杂,可以根据电路需... 本文提出一种图形剖分算法,可将任意条折线围成的平面区域,划分为一个互相不交的子域的集合。这种子域是LSI掩模版加工设备可加工的。由此,LSI掩模版图的设计,可避免受到加工设备的限制,使图样不论如何复杂,可以根据电路需要进行设计,从而保证电路性能。 展开更多
关键词 集成电路 版图图样 设计 平面区域
下载PDF
基于奇异值分解法的二元矩阵聚类算法研究
7
作者 侯磊 刘培强 肖进杰 《计算机安全》 2014年第11期18-23,共6页
文献检索时通常会用到LSI(Latent Semantic Indexing)算法。针对算法中返回值受阈值大小影响的问题,对算法中由奇异值分解SVD(Singular Value Decomposition)得到的左、右奇异值矩阵,用k-means算法对其进行聚类,提出了LSI改进算法。实... 文献检索时通常会用到LSI(Latent Semantic Indexing)算法。针对算法中返回值受阈值大小影响的问题,对算法中由奇异值分解SVD(Singular Value Decomposition)得到的左、右奇异值矩阵,用k-means算法对其进行聚类,提出了LSI改进算法。实验结果表明,与传统的LSI方法相比,改进算法在提供k-means算法分类的维度时获得了更好的性能,证明了算法的有效性。 展开更多
关键词 lsi算法 奇异值分解 K-MEANS算法 矩阵 双向聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部