期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种基于语义相似度的文本聚类算法 被引量:18
1
作者 孙爽 章勇 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2006年第6期712-716,共5页
文本聚类在很多文本挖掘和信息检索系统中发挥着重要的作用。现有的聚类算法大多数都是基于向量空间模型,文档集合中出现的单词词频作为特征项。这些算法都存在数据维数过高、聚簇难以描述的问题,而且忽略了单词间的语义联系。本文提出... 文本聚类在很多文本挖掘和信息检索系统中发挥着重要的作用。现有的聚类算法大多数都是基于向量空间模型,文档集合中出现的单词词频作为特征项。这些算法都存在数据维数过高、聚簇难以描述的问题,而且忽略了单词间的语义联系。本文提出了一种基于语义相似度的文本聚类算法——TCU SS(Text clustering usingsem an ticsim ilarity)算法。TCU SS算法将文档表示成概念列表,有效地解决了数据维数高和聚簇描述难的问题,并给出如何利用概念列表进行聚簇描述的方法。TCU SS算法利用两个概念列表中单词间的语义相似度作为文档间相近程度的度量,并以图为基础进行聚类分析,避免有些聚类算法对聚簇形状的限制。实验证明,TCU SS算法提高了聚类质量。 展开更多
关键词 文本 语义相似度 文本表示 语义相似度的文本算法
下载PDF
基于社会标注的Web资源语义聚类研究 被引量:2
2
作者 杨鲲 马慧芳 史忠植 《高技术通讯》 CAS CSCD 北大核心 2012年第1期48-54,共7页
在深入分析社会标注系统中用户、标签及被标注Web资源之间的关联关系的基础上,提出了基于用户标签的Web资源语义描述获取算法,并基于所获取的Web资源语义描述及其与用户之间的关联关系,利用一种迭代的聚类算法对社会标注系统中的Web... 在深入分析社会标注系统中用户、标签及被标注Web资源之间的关联关系的基础上,提出了基于用户标签的Web资源语义描述获取算法,并基于所获取的Web资源语义描述及其与用户之间的关联关系,利用一种迭代的聚类算法对社会标注系统中的Web资源进行基于语义的聚类,该聚类算法通过迭代不断加强被聚类资源间的一致性信息,从而能够克服传统聚类算法所面临的数据稀疏以及性能问题。研究表明,对Web资源所处环境的各种关联关系的深入分析,能够帮助用户更好地理解和操作相关Web资源,尤其是对于本身特征不充分或难以获取的Web资源来说,关联关系的分析研究具有十分重要的意义。 展开更多
关键词 社会标注 语义抽取 语义聚类算法 广义关联
下载PDF
考虑风险态度的语义多属性大群体决策方法
3
作者 耿秀丽 金运婷 弓晓敏 《统计与决策》 CSSCI 北大核心 2021年第8期168-172,共5页
针对多属性大群体决策中信息的模糊性及决策者风险态度的影响,文章提出一种考虑风险态度的语义多属性大群体决策方法。首先采用区间二元语义聚类算法构建动态偏好聚集结构;其次考虑决策者的风险态度来转化区间评估值,并对动态偏好聚集... 针对多属性大群体决策中信息的模糊性及决策者风险态度的影响,文章提出一种考虑风险态度的语义多属性大群体决策方法。首先采用区间二元语义聚类算法构建动态偏好聚集结构;其次考虑决策者的风险态度来转化区间评估值,并对动态偏好聚集结构进行内层-外层加权集结,获取群体偏好矩阵;然后构建二元语义最小二乘模型来确定属性权重,并采用加权法则对方案进行排序;最后通过案例验证了所提方法的有效性。 展开更多
关键词 多属性大群体决策 区间二元语义聚类算法 风险态度 灰色关联分析
下载PDF
基于本体的向量空间模型的压缩算法 被引量:6
4
作者 袁铭蔚 蒋平 《计算机工程与应用》 CSCD 北大核心 2007年第24期12-14,共3页
采用本体(Ontology)为向量空间模型提供更为丰富、详细的概念空间,在本体的支持下,文档中的术语不再被孤立地看成关键词,而是彼此间有了一定的语义联系。以已获得丰富而详细的本体为前提,考虑当本体空间很大时,解决向量空间的高维数给... 采用本体(Ontology)为向量空间模型提供更为丰富、详细的概念空间,在本体的支持下,文档中的术语不再被孤立地看成关键词,而是彼此间有了一定的语义联系。以已获得丰富而详细的本体为前提,考虑当本体空间很大时,解决向量空间的高维数给计算带来复杂性与难度这一问题,提出基于HCA(Hierarchical Clustering Algorithm)的向量空间压缩算法。 展开更多
关键词 本体向量空间模型分层算法语义距离
下载PDF
Clustering analysis algorithm for security supervising data based on semantic description in coal mines 被引量:1
5
作者 孟凡荣 周勇 夏士雄 《Journal of Southeast University(English Edition)》 EI CAS 2008年第3期354-357,共4页
In order to mine production and security information from security supervising data and to ensure security and safety involved in production and decision-making,a clustering analysis algorithm for security supervising... In order to mine production and security information from security supervising data and to ensure security and safety involved in production and decision-making,a clustering analysis algorithm for security supervising data based on a semantic description in coal mines is studied.First,the semantic and numerical-based hybrid description method of security supervising data in coal mines is described.Secondly,the similarity measurement method of semantic and numerical data are separately given and a weight-based hybrid similarity measurement method for the security supervising data based on a semantic description in coal mines is presented.Thirdly,taking the hybrid similarity measurement method as the distance criteria and using a grid methodology for reference,an improved CURE clustering algorithm based on the grid is presented.Finally,the simulation results of a security supervising data set in coal mines validate the efficiency of the algorithm. 展开更多
关键词 semantic description clustering analysis algorithm similarity measurement
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部