期刊文献+
共找到121篇文章
< 1 2 7 >
每页显示 20 50 100
ISTC: A New Method for Clustering Search Results 被引量:2
1
作者 ZHANG Wei XU Baowen +1 位作者 ZHANG Weifeng XU Junling 《Wuhan University Journal of Natural Sciences》 CAS 2008年第4期501-504,共4页
A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phr... A new common phrase scoring method is proposed according to term frequency-inverse document frequency (TFIDF) and independence of the phrase. Combining the two properties can help identify more reasonable common phrases, which improve the accuracy of clustering. Also, the equation to measure the in-dependence of a phrase is proposed in this paper. The new algorithm which improves suffix tree clustering algorithm (STC) is named as improved suffix tree clustering (ISTC). To validate the proposed algorithm, a prototype system is implemented and used to cluster several groups of web search results obtained from Google search engine. Experimental results show that the improved algorithm offers higher accuracy than traditional suffix tree clustering. 展开更多
关键词 Web search results clustering suffix tree term frequency-inverse document frequency (TFIDF) independence of phrases
下载PDF
Self-Expanded Clustering Algorithm Based on Density Units with Evaluation Feedback Section 被引量:1
2
作者 YU Yongqian ZHAO Xiangguo CHEN Hengyue WANG Bin YU Ge WANG Guoren 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1069-1075,共7页
This paper presents an effective clustering mode and a novel clustering result evaluating mode. Clustering mode has two limited integral parameters. Evaluating mode evaluates clustering results and gives each a mark. ... This paper presents an effective clustering mode and a novel clustering result evaluating mode. Clustering mode has two limited integral parameters. Evaluating mode evaluates clustering results and gives each a mark. The higher mark the clustering result gains, the higher quality it has. By organizing two modes in different ways, we can build two clustering algorithms: SECDU(Self-Expanded Clustering Algorithm based on Density Units) and SECDUF(Self-Expanded Clustering Algorithm Based on Density Units with Evaluation Feedback Section). SECDU enumerates all value pairs of two parameters of clustering mode to process data set repeatedly and evaluates every clustering result by evaluating mode. Then SECDU output the clustering result that has the highest evaluating mark among all the ones. By applying "hill-climbing algorithm", SECDUF improves clustering efficiency greatly. Data sets that have different distribution features can be well adapted to both algorithms. SECDU and SECDUF can output high-quality clustering results. SECDUF tunes parameters of clustering mode automatically and no man's action involves through the whole process. In addition, SECDUF has a high clustering performance. 展开更多
关键词 clustering clustering result evaluating density unit hillclimbing algorithm
下载PDF
多模型融合的VoxSRC22说话人日志系统
3
作者 杜雨轩 周若华 《计算机工程与应用》 CSCD 北大核心 2024年第10期164-172,共9页
为有效解决“谁在什么时候说话”的问题,提出一种说话人日志方法。该方法由六个模块组成,包括语音活动检测(voice activity detection,VAD)、语音增强、说话人嵌入提取器、说话人聚类、重叠语音检测(overlapping speech detection,OSD)... 为有效解决“谁在什么时候说话”的问题,提出一种说话人日志方法。该方法由六个模块组成,包括语音活动检测(voice activity detection,VAD)、语音增强、说话人嵌入提取器、说话人聚类、重叠语音检测(overlapping speech detection,OSD)和结果融合。利用语音增强技术可以改善语音活动检测的性能。有效地结合不同的说话人嵌入提取器和聚类算法可以进一步降低系统错误率。在系统融合后处理重叠语音展示了最佳结果。实验结果表明,最佳系统的性能相对基线提升了72%,并在VoxCeleb说话人识别挑战赛(VoxCeleb speaker recognition challenge,VoxSRC)2022评估集上分别实现了5.48%的说话人日志错误率(diarization error rate,DER)和32.10%的杰卡德错误率(Jaccard error rate,JER),排名第四。 展开更多
关键词 说话人日志 语音活动检测 声纹嵌入 说话人聚类 结果融合
下载PDF
2023—2024赛季CBA宁波队制胜关键技术指标分析
4
作者 冯子俊 郑磊 《体育科技文献通报》 2024年第8期31-34,共4页
本文采用文献资料法、数理统计法、聚类分析法、对比分析法等研究方法,通过对520场CBA常规赛数据的分析,结合宁波队在常规赛中的表现,识别并评估了影响宁波队比赛结果的核心技术统计指标;同时,通过聚类分析将比赛分为发挥出色的I组和发... 本文采用文献资料法、数理统计法、聚类分析法、对比分析法等研究方法,通过对520场CBA常规赛数据的分析,结合宁波队在常规赛中的表现,识别并评估了影响宁波队比赛结果的核心技术统计指标;同时,通过聚类分析将比赛分为发挥出色的I组和发挥平庸的II组,进一步对比分析了2组间技术指标的差异。结果显示,得分、抢断、盖帽、三分命中率等指标在2组间存在显著性差异,表明这些指标在宁波队获胜的比赛中起到了关键作用。运用单因素和多因素Logistic回归分析及Lasso回归方法,进一步筛选和验证了对宁波队比赛胜负影响最大的技术统计指标,以期为宁波队制定合理的备战策略提供支持,以助其在未来的比赛中提高竞技水平,争取更多的胜利。 展开更多
关键词 CBA联赛 宁波队 比赛胜负 技术指标 聚类分析
下载PDF
基于灰色聚类算法的二次运检员工心理测评研究
5
作者 李俊鹏 《计算机与数字工程》 2024年第11期3229-3232,3296,共5页
大量电力事故统计表明,心理因素是造成事故发生的主要原因。因此对电力员工进行心理测评有着重要的实际应用价值,二次运检岗位是保障电力安全的关键岗位,为了更准确地对二次运检岗位员工的安全心理进行测评,提出了基于灰色聚类算法的电... 大量电力事故统计表明,心理因素是造成事故发生的主要原因。因此对电力员工进行心理测评有着重要的实际应用价值,二次运检岗位是保障电力安全的关键岗位,为了更准确地对二次运检岗位员工的安全心理进行测评,提出了基于灰色聚类算法的电力员工安全心理测评方法。首先根据相关文献的研究以及对二次运检员工的问卷调查构建安全心理测评指标体系,并对指标评分进行量化。然后基于指标数据,采用灰色聚类算法构建二次运检员工心理测评模型,最后进行了二次运检员工安全心理状态测评实例分析,结果表明该方法能准确描述电力员工安全心理状态,有利于电力安全生产管理。 展开更多
关键词 安全心理 灰色聚类算法 指标体系 实例应用 结果分析
下载PDF
融合PVA聚类和二维直方图的图像分割算法
6
作者 刘璐 史鹏敏 《计算机与数字工程》 2024年第8期2488-2492,共5页
针对一维直方图的Vague系统方法在进行图像分割时未考虑与之相邻的信息,提出融合PVA聚类和二维直方图的图像分割算法,该算法核心内容是合理地构造二维直方图,通过搜索与之匹配的元素作为集群样本的元素,利用粒子群能快速寻找最优解的能... 针对一维直方图的Vague系统方法在进行图像分割时未考虑与之相邻的信息,提出融合PVA聚类和二维直方图的图像分割算法,该算法核心内容是合理地构造二维直方图,通过搜索与之匹配的元素作为集群样本的元素,利用粒子群能快速寻找最优解的能力,建立新的目标函数以提高聚类效果。 展开更多
关键词 图像分割 Vague聚类 粒子群 二维直方图 分割效果
下载PDF
基于引力概念的聚类质量评估算法 被引量:3
7
作者 于勇前 赵相国 +1 位作者 陈衡岳 王国仁 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第8期1109-1112,共4页
为了定量分析聚类算法的聚类结果,提出了基于引力概念的聚类质量评估算法.该算法将数据空间中的数据点视为带有单位质量的质点,通过分析聚类结果中数据点之间的引力关系来评估聚类结果的质量.在一个聚类结果中,各类中的数据点之间引力... 为了定量分析聚类算法的聚类结果,提出了基于引力概念的聚类质量评估算法.该算法将数据空间中的数据点视为带有单位质量的质点,通过分析聚类结果中数据点之间的引力关系来评估聚类结果的质量.在一个聚类结果中,各类中的数据点之间引力大并且噪音数据受到的引力小,这样的聚类结果视为质量较高的聚类结果.相反,如果类中数据间的引力较小而噪音数据所受到的引力较大,这样的聚类结果就是一个质量不高的聚类结果.在几个不同的数据集上,对算法的有效性和高效性进行了测试.实验结果表明,该算法能在极短的响应时间内得到聚类结果评估值,正确地反映聚类结果的优劣.提出的算法可以引导聚类方法自动发现最佳聚类结果而无需人工干预. 展开更多
关键词 聚类 聚类质量评估 引力 聚类算法 数据挖掘
下载PDF
基于ontology抽取优化初始选择的检索结果聚类 被引量:8
8
作者 陈毅恒 秦兵 +2 位作者 宋凡 刘挺 李生 《电子学报》 EI CAS CSCD 北大核心 2008年第B12期166-170,156,共6页
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结... 本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高. 展开更多
关键词 检索结果聚类 ONTOLOGY 标签
下载PDF
一种基于层次聚类的机场噪声数据挖掘方法 被引量:12
9
作者 徐涛 谢继文 杨国庆 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2013年第5期715-721,共7页
针对机场噪声数据集特征,提出一种基于代表点的快速层次聚类算法,该算法在传统凝聚层次聚类算法的基础上,借助聚类代表点法和二分法策略进行改进。同时,提出一种聚类代表点和聚类算法相似性定义相结合的聚类结果评价方法,并采用其对聚... 针对机场噪声数据集特征,提出一种基于代表点的快速层次聚类算法,该算法在传统凝聚层次聚类算法的基础上,借助聚类代表点法和二分法策略进行改进。同时,提出一种聚类代表点和聚类算法相似性定义相结合的聚类结果评价方法,并采用其对聚类结果进行评价。实验结果表明,该算法不仅运行效率高,而且能够较准确地发现特定类型飞行事件的噪声分布模式,利用该分布模式能够较准确地预测特定类型飞行事件的噪声分布状况。 展开更多
关键词 数据挖掘 机场噪声预测 代表点 快速层次聚类算法 聚类结果评价
下载PDF
精益生产系统运作优化模型及求解方法 被引量:3
10
作者 王志国 唐任仲 +1 位作者 白翱 余式汪 《机械工程学报》 EI CAS CSCD 北大核心 2009年第9期114-119,共6页
针对传统生产方式的不足和精益生产的要求,在分析精益生产系统运作的基础上,提出将精益生产的运作优化问题抽象为具体的大系统多目标规划问题。以车间制造元素的工作量作为决策变量,以产量、质量、成本、交货期等指标为动态约束条件构... 针对传统生产方式的不足和精益生产的要求,在分析精益生产系统运作的基础上,提出将精益生产的运作优化问题抽象为具体的大系统多目标规划问题。以车间制造元素的工作量作为决策变量,以产量、质量、成本、交货期等指标为动态约束条件构建优化运作模型。在模型中引入目标函数优先级及优先权因子,以反映多个相互矛盾目标的重要程度,可以根据实际问题的动态属性确定系统的最佳运作目标需求。为解决精益生产系统运作优化的动态性、多目标、多阶段性,给出一种采用'串式调优法'求解模型的算法。将精益生产系统运作优化模型简化为产能优化、时间优化以及平衡协调等子模型,应用'串式调优法'分别对子模型求解,结合浙江省某电能表装配生产线进行情况,将优化模型和求解算法通过Witness仿真验证,仿真结果表明了模型的合理性和求解算法的准确性、高效性。 展开更多
关键词 精益生产系统 多目标优化 串式调优法 运作优化模型 建模仿真
下载PDF
零知识下的比特流未知协议分类模型 被引量:2
11
作者 张凤荔 周洪川 +2 位作者 张俊娇 刘渊 张春瑞 《计算机科学》 CSCD 北大核心 2016年第8期39-44,共6页
针对在零知识下识别比特流未知协议这一问题,提出了一种协议分类模型。该模型首先利用二进制流的固有特性来计算协议种类个数近似值K和初始聚类中心,然后使用改进的K-Means聚类算法指定K及初始聚类中心以进行聚类,最后使用基于信息熵的... 针对在零知识下识别比特流未知协议这一问题,提出了一种协议分类模型。该模型首先利用二进制流的固有特性来计算协议种类个数近似值K和初始聚类中心,然后使用改进的K-Means聚类算法指定K及初始聚类中心以进行聚类,最后使用基于信息熵的混杂度评价方法对聚类结果进行评价,可将评价结果较好的类簇作为一种协议类型进行标记,用于其他分析。使用林肯实验室发布的实验数据进行测试,结果表明该模型能以较高的准确率对未知协议进行分类,基于信息熵的类簇评价方法也具有一定实用性。 展开更多
关键词 K-MEANS聚类 未知协议识别 K值计算 聚类结果评估
下载PDF
一种层次化的检索结果聚类方法 被引量:15
12
作者 张刚 刘悦 +1 位作者 郭嘉丰 程学旗 《计算机研究与发展》 EI CSCD 北大核心 2008年第3期542-547,共6页
检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别... 检索结果聚类能够帮助用户快速地浏览搜索引擎返回的结果.传统的聚类方法由于不能生成有意义的类别标签因此是不适合的,为了改善检索结果层次化聚类的效果,采用了基于标签的聚类算法,提出了将DF、查询日志、查询词上下文特征融合的类别标签抽取算法,并以抽取的标签构造基础类别图,通过GBCA算法构建层次化聚类结果.实验证明了多特征融合模型的有效性;GBCA算法在类别标签抽取和F-Measure两个评价指标上都比STC和Snaket算法有很大的提高. 展开更多
关键词 信息检索 检索结果聚类 层次化聚类 文本聚类 聚类
下载PDF
基于关键词共现分析的检索结果聚类研究 被引量:9
13
作者 李枫林 何洲芳 《情报学报》 CSSCI 北大核心 2011年第8期819-825,共7页
随着互联网规模的急剧扩张,提升信息检索的效用变得相当困难。本文首先通过特定算法提取每篇文档的关键词,然后运用统计方法计量不同文档的共现关键词并形成相应的共现关键词标签矩阵,最后利用层次聚类算法对共现关键词标签进行聚类并... 随着互联网规模的急剧扩张,提升信息检索的效用变得相当困难。本文首先通过特定算法提取每篇文档的关键词,然后运用统计方法计量不同文档的共现关键词并形成相应的共现关键词标签矩阵,最后利用层次聚类算法对共现关键词标签进行聚类并形成相应的层次标签树来构造文档聚类束。该方法可以对源搜索引擎返回的结果进行有效的分类,使用户在更高主题层次上查看检索词的相关信息,准确地找到感兴趣的信息。通过与Lingo算法的比较,显示本文算法所得的标签更具可读性和概括性,同时F-measure评价指标也表明本算法在文本聚类的质量上有了一定的提升。 展开更多
关键词 共现 聚类 检索结果
下载PDF
基于三角不等式原理的K-means加速算法 被引量:4
14
作者 常晋义 何春霞 《计算机工程与设计》 CSCD 北大核心 2007年第21期5094-5096,共3页
K-means聚类算法简单快速,应用极为广泛,但是当处理海量数据时,时间效率仍然有待提高。当一个数据点远离一个聚类时,就没必要计算这两者之间的精确距离,以确定该数据点不属于这个类。应用三角不等式原理对其进行了改进,避免了冗余的距... K-means聚类算法简单快速,应用极为广泛,但是当处理海量数据时,时间效率仍然有待提高。当一个数据点远离一个聚类时,就没必要计算这两者之间的精确距离,以确定该数据点不属于这个类。应用三角不等式原理对其进行了改进,避免了冗余的距离计算。实验结果表明,改进之后在速度上有很大程度的提高,数据规模越大,改进效果越明显,且聚类效果保持了原算法的准确性。 展开更多
关键词 K-均值算法 划分聚类 三角不等式原理 聚类分析 聚类算法 聚类效果
下载PDF
基于模糊概念格的Web搜索结果聚类算法 被引量:6
15
作者 黄健斌 姬红兵 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2005年第6期856-860,共5页
提出了一种模糊形式概念分析方法,给出了在对象和属性的模糊二元关系上生成模糊概念格的过程.提出了一种在格的拓扑序列上进行概念聚类的快速算法,并且定义了概念聚类间基于偏序的层次关系.该方法利用格理论解决了概念聚类中概念间的多... 提出了一种模糊形式概念分析方法,给出了在对象和属性的模糊二元关系上生成模糊概念格的过程.提出了一种在格的拓扑序列上进行概念聚类的快速算法,并且定义了概念聚类间基于偏序的层次关系.该方法利用格理论解决了概念聚类中概念间的多重继承关系,应用在W eb搜索结果聚类上,实验结果表明算法在聚类质量和检索性能上都有改进和提高. 展开更多
关键词 模糊概念格 概念聚类 Web搜索结果聚类
下载PDF
基于多语言社会化标签聚类的潜在社会关系网络发现 被引量:4
16
作者 章成志 汤丽娟 《情报理论与实践》 CSSCI 北大核心 2013年第9期67-71,共5页
文章采用分裂式层次聚类算法分别对中英文标签进行聚类,在标签聚类的基础上,采用先聚类后翻译的映射策略实现中英文标签的映射;在标签聚类及映射的基础上,自动发现多语言环境下潜在的社会关系网络。实验结果表明多语言环境下的社会关系... 文章采用分裂式层次聚类算法分别对中英文标签进行聚类,在标签聚类的基础上,采用先聚类后翻译的映射策略实现中英文标签的映射;在标签聚类及映射的基础上,自动发现多语言环境下潜在的社会关系网络。实验结果表明多语言环境下的社会关系网络比单一语言环境下的社会关系网络更为丰富。 展开更多
关键词 社会化标签 聚类结果映射 潜在社会关系网络
下载PDF
基于潜在语义索引和自组织映射网的检索结果聚类方法 被引量:4
17
作者 陈毅恒 秦兵 +2 位作者 刘挺 王平 李生 《计算机研究与发展》 EI CSCD 北大核心 2009年第7期1176-1183,共8页
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检... 随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高. 展开更多
关键词 检索结果聚类 潜在语义索引 自组织映射网 标签 边界划分
下载PDF
对聚类算法普遍存在问题的解决办法 被引量:10
18
作者 姜园 张朝阳 +1 位作者 仇佩亮 戚玉鹏 《电路与系统学报》 CSCD 2004年第3期92-99,共8页
聚类广泛应用于统计、机器学习、模式识别、数据分析等领域并越来越受重视。本文研究了各种聚类算法共同面临的五个问题:聚类效果评估、类数目估计、数据预处理、样本间相似性测量、抗干扰性能,分析了对这些问题的有代表性的解决方法,... 聚类广泛应用于统计、机器学习、模式识别、数据分析等领域并越来越受重视。本文研究了各种聚类算法共同面临的五个问题:聚类效果评估、类数目估计、数据预处理、样本间相似性测量、抗干扰性能,分析了对这些问题的有代表性的解决方法,总结并预测了未来聚类算法在这五个方面的研究方向。 展开更多
关键词 聚类 效果评估 类数目估计 预处理 相似性测量 抗干扰性能
下载PDF
基于主题模型的检索结果聚类应用研究 被引量:14
19
作者 阮光册 夏磊 《情报杂志》 CSSCI 北大核心 2017年第3期179-184,共6页
[目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语... [目的/意义]检索结果聚类能够帮助用户快速地浏览系统返回的检索结果。传统的基于向量空间的检索结果聚类缺乏对文本深层次的语义联系的挖掘,使得聚类结果的可读性、可理解性存在不足。因此,对检索结果进行语义层面的分析,并实现基于语义的检索结果聚类研究,具有重要的理论和实践意义。[方法/过程]将LDA主题模型与K-means算法相结合,利用LDA模型实现文本潜在语义的识别,将"文本-潜在主题"概率分布作为Kmeans聚类依据进行聚类分析,最后提取与聚类中心最近的主题的描述词作为检索结果聚类的标签。[结果/结论]实验表明,该方法在检索结果聚类以及聚类标签识别上具有很好的效果。 展开更多
关键词 LDA 检索结果聚类 聚类标签 概率分布 语义挖掘 K-MEANS
下载PDF
基于迭代分类的聚类结果改进方法 被引量:1
20
作者 王小华 楼佳 《计算机工程》 CAS CSCD 北大核心 2010年第13期27-29,共3页
综合考虑聚类、分类的特点,从聚类结果出发,学习并利用初始聚类结构信息形成训练集,结合迭代分类思想重新划分原数据集,提出一种基于迭代分类的聚类结果改进方法。实验结果表明该方法具有更高准确率,为获得良好的聚类效果提供了新思路。
关键词 聚类 聚类结果 迭代分类 K近邻分类
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部