期刊文献+
共找到667篇文章
< 1 2 34 >
每页显示 20 50 100
基于聚类方法的负样本生成器研究与实现
1
作者 温欣 丁怡泽 +4 位作者 屈克将 丁建新 王海涛 王建华 王天 《科技创新与应用》 2024年第16期1-6,共6页
知识图谱嵌入的目标是为知识图谱中的实体和关系生成低维连续的特征向量,以便计算机能够通过数学运算来挖掘知识的潜在语义,并将其应用于三元组补全、实体分类和实体解析等下游任务。翻译模型(Trans)是一种简单而有效的知识图谱嵌入方法... 知识图谱嵌入的目标是为知识图谱中的实体和关系生成低维连续的特征向量,以便计算机能够通过数学运算来挖掘知识的潜在语义,并将其应用于三元组补全、实体分类和实体解析等下游任务。翻译模型(Trans)是一种简单而有效的知识图谱嵌入方法,其采用负采样的方法来提高知识图谱嵌入的准确性。然而,传统的负采样方法采用随机负采样,容易生成低质量的负三元组,从而导致实体和关系的嵌入向量训练不准确。针对这个问题,该文提出基于Canopy和K-means方法的相似实体负样本生成器(Negative Sampling of Similar Entities,NSSE),用于生成高质量的负样本。实验结果表明,使用NSSE的翻译模型相比原有模型在嵌入向量生成方面取得更好的效果。 展开更多
关键词 知识图谱嵌入 翻译模型 负采样 相似实体 聚类方法
下载PDF
基于烟花算法的智慧城市物联网数据流聚类方法
2
作者 郑泛舟 《成都工业学院学报》 2024年第3期50-54,共5页
以往的智慧城市物联网数据流聚类方法对数据特征提取不精准,聚类速度慢。为了提高聚类速度,缩短数据流聚类的耗时,设计了基于烟花算法的智慧城市物联网数据流聚类方法。通过对样本矩阵的标准化计算,降低数据运算的压力,完成对物联网数... 以往的智慧城市物联网数据流聚类方法对数据特征提取不精准,聚类速度慢。为了提高聚类速度,缩短数据流聚类的耗时,设计了基于烟花算法的智慧城市物联网数据流聚类方法。通过对样本矩阵的标准化计算,降低数据运算的压力,完成对物联网数据的预处理。在烟花算法的支持下,对数据进行去重处理,精准提取数据特征。再根据数据属性不同,计算数据的响应函数,构建数据聚类模型,利用余弦对数据进行聚类分析,实现物联网数据流的聚类。实验结果表明,该聚类方法的聚类平均耗时为15.52 ms,说明该方法能够有效缩短聚类耗时。 展开更多
关键词 烟花算法 智慧城市 物联网 数据流聚类方法 特征提取
下载PDF
并行处理网络下半结构化大数据快速聚类方法 被引量:1
3
作者 王珂 《信息技术与信息化》 2024年第1期126-130,共5页
半结构化数据量已经超过PB级,在这种大规模数据集上快速响应交互式请求,对关系数据库查询和大数据处理技术都提出了挑战。然而当前的聚类算法均是离线批量处理结构化、非结构化数据。面对半结构化数据对象和应用需求的转变,需要对传统... 半结构化数据量已经超过PB级,在这种大规模数据集上快速响应交互式请求,对关系数据库查询和大数据处理技术都提出了挑战。然而当前的聚类算法均是离线批量处理结构化、非结构化数据。面对半结构化数据对象和应用需求的转变,需要对传统聚类算法针对性地优化和改进。设计一种并行处理网络下半结构化大数据快速聚类方法。首先,在常用的Linux与Windows网络环境中捕获大数据包,并对捕获的多源异构大数据做清洗和集成等预处理操作,完成数据准备工作;然后在并行处理网络下,基于MapReduce框架改进常规CanpoyK-means聚类算法形成BCK-means并行聚类算法,对多源异构大数据进行并行化聚类分析,实现半结构化大数据的快速聚类挖掘。实验结果表明,设计方法在10 s内即可完成不同类别的半结构化数据集的聚类且聚类结果稳定,在半结构化数据聚类挖掘效率方面具有优势。 展开更多
关键词 并行处理网络 半结构化大数据 数据快速 聚类方法
下载PDF
面向云制造的资源集群聚类方法研究
4
作者 苑明海 李子晨 +2 位作者 黄涵钰 裴凤雀 俞红焱 《制造技术与机床》 北大核心 2023年第10期41-47,共7页
针对云制造平台海量多样的服务资源分类界限模糊的问题,分析了云服务和制造资源之间的关系,提出云制造下混合式资源服务聚集模型。此外,文章基于k-means聚类算法建立了聚类有效性评估函数;针对k-means聚类算法对初始聚簇中心敏感易陷入... 针对云制造平台海量多样的服务资源分类界限模糊的问题,分析了云服务和制造资源之间的关系,提出云制造下混合式资源服务聚集模型。此外,文章基于k-means聚类算法建立了聚类有效性评估函数;针对k-means聚类算法对初始聚簇中心敏感易陷入局部最优的缺点,引入蛙跳算法确定初始聚簇中心,利用反向解扩大初始蛙群的搜索范围,结合最优解均值改进族群最差蛙的优化,提高族群的信息共享能力,结合改进后的蛙跳算法和k-means迭代,提出一种基于蛙跳算法改进的k-means聚类算法。最后,以两种数据集和云平台上同类机床资源为例,验证了所提聚类算法的有效性和可行性。 展开更多
关键词 云制造 制造资源 聚类方法 K-MEANS 蛙跳算法
下载PDF
基于电动出租车数据的充电桩选址聚类方法比较 被引量:1
5
作者 甄西媛 高超 +1 位作者 李向华 冀杰 《汽车工程学报》 2023年第4期564-573,共10页
为有效降低出租车运营企业及经营者的经济成本,通过分析出租车的卫星轨迹数据,比较和选取用于电动出租车充电桩选址规划的聚类方法。以上海市电动出租车充电站的选址规划为研究对象,分别基于孤立森林和聚类算法设计异常值检测方法,对相... 为有效降低出租车运营企业及经营者的经济成本,通过分析出租车的卫星轨迹数据,比较和选取用于电动出租车充电桩选址规划的聚类方法。以上海市电动出租车充电站的选址规划为研究对象,分别基于孤立森林和聚类算法设计异常值检测方法,对相关时段的出租车卫星数据进行清理以及数据可视化处理;比较层次聚类(Agglomerative Clustering)、高斯混合模型(Gaussian Mixture Model,GMM)、K-means聚类、Mean-Shift聚类以及谱聚类(Spectral Clustering)5种算法的聚类效果,并选取K-means算法作为充电桩选址规划参考算法。从城市区域划分及企业运营角度确定充电桩选址方案,为未来上海市区电动出租车充电桩的数量和容量配置提供设计依据。 展开更多
关键词 电动出租车 充电桩选址 异常值检测 聚类方法 可视化
下载PDF
电网多元异构数据模糊聚类方法研究
6
作者 刘家旭 赵中英 +1 位作者 何辉 梁添增 《精密制造与自动化》 2023年第3期38-40,60,共4页
为优化数据模糊聚类效果,为电网建设工作的规划化实施予以技术支持,在考虑属性划分的前提下,开展电网多元异构数据模糊聚类方法的设计研究。电网多元异构数据预处理,确保数据集合中无冗余数据、无明确缺失数据段、无重叠数据;在明确每... 为优化数据模糊聚类效果,为电网建设工作的规划化实施予以技术支持,在考虑属性划分的前提下,开展电网多元异构数据模糊聚类方法的设计研究。电网多元异构数据预处理,确保数据集合中无冗余数据、无明确缺失数据段、无重叠数据;在明确每种样本量都有多项特性的基础上,提取样本数据的属性特征,进行异构数据的分类与并行计算;对相同类别或具有相同特征的数据进行融合,确定聚类中心后,进行数据的模糊聚类处理。设计对比实验,实验结果表明:提出的方法应用效果良好,按照规范使用该方法进行电网多元异构数据模糊聚类,可以提高聚类后数组中数据重叠。 展开更多
关键词 属性划分 并行计算 预处理 模糊聚类方法 多元异构数据 电网
下载PDF
中国科学院通过创新蛋白聚类方法开发新型碱基编辑工具
7
《蔬菜》 2023年第7期75-75,共1页
中国科学院遗传与发育生物学研究所高彩霞研究组通过蛋白质结构预测模型Alpha Fold2对具有代表性的脱氨功能序列进行批量三维结构预测,创新性地开展了基于三维结构的蛋白质多重比对与聚类,成功将潜在的脱氨酶划分为20个不同分支。在这... 中国科学院遗传与发育生物学研究所高彩霞研究组通过蛋白质结构预测模型Alpha Fold2对具有代表性的脱氨功能序列进行批量三维结构预测,创新性地开展了基于三维结构的蛋白质多重比对与聚类,成功将潜在的脱氨酶划分为20个不同分支。在这些分支中,对具有类Ddd A(Double-stranded DNA deaminase toxin A-like)脱氨结构域的蛋白进行进一步结构聚类和功能验证。 展开更多
关键词 中国科学院 蛋白质结构预测 聚类方法 生物学研究所 三维结构 脱氨酶 结构
下载PDF
利用基于模糊划分的ISODATA模糊聚类方法识别电力系统同调机群 被引量:18
8
作者 王华芳 卫志农 +2 位作者 杨博 张涛 孙国强 《电网技术》 EI CSCD 北大核心 2005年第2期19-22,共4页
给出了一种利用基于模糊划分的迭代自组织数据分析技术(ISODATA)模糊聚类方法识别电力系统同调机群的算法。首先介绍了基于模糊划分的ISODATA模糊聚类方法的原理;然后在一些基本假设并对系统元件做了必要简化的基础上,形成了利用该方法... 给出了一种利用基于模糊划分的迭代自组织数据分析技术(ISODATA)模糊聚类方法识别电力系统同调机群的算法。首先介绍了基于模糊划分的ISODATA模糊聚类方法的原理;然后在一些基本假设并对系统元件做了必要简化的基础上,形成了利用该方法识别同调机群的模糊集合;最后通过对新英格兰10机39节点系统的算例仿真验证了该方法的有效性。 展开更多
关键词 机群 模糊划分 模糊聚类方法 ISODATA 识别 算法 系统 基本假设 新英格兰 技术
下载PDF
煤与瓦斯突出预测可拓聚类方法及应用 被引量:50
9
作者 郭德勇 郑茂杰 +2 位作者 郭超 胡殿明 张晓珂 《煤炭学报》 EI CAS CSCD 北大核心 2009年第6期783-787,共5页
在综合分析煤与瓦斯突出多种影响因素基础上,提出预测敏感指标并建立煤与瓦斯突出危险性等级,应用物元和可拓集合理论建立了煤与瓦斯突出危险性预测的物元可拓模型,提出了煤与瓦斯突出危险性预测的可拓聚类方法.以平顶山煤业集团公司天... 在综合分析煤与瓦斯突出多种影响因素基础上,提出预测敏感指标并建立煤与瓦斯突出危险性等级,应用物元和可拓集合理论建立了煤与瓦斯突出危险性预测的物元可拓模型,提出了煤与瓦斯突出危险性预测的可拓聚类方法.以平顶山煤业集团公司天安十三矿为例对煤与瓦斯突出危险性预测可拓聚类方法的可行性进行了验证. 展开更多
关键词 煤与瓦斯突出预测 可拓聚类方法 分析 物元模型
下载PDF
基于机电距离的聚类方法在动态等值中的应用 被引量:20
10
作者 周海强 鞠平 +1 位作者 孔德超 杨辉 《电力系统自动化》 EI CSCD 北大核心 2008年第3期14-17,共4页
系统动态等值是在保持适当精度的前提下提高分析速度的有效措施之一。文中综合利用系统各单元间电气和机械距离、系统参数以及各种典型扰动作用下的暂态响应曲线,提出了新的动态等值方法。该方法根据系统各单元间机电距离的量化指标,应... 系统动态等值是在保持适当精度的前提下提高分析速度的有效措施之一。文中综合利用系统各单元间电气和机械距离、系统参数以及各种典型扰动作用下的暂态响应曲线,提出了新的动态等值方法。该方法根据系统各单元间机电距离的量化指标,应用离差平方和方法对初始系统进行聚类分析;然后根据聚类结果将系统划分成内、外部子系统,并对外部系统进行参数等值,得到与初始系统等价的简化系统。10机39母线新英格兰系统的验算结果表明,所提出的动态等值方法较好地保留了外部系统对研究系统动态行为的影响,有效地简化了初始系统。 展开更多
关键词 动态等值 机电距离 聚类方法 相关矩阵
下载PDF
移动轨迹聚类方法研究综述 被引量:18
11
作者 牟乃夏 徐玉静 +3 位作者 张恒才 陈洁 张灵先 刘希亮 《测绘通报》 CSCD 北大核心 2018年第1期1-7,共7页
轨迹数据是人类移动行为的表征,能够映射出人的出行模式和社会属性等信息。怎样有效挖掘轨迹数据蕴藏的人类活动规律一直是研究的热点。通过轨迹聚类发现行为相似的类簇,从而探究群体的移动模式是轨迹挖掘和深度应用常见的方法之一。本... 轨迹数据是人类移动行为的表征,能够映射出人的出行模式和社会属性等信息。怎样有效挖掘轨迹数据蕴藏的人类活动规律一直是研究的热点。通过轨迹聚类发现行为相似的类簇,从而探究群体的移动模式是轨迹挖掘和深度应用常见的方法之一。本文首先根据轨迹数据的特点,将轨迹数据模型分为轨迹点模型和轨迹段模型,并据此定义相应的相似性度量:空间相似性度量和时空相似性度量;然后,对两类模型的聚类方法进行了综述,并总结不同聚类算法的优缺点,以期为不同应用选取聚类算法提供科学依据;最后对移动轨迹数据聚类方法研究的发展趋势进行了讨论。 展开更多
关键词 移动轨迹数据 数据挖掘 聚类方法 研究综述
下载PDF
膨胀土胀缩等级分类的未确知均值聚类方法及应用 被引量:42
12
作者 董陇军 李夕兵 宫凤强 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第5期1075-1080,共6页
将未确知测度理论应用于膨胀土的分类问题中,建立膨胀土胀缩等级分类的未确知均值聚类分析模型;选用粘粒含量、粉粒含量、液限、塑限及塑性指数作为未确知均值聚类分析模型的判别指标;以膨胀土的15组实测数据建立各评判指标的未确知测... 将未确知测度理论应用于膨胀土的分类问题中,建立膨胀土胀缩等级分类的未确知均值聚类分析模型;选用粘粒含量、粉粒含量、液限、塑限及塑性指数作为未确知均值聚类分析模型的判别指标;以膨胀土的15组实测数据建立各评判指标的未确知测度函数,用各分类样本平均值表示分类中心;根据信息熵理论计算各评判指标的权重,用置信度识别准则进行评判;用建立的模型对15组实测数据逐一进行检验,正确率为100%。将建立的模型对待分类的8个样本进行测试,并与实测结果进行比较。研究结果表明:预测等级与实际结果较吻合,比较客观地反映了膨胀土分类的复杂状况。 展开更多
关键词 膨胀土 未确知均值聚类方法
下载PDF
基于复杂系统熵聚类方法的中药新药处方发现研究思路 被引量:418
13
作者 唐仕欢 陈建新 +1 位作者 杨洪军 王波 《世界科学技术-中医药现代化》 2009年第2期225-228,共4页
本文对中药新药处方发现模式及其问题进行了分析,在此基础上,提出中药新药处方发现的新工具-复杂系统熵聚类方法,并详细阐述应用此方法进行中药新药处方发现的研究思路。主要包括:建立病证方剂数据库;应用复杂系统熵聚类方法快速筛选出... 本文对中药新药处方发现模式及其问题进行了分析,在此基础上,提出中药新药处方发现的新工具-复杂系统熵聚类方法,并详细阐述应用此方法进行中药新药处方发现的研究思路。主要包括:建立病证方剂数据库;应用复杂系统熵聚类方法快速筛选出中药核心组合;对筛选出的中药核心组合进行专家判断,从而确立用于中药新药研发的候选处方。此方法的应用将为中药新药处方快速发现提供新的思路。 展开更多
关键词 中药新药 处方发现熵 复杂系统 聚类方法
下载PDF
投影寻踪聚类方法在煤与瓦斯突出危险性预测中的应用 被引量:10
14
作者 梁跃强 林辰 +2 位作者 宫伟东 郭晓洁 张毅鹏 《中国安全生产科学技术》 CAS CSCD 北大核心 2017年第1期46-50,共5页
为了提高煤与瓦斯突出预测的准确率,在研究矿井瓦斯地质特征基础上,建立煤与瓦斯突出预测指标体系,应用投影寻踪方法和聚类方法构建了煤与瓦斯突出危险性预测的投影寻踪聚类模型。该模型通过计算反映煤与瓦斯突出危险程度的一维投影特征... 为了提高煤与瓦斯突出预测的准确率,在研究矿井瓦斯地质特征基础上,建立煤与瓦斯突出预测指标体系,应用投影寻踪方法和聚类方法构建了煤与瓦斯突出危险性预测的投影寻踪聚类模型。该模型通过计算反映煤与瓦斯突出危险程度的一维投影特征值,并对其进行聚类分析,得出煤与瓦斯突出危险性等级。将模型应用于平煤八矿戊9,10-21030工作面回风巷,预测等级与实际煤与瓦斯突出情况吻合度较高。结果表明,应用投影寻踪聚类方法对平煤八矿进行煤与瓦斯突出危险性预测是可行的。 展开更多
关键词 投影寻踪 煤与瓦斯突出 突出预测 瓦斯地质 聚类方法
下载PDF
用灰色聚类方法预测边坡地震稳定性研究 被引量:23
15
作者 王余庆 高艳平 辛鸿博 《工业建筑》 CSCD 北大核心 2002年第6期44-47,共4页
边坡的地震稳定性受到边坡的岩土特性、地形地貌、地震地质 ,大气降雨等多种因素的影响 ,而且这些影响因素难以精确确定。将天然边坡看作是部分信息已知、部分信息未知的灰色系统 ,用灰色理论中的灰色聚类方法预测其地震的稳定性。通过... 边坡的地震稳定性受到边坡的岩土特性、地形地貌、地震地质 ,大气降雨等多种因素的影响 ,而且这些影响因素难以精确确定。将天然边坡看作是部分信息已知、部分信息未知的灰色系统 ,用灰色理论中的灰色聚类方法预测其地震的稳定性。通过将预测结果与边坡的实际震害作对比 。 展开更多
关键词 灰色聚类方法 预测 边坡 地震 稳定性
下载PDF
一种新的EST聚类方法 被引量:6
16
作者 张利达 袁德军 +2 位作者 张建伟 王石平 张启发 《Acta Genetica Sinica》 SCIE CAS CSCD 北大核心 2003年第2期147-153,共7页
该研究发展了一种EST(expressedsequencetag)聚类方法 (ESTClustering) ,用于分析大规模EST测序中所产生的大量数据 ,以获得高质量、非重复表达序列。该方法在聚类过程中采用MEGABLAST工具对一致序列进行序列同源比较 ,并用phrap程序对... 该研究发展了一种EST(expressedsequencetag)聚类方法 (ESTClustering) ,用于分析大规模EST测序中所产生的大量数据 ,以获得高质量、非重复表达序列。该方法在聚类过程中采用MEGABLAST工具对一致序列进行序列同源比较 ,并用phrap程序对每一EST簇进行拼接检验。这一聚类策略能降低测序错误带来的影响 ,有效识别基因家族成员 ,并避免选择性剪接的干扰。与NCBI(NationalCenterforBiotechnologyInformation)的UniGeneclustering方法相比 ,ESTClustering的聚类结果可以更好地反映表达序列的多样性。用ESTClustering对 112 2 5 6条拟南芥EST聚类测试 ,产生 2 35 81个EST簇 ,其中 135 97个EST簇有对应拟南芥基因组编码序列 ,与该基因组中有EST作为依据的预测基因数目接近。应用该方法对收集的 14 7191条水稻EST序列进行聚类 ,形成 33896个EST簇。 展开更多
关键词 EST聚类方法 一致序列 无冗余cDNA文库 基因测序
下载PDF
使用灰色聚类方法评估长江三峡水库湖北不同库段水库诱发地震的震级上限 被引量:5
17
作者 马文涛 徐锡伟 +3 位作者 于贵华 苑京立 徐长朋 蔺永 《地震地质》 EI CSCD 北大核心 2012年第4期726-738,共13页
利用150例水库诱发地震震例和532个国内大型水库资料,使用灰色聚类方法,按库深、库容、区域应力状态、断层活动性、岩性介质条件和地震活动背景等6个诱震因素,统计出相应的发震比例数,以此作为水库地震预测指标。再根据长江三峡水库坝... 利用150例水库诱发地震震例和532个国内大型水库资料,使用灰色聚类方法,按库深、库容、区域应力状态、断层活动性、岩性介质条件和地震活动背景等6个诱震因素,统计出相应的发震比例数,以此作为水库地震预测指标。再根据长江三峡水库坝址区、香溪河口及仙女山断裂带过江段、泄滩西和巴东及神龙溪两岸的6个独立的诱震因素,评估各段的水库诱发地震震级上限。计算结果表明长江三峡水库坝址区震级上限<3级,香溪河口及仙女山断裂带过江段4~5级,泄滩西<3级,巴东北岸及神龙溪两岸震级3~4级。并得到了长江三峡水库蓄水后实际地震情况的验证。 展开更多
关键词 灰色聚类方法 震级上限 评估 水库诱发地震 长江三峡水库
下载PDF
数量关联规则发现中的聚类方法研究 被引量:26
18
作者 苑森淼 程晓青 《计算机学报》 EI CSCD 北大核心 2000年第8期866-871,共6页
应用聚类方法研究了数量关联规则提取过程中的连续属性离散化问题 .由于现存的方法倾向于将支持度较高的区域划分为多个区间 ,对高偏数据效果不理想 .针对这一问题 ,提出聚类算法 PKCCA.与传统快速聚类不同 ,PKCCA在迭代过程中动态调整... 应用聚类方法研究了数量关联规则提取过程中的连续属性离散化问题 .由于现存的方法倾向于将支持度较高的区域划分为多个区间 ,对高偏数据效果不理想 .针对这一问题 ,提出聚类算法 PKCCA.与传统快速聚类不同 ,PKCCA在迭代过程中动态调整中心个数 ,避免造成过小支持度问题 。 展开更多
关键词 数据挖掘 数量关联规则 聚类方法 数据库
下载PDF
基于概念的教育资源元素材聚类方法研究 被引量:7
19
作者 陈磊 王云华 陈世鸿 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2005年第3期347-350,共4页
针对教育资源元素材种类多、独立性强等特点,研究了概念聚类方法解决领域知识的分类和归并问题,并实现了概念的动态聚类算法和归并算法,分析了该算法的效率和聚类准确性.
关键词 聚类方法 教育资源 素材 动态算法 领域知识 归并算法 独立性 准确性
下载PDF
一种运用图熵的医学图像聚类方法 被引量:4
20
作者 战宇 潘海为 +3 位作者 韩启龙 谢晓芹 张志强 吴枰 《小型微型计算机系统》 CSCD 北大核心 2016年第7期1594-1599,共6页
近些年,各种医学影像技术被广泛应用于临床诊断中.由于医院每天都会产生大量的医学图像,如何利用好这些医学图像,对其进行有效聚类,以此来辅助医生对疾病进行诊断,是当前医学图像数据挖掘领域所研究的热点问题之一.本文提出一种医学图... 近些年,各种医学影像技术被广泛应用于临床诊断中.由于医院每天都会产生大量的医学图像,如何利用好这些医学图像,对其进行有效聚类,以此来辅助医生对疾病进行诊断,是当前医学图像数据挖掘领域所研究的热点问题之一.本文提出一种医学图像聚类方法,首先,将医学图像集抽象成一个带权无向完全图,之后对其进行稀疏化剪枝处理,以此来对医学图像之间进行更好的相似性描述,最后,又提出了一种运用图熵的带权无向图聚类方法,通过此方法来实现对医学图像的聚类.实验结果表明,本文所提出的聚类方法能够有效对医学图像进行聚类,并在时间损耗及聚类结果等方面表现良好. 展开更多
关键词 图熵 医学图像 稀疏化剪枝 聚类方法
下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部