期刊文献+
共找到329篇文章
< 1 2 17 >
每页显示 20 50 100
New judging model of fuzzy cluster optimal dividing based on rough sets theory
1
作者 Wang Yun Liu Qinghong +1 位作者 Mu Yong Shi Kaiquan 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2007年第2期392-397,共6页
To investigate the judging problem of optimal dividing matrix among several fuzzy dividing matrices in fuzzy dividing space, correspondingly, which is determined by the various choices of cluster samples in the totali... To investigate the judging problem of optimal dividing matrix among several fuzzy dividing matrices in fuzzy dividing space, correspondingly, which is determined by the various choices of cluster samples in the totality sample space, two algorithms are proposed on the basis of the data analysis method in rough sets theory: information system discrete algorithm (algorithm 1) and samples representatives judging algorithm (algorithm 2). On the principle of the farthest distance, algorithm 1 transforms continuous data into discrete form which could be transacted by rough sets theory. Taking the approximate precision as a criterion, algorithm 2 chooses the sample space with a good representative. Hence, the clustering sample set in inducing and computing optimal dividing matrix can be achieved. Several theorems are proposed to provide strict theoretic foundations for the execution of the algorithm model. An applied example based on the new algorithm model is given, whose result verifies the feasibility of this new algorithm model. 展开更多
关键词 Rough sets theory Fuzzy optimal dividing matrix Representatives of samples Fuzzy cluster analysis Information system approximate precision.
下载PDF
Identify Implicit Communities by Graph Clustering
2
作者 YANG Nan MENG Xiaofeng 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1109-1113,共5页
How to find these communities is an important research work. Recently, community discovery are mainly categorized to HITS algorithm, bipartite cores algorithm and maximum flow/minimum cut framework. In this paper, we ... How to find these communities is an important research work. Recently, community discovery are mainly categorized to HITS algorithm, bipartite cores algorithm and maximum flow/minimum cut framework. In this paper, we proposed a new method to extract communities. The MCL algorithm, which is short for the Markov Cluster Algorithm, a fast and scalable unsupervised cluster algorithm is used to extract communities. By putting mirror deleting procedure behind graph clustering, we decrease comparing cost considerably. After MCL and mirror deletion, we use community member select algorithm to produce the sets of community candidates. The experiment and results show the new method works effectively and properly. 展开更多
关键词 Web community link analysis graph clustering MCL
下载PDF
管制员个体工作负荷多维量化研究
3
作者 王莉莉 顾秋丽 《中国安全科学学报》 CAS CSCD 北大核心 2024年第6期1-9,共9页
为提高空管系统高效运行,聚焦管制员个体工作负荷建立量化模型;首先设计试验采集一线16名区域管制员的岗前与岗后各项指标数据,根据测试数据变化,选择出敏感变量,描述个体工作负荷;其次建立包含心理感知负荷、生理反应负荷与脑力工作负... 为提高空管系统高效运行,聚焦管制员个体工作负荷建立量化模型;首先设计试验采集一线16名区域管制员的岗前与岗后各项指标数据,根据测试数据变化,选择出敏感变量,描述个体工作负荷;其次建立包含心理感知负荷、生理反应负荷与脑力工作负荷3个维度的综合评估指标体系,构建管制员个体工作负荷指数模型;然后通过熵权-客观组合法求解个体工作负荷指数最优权重,最终得出管制员个体工作负荷量化模型;最后进一步根据管制员个体工作负荷综合指数进行K-Means聚类分析,结果表明:管制员因个体不同岗后工作负荷存在差异。依据个体工作负荷指数大小,管制员可分为3类,A类管制员数量占总人数50%,岗后个体工作负荷增长最小;B类管制员数量占总人数43.75%,岗后负荷增长居中;C类管制员数量占总人数6.25%,岗后负荷增长最大,与教员对管制员能力的评分结果一致。 展开更多
关键词 空中交通管制员 个体工作负荷 配对样本T检验 熵权-客观组合法 K-MEANS聚类
下载PDF
基于空间插值的不规则海洋地质样品测试分析数据聚类算法研究
4
作者 邵长高 严镔 陈秋 《热带海洋学报》 CAS CSCD 北大核心 2024年第2期166-172,共7页
海洋地质调查中获取大量海洋沉积物柱状样样品测试分析数据,样品测试分析目的不同导致柱状样数据采样深度不同,由此造成地质取样数据在三维空间上呈现不规则散点状分布。传统聚类算法无法在三维空间上对此类不规则散点数据进行聚类分析... 海洋地质调查中获取大量海洋沉积物柱状样样品测试分析数据,样品测试分析目的不同导致柱状样数据采样深度不同,由此造成地质取样数据在三维空间上呈现不规则散点状分布。传统聚类算法无法在三维空间上对此类不规则散点数据进行聚类分析。对此,文章设计了一种基于空间插值的不规则地质样品测试分析数据聚类算法,有效地将三维样品测试分析散点数据降为二维数据后进行聚类分析,本算法较好地解决了地质体中试验测试数据的不均衡性问题,为海洋地质大数据分析提供了基础技术方法。 展开更多
关键词 地质取样 实验测试 聚类算法 空间插值 三维
下载PDF
超高效液相色谱-多元统计分析法评价蜂胶提取物质量
5
作者 章越 姜慧洁 +1 位作者 慎凯峰 周丹英 《食品安全质量检测学报》 CAS 2024年第14期224-233,共10页
目的建立超高效液相色谱法(ultra performance liquid chromatography,UPLC)快速测定蜂胶提取物中的14种化学成分,结合多元统计分析方法对不同厂家的蜂胶提取物质量进行综合评价。方法收集来自不同厂家的17批蜂胶提取物样品,采用UPLC采... 目的建立超高效液相色谱法(ultra performance liquid chromatography,UPLC)快速测定蜂胶提取物中的14种化学成分,结合多元统计分析方法对不同厂家的蜂胶提取物质量进行综合评价。方法收集来自不同厂家的17批蜂胶提取物样品,采用UPLC采集色谱图,甲醇-0.2%磷酸水溶液为流动相,梯度洗脱,同时测定咖啡酸、p-香豆酸、阿魏酸、异阿魏酸、3,4-二甲氧基肉桂酸、咖啡酸苯乙酯、阿替匹林C、槲皮素、山奈素、芹菜素、异鼠李素、乔松素、白杨素、高良姜素的含量,运用统计学软件进行主成分分析(principal component analysis,PCA)、聚类分析(clustering analysis,CA)、偏最小二乘-判别分析(partial least squares-discriminant analysis,PLS-DA),筛选分析质量差异标志物。通过熵权法计算各指标权重,将结果应用于优劣解距离法(technique for order preference by similarity to ideal solution,TOPSIS)和秩和比法(rank sum ratio,RSR)构建综合评价模型,评价不同批次的蜂胶提取物质量优劣。结果14个指标成分在各自的浓度范围内线性关系良好(r≥0.9992),平均加样回收率是96.37%~102.21%,相对标准偏差小于2%。化学计量学结果表明17批样品聚为4类,同一个厂家的样品聚为一类,不同厂家的样品存在明显差异,3,4-二甲氧基肉桂酸、异阿魏酸、槲皮素、高良姜素、阿替匹林C、咖啡酸苯乙酯可能是影响厂家质量差异的潜在标志物。通过熵权-TOPSIS、熵权-RSR以及两者相结合的方式构建的综合质量评价模型,对不同批次蜂胶提取物的质量优劣排序结果较为一致。结论基于UPLC的多指标测定方法准确便捷,结合PCA、CA、PLS-DA和TOPSIS-RSR建立的评价模式能够有效分析不同厂家的差异性,为蜂胶提取物的整体质量评价提供参考。 展开更多
关键词 蜂胶提取物 超高效液相色谱法 主成分分析 聚类分析 偏最小二乘分析-判别分析 优劣解距离法-秩和比法
下载PDF
义昌江流域水质水量演变规律分析
6
作者 朱颖洁 刘钊琳 +1 位作者 左悦 张立杰 《浙江水利水电学院学报》 2024年第4期29-35,共7页
研究义昌江流域降水量、径流量和水质指标演变规律,可为流域水资源开发利用、水环境保护和水生态改善提供数据支撑。运用线性趋势回归检验法研究其变化趋势,采用有序聚类分析法对其进行突变分析;分析水质指标时空变化,并进行水质评价;基... 研究义昌江流域降水量、径流量和水质指标演变规律,可为流域水资源开发利用、水环境保护和水生态改善提供数据支撑。运用线性趋势回归检验法研究其变化趋势,采用有序聚类分析法对其进行突变分析;分析水质指标时空变化,并进行水质评价;基于Pearson相关分析和双累积曲线法,研究义昌江流域水质变化的原因。结果表明:降水量、径流量、溶解氧、高锰酸盐指数、氨氮、粪大肠菌群变化趋势不明显。一般情况下,下游大冲口断面水质比上游断面好;从季节变化来看,冬季水质大部分合格、水质较好;从年变化来看,水质变化波动;径流对溶解氧、氨氮的影响比降水和水温更大,水温对高锰酸盐指数、粪大肠菌群的影响比降水和径流更大;水质指标变化受自然因素和人类活动共同影响。 展开更多
关键词 水质水量变化 线性趋势回归检验 有序聚类分析 Pearson相关分析
下载PDF
大数据背景下两阶段Leverage重要性抽样方法研究
7
作者 贺建风 何韩吉 《统计研究》 CSSCI 北大核心 2024年第10期149-160,共12页
大数据背景下,需要对传统的抽样调查技术进行改进,以应对数据结构变化。以杠杆得分为入样概率的Leverage重要性抽样能够增加高杠杆值样本点被抽中的概率,但也增加了异常值选入抽样子集的风险,使得抽样估计偏离真实值。为降低大数据异常... 大数据背景下,需要对传统的抽样调查技术进行改进,以应对数据结构变化。以杠杆得分为入样概率的Leverage重要性抽样能够增加高杠杆值样本点被抽中的概率,但也增加了异常值选入抽样子集的风险,使得抽样估计偏离真实值。为降低大数据异常值影响,提高大数据抽样子集估计的稳健性,本文提出基于阈值自选择的两阶段Leverage重要性抽样方法。该方法第一阶段以样本距离的有序聚类识别稳健子集,使得用于二阶段抽样的样本更具代表性,第二阶段则是在稳健子集的基础上获得稳健抽样估计。模拟分析结果表明,本文所提方法能够提升线性回归系数估计的精度,在漂移型、波动型和混合型离群值中均适用。实证分析中本文所提方法在三个案例数据中拥有较小的预测值均方误差,有效降低了异常值的影响。 展开更多
关键词 大规模数据 线性模型 有序聚类 Leverage重要性抽样
下载PDF
一种基于高阶函数摘要的依赖簇检测方法
8
作者 杨嘉毅 张迎周 +3 位作者 李俊锋 马锐 汪全盛 薛渝川 《电子学报》 EI CAS CSCD 北大核心 2024年第4期1337-1348,共12页
依赖簇是相互依赖的程序组件的最大集合,依赖簇中任意一点产生变动都会引起其他组件的连锁反应.在实际生产环境中,依赖簇检测对于软件理解、测试、维护具有非常重要的意义.传统的依赖簇检测方法基于系统依赖图(System Dependence Graph,... 依赖簇是相互依赖的程序组件的最大集合,依赖簇中任意一点产生变动都会引起其他组件的连锁反应.在实际生产环境中,依赖簇检测对于软件理解、测试、维护具有非常重要的意义.传统的依赖簇检测方法基于系统依赖图(System Dependence Graph,SDG)实现过程间依赖关系的计算.但是SDG的构建过程比较复杂,时间空间的占用比较大.为提高依赖簇检测的效率并减少空间占用,本文提出了一种有效的轻量级依赖簇检测方法.该方法通过构建每个过程高阶函数形式的函数摘要,将形参和全局变量的数据依赖作为摘要参数,并用函数摘要的参数初始化过程内依赖信息.通过在调用点处对高阶函数形式的摘要进行实例化,即可将调用过程的依赖关系通过摘要参数进行传递,从而获取过程间的依赖信息.为了进一步提升检测效率,我们还提出了基于自适应计算的依赖簇检测优化策略,该策略可以减少因函数的递归调用产生的相关冗余计算.本文选取了不同规模不同领域的工程项目和基准测试集进行相关对比实验,结果表明:基于高阶函数的依赖簇检测方法相比系统依赖图的检测方法,能够提升2.689倍的分析效率并减少35.7%的空间占用;基于自适应计算的依赖簇检测优化策略在高阶函数方法的基础上能够减少56.7%的冗余计算,提升23.9%的分析效率. 展开更多
关键词 依赖簇 高阶函数 自适应计算 系统依赖图 形式概念分析
下载PDF
基于有序聚类分析的武夷山国家公园森林旅游景观类型划分
9
作者 陈琦梅 朱玉洁 翁羽西 《西南林业大学学报(社会科学)》 2024年第5期83-89,126,共8页
依托武夷山国家公园森林景观资源的连贯性和完整性,采用Fisher有序聚类法,结合现场访谈信息数据,提取旅游景观观测因子并对观测因子进行编号建立空间矩阵,寻找最优分割聚类后确定各个景观段落的主题。结果表明,武夷山国家公园森林旅游... 依托武夷山国家公园森林景观资源的连贯性和完整性,采用Fisher有序聚类法,结合现场访谈信息数据,提取旅游景观观测因子并对观测因子进行编号建立空间矩阵,寻找最优分割聚类后确定各个景观段落的主题。结果表明,武夷山国家公园森林旅游景观可划分为8个单元段,即坡地草坪景观段、山谷阔叶林景观段、山谷针阔混交林景观段、山脊阔叶林景观段、坡地针阔混交林景观段、山谷茶田景观段、阔叶林溪流景观段和岩石溪流游景观段。 展开更多
关键词 步道 景观 有序样本聚类 规划 可持续发展 国家公园
下载PDF
中国省域科技创新水平评价
10
作者 李国柱 黄琪骏 《河北地质大学学报》 2024年第1期99-104,共6页
科技创新在经济快速发展的新时代占有重要地位,研究分析了全国各地区科技创新发展情况,并针对结果提出了有效建议,具有现实意义。基于相关数据,利用主成分分析与有序聚类分析,得出如下结论:(1)原本8个指标变量经过降维处理后,可提取2个... 科技创新在经济快速发展的新时代占有重要地位,研究分析了全国各地区科技创新发展情况,并针对结果提出了有效建议,具有现实意义。基于相关数据,利用主成分分析与有序聚类分析,得出如下结论:(1)原本8个指标变量经过降维处理后,可提取2个主成分,进而根据计算出的主成分综合得分,可以对全国31个省市科技创新发展情况进行排名;(2)对降序后的排名进行有序聚类分析,发现聚类数目为4类,每一类分别代表不同科技创新发展水平的地区。 展开更多
关键词 科技创新 主成分分析 有序聚类
下载PDF
有序聚类分析在云南下奥陶统汤池组分解中的应用
11
作者 李江勇 杨钦淞 +2 位作者 李超 李瑞卿 曾宇 《云南地质》 2024年第2期170-177,共8页
有序聚类分析是一种对野外宏观岩石地层划分行之有效的补充和辅助研究方法。基于区域地质调查中获得的岩石光谱分析数据,采用有序样品多变量最优分割法,对云南寻甸槽房地区前人所划下奥陶统汤池组进行了化学地层划分应用研究,得到的地... 有序聚类分析是一种对野外宏观岩石地层划分行之有效的补充和辅助研究方法。基于区域地质调查中获得的岩石光谱分析数据,采用有序样品多变量最优分割法,对云南寻甸槽房地区前人所划下奥陶统汤池组进行了化学地层划分应用研究,得到的地球化学界面与野外岩石地层划分界面高度吻合,将其分解为寒武系苗岭统西王庙组至下石炭统万寿山组7个组级地层单位。 展开更多
关键词 云南寻甸地区 有序聚类分析 地层划分 多变量最优分割 地球化学界面
下载PDF
Feedback Between Influent Condition Heterogeneity and Diversity of Bacterial Community in Bioreactor at Low Substrate Concentration
12
作者 Hui Feng Wei Wang +3 位作者 Zhiwei Zhao Maoan Du Fuyi Cui Ruisha Shi 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2017年第6期60-66,共7页
In order to investigate the effect of influent condition heterogeneity on diversity of the bacterial community,the degree of microbial resolution and effluent quality,biological treatment of micro-polluted source wate... In order to investigate the effect of influent condition heterogeneity on diversity of the bacterial community,the degree of microbial resolution and effluent quality,biological treatment of micro-polluted source water is proposed. Scanning Electron Microscopy( SEM) analysis reflects that influent conditions change the morphologies of biofilm. Denaturing Gradient Gel Electrophoresis( DGGE) analysis shows differences of H values are due to succession of functional bacterial communities. Microbial resolution values and species identifications reveal organic carbon is the main cause of community differentiation and bacterial migration. 展开更多
关键词 BACTERIAL community DIVERSITY BIOREACTOR cluster analysis INFLUENT HETEROGENEITY shannon index
下载PDF
面向流形数据的共享近邻密度峰值聚类算法 被引量:2
13
作者 赵嘉 马清 +2 位作者 肖人彬 潘正祥 韩龙哲 《智能系统学报》 CSCD 北大核心 2023年第4期719-730,共12页
流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(dens... 流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearest neighbor for manifold datasets,DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式,使得同一流形类簇样本间的相似度尽可能高;基于上述相似度定义局部密度,不忽略距类簇中心较远样本的密度贡献,能更好地区分出流形类簇的类簇中心与其他样本;根据样本的相似度分配剩余样本,避免了样本的连续误分配。DPC-SNN算法与DPC、FKNNDPC、FNDPC、DPCSA及IDPC-FA算法的对比实验结果表明,DPC-SNN算法能够有效发现流形数据的类簇中心并准确完成聚类,对真实以及人脸数据集也有不错的聚类效果。 展开更多
关键词 密度峰值 聚类分析 流形数据 K近邻 共享近邻 样本相似度 数据挖掘 图像处理
下载PDF
信控交叉口行人过街冲突严重程度评价模型
14
作者 张文会 徐海彬 +1 位作者 周舸 温文 《交通运输系统工程与信息》 EI CSCD 北大核心 2023年第6期90-99,共10页
为探究城市信号交叉口影响人车冲突严重程度的关键因素,提升交叉口安全管理水平,本文选取典型的城市道路信号交叉口,采用无人机航拍获取交通流视频,基于人工观测和Tracker软件解析处理得到冲突点信息参数与位置分布特征。为量化冲突程度... 为探究城市信号交叉口影响人车冲突严重程度的关键因素,提升交叉口安全管理水平,本文选取典型的城市道路信号交叉口,采用无人机航拍获取交通流视频,基于人工观测和Tracker软件解析处理得到冲突点信息参数与位置分布特征。为量化冲突程度,采用后侵入时间、冲突区域车速、潜在碰撞距离作为人车冲突严重程度评价指标,利用K-means聚类算法将过街冲突按严重程度迭代分类,确定人、车、路三方面下的21个解释变量。通过Pearson相关性分析筛选,建立多元有序Logistic模型,并通过ROC(Receiver Operating Characteristic)曲线验证得到模型对冲突严重级别的估计分类概率结果AUC(Area Under Curve)为0.971。结果表明:行人与冲突点的距离(0.364)、车辆在冲突点前的趋向(停车让行为-4.22,减速让行为-0.937)、行人是否闯红灯行为(0.818)、机动车道数量(0.29)、行人等待红灯时间长短(0.012)、行人年龄段(-0.869)、行人着装颜色(0.673)是影响人车冲突严重程度的显著因素。本文研究结果能够为行人过街安全的交通策略制定提供一定参考价值。 展开更多
关键词 城市交通 人车冲突 多元有序Logistic模型 冲突严重程度 聚类分析
下载PDF
基于车载激光雷达数据的多种道路要素自动提取分类
15
作者 李冠 孟祥武 《北京测绘》 2023年第7期969-974,共6页
基于车载点云数据开展道路要素的自动提取与分类是三维激光扫描技术服务于城市运维活动的一项重要应用。基于现阶段的行业研究情况,本文首先开展了针对不同类型道路要素对象进行方法及算法汇总,然后基于应用实例开展了车载激光雷达(LiD... 基于车载点云数据开展道路要素的自动提取与分类是三维激光扫描技术服务于城市运维活动的一项重要应用。基于现阶段的行业研究情况,本文首先开展了针对不同类型道路要素对象进行方法及算法汇总,然后基于应用实例开展了车载激光雷达(LiDAR)点云用于道路结构、路面标识以及道路区域杆状地物等主要道路要素的自动提取与分类的应用,对其实用性和准确性进行了评价。 展开更多
关键词 车载激光雷达点云 道路要素 自动提取与分类 局部特征约束 聚类分析 语义分割 样本训练
下载PDF
基于分子晶体序参数与K-means聚类的TNT晶型转化有限温度弦研究 被引量:1
16
作者 常玲玲 任福德 +6 位作者 刘英哲 葛忠学 王晓磊 邱丽莉 孟子晖 王艳红 曹端林 《火炸药学报》 EI CAS CSCD 北大核心 2023年第6期545-552,I0004,共9页
为揭示炸药转晶稀有事件的分子机制,分别构建了基于键距离(即分子间距离)与键取向和分子取向的两类序参数,借助基于Euclidean距离和密度权重的K-means聚类算法进行了序参数的增强采样。结果表明,基于分子晶体序参数与K-means聚类的增强... 为揭示炸药转晶稀有事件的分子机制,分别构建了基于键距离(即分子间距离)与键取向和分子取向的两类序参数,借助基于Euclidean距离和密度权重的K-means聚类算法进行了序参数的增强采样。结果表明,基于分子晶体序参数与K-means聚类的增强采样改进了稀有事件常规有限温度弦方法,使自由能快速收敛。将该方法用于TNT晶型转化的研究,避免了分子晶体序参数“维数爆炸”,获得了平均力势面,验证了基于分子晶体序参数与K-means聚类有限温度弦方法在炸药晶型转化研究中的有效性,探明了TNT(O)与TNT(M)之间界面诱导、局部引发、多核非同步生长的晶型转变过程。 展开更多
关键词 物理化学 晶型转化 有限温度弦 K-means聚类采样 分子晶体序参数 TNT
下载PDF
经典名方一贯煎红外指纹图谱研究 被引量:1
17
作者 贾豪 张维方 +6 位作者 雷敬卫 李莹莹 杨春静 谢彩侠 龚海燕 丁心雨 姚天意 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第10期3202-3210,共9页
经典名方一贯煎由生地黄、北沙参、麦冬、当归、枸杞子、川楝子6味药组成,具有滋养肝肾、疏肝理气之效。红外光谱技术具有快速无损的优点,可完整的将不同批次一贯煎基准样品的信息表达。运用傅里叶变换红外光谱仪采集样品的红外光谱,对... 经典名方一贯煎由生地黄、北沙参、麦冬、当归、枸杞子、川楝子6味药组成,具有滋养肝肾、疏肝理气之效。红外光谱技术具有快速无损的优点,可完整的将不同批次一贯煎基准样品的信息表达。运用傅里叶变换红外光谱仪采集样品的红外光谱,对原始光谱进行预处理,得到相对峰高,对共有峰进行归属,采用聚类分析(HCA)、主成分分析(PCA)及正交偏最小二乘法-判别分析(OPLS-DA)对图谱数据进行评价。结果表明15批一贯煎基准样品中868、822和779 cm^(-1)波段为糖骨架伸缩振动吸收峰,多为枸杞所贡献,815 cm^(-1)波段处少数为麦冬所贡献;生地黄单煎液在1148 cm^(-1)波段处、沙参单煎液在1158、1082和1019 cm^(-1)波段处、当归单煎液在993 cm^(-1)波段处均有对糖苷类成分的贡献;川楝子单煎液1746 cm^(-1)波段处可溶性脂类糖苷成分吸收峰明显,一贯煎复方中此处吸收峰并不明显,可能为川楝子与其他五味药配伍煎煮过程中化学成分发生变化。HCA结果显示,当组间距离=10时,S1、S2、S15聚为一类,S9、S11、S12、S13、S14聚为一类,S3、S4、S5、S6、S7、S8、S10聚为一类,表明不同批次一贯煎汤剂内部质量存在一定差异。PCA分类结果与聚类分析结果基本一致,并计算不同批次的主成分综合得分,其中批次3一贯煎汤剂质量最佳,批次1质量最次,由载荷散点图分析得到1104、1142、1412、1260和868 cm^(-1)波段峰对主成分1的贡献率较大;777、2936、923、1721、818和637 cm^(-1)波段峰对主成分2的贡献较大。OPLS-DA结果与HCA和PCA结果一致,以VIP>1为标准,筛选出七个导致样品之间产生差异的波段,分别为777、637、923、2936、1260、1412和1630 cm^(-1),该结果与PCA载荷图中寻找的重要性权重变量基本一致。所建立的一贯煎红外指纹图谱方法简单、准确度高,可用于经典名方的快速鉴别分析,为经典名方一贯煎的质量控制与评价提供参考。 展开更多
关键词 经典名方 一贯煎 基准样品 指纹图谱 聚类分析 主成分分析 正交偏最小二乘法-判别分析
下载PDF
数据驱动的农作物遥感分类地面样本点布设 被引量:1
18
作者 吴清滢 余强毅 +1 位作者 段玉林 吴文斌 《农业工程学报》 EI CAS CSCD 北大核心 2023年第6期214-223,共10页
地面样本点是农作物遥感分类模型训练的基础,样本点数量和质量是影响模型分类精度的2个主要因素。该研究构建了数据驱动的样本点布设方法,利用待分类影像的光谱、植被指数等特征构造分层抽样底图,结合分层随机抽样方法进行地面样本点布... 地面样本点是农作物遥感分类模型训练的基础,样本点数量和质量是影响模型分类精度的2个主要因素。该研究构建了数据驱动的样本点布设方法,利用待分类影像的光谱、植被指数等特征构造分层抽样底图,结合分层随机抽样方法进行地面样本点布设,并分析不同抽样策略对农作物遥感分类结果的影响。采取基于k-means聚类分析的数据驱动方法,考虑6景哨兵2号影像提取的共78个分类特征,生成同一个最优k的聚类结果图;设计等量分配和按面积比分配2种样本量分配方式,样本点数量为25、49、100、169、225的5个总样本量;基于不同抽样策略获取地面样本点信息,利用同一个支持向量机模型对待分类影像进行监督分类,并通过与139个样本点的理论总样本量和400个样本点的传统方式总样本量对比分析,定量解析不同抽样策略对分类精度的影响。结果表明:1)在数据驱动非监督聚类生成的底图上进行抽样(按面积比分层抽样法、等量分层抽样法)获得的样本点质量和分类精度明显优于没有该底图的抽样策略(简单随机抽样法、系统抽样法);2)当总样本量低于理论总样本量时,等量分层抽样法能获取比按面积比分层抽样法更高的分类精度。例如,当理论样本量为139时,总样本量为25、49和100时等量分层抽样法的分类精度均值(75.5%、80.5%和86.0%)均明显高于按面积比分层抽样法的分类精度均值(48.4%、69.0%和83.0%),而当总样本量为169和225时,两种分层抽样的分类精度均值都在90.0%左右;3)当满足总体精度需求时,分层抽样法所需的实际总样本量小于理论样本量,可极大提高抽样效率。例如,等量分层抽样法的实际样本量为理论样本量的约70%便可满足85.0%的总体精度需求;当分类精度与人工选取方式分类精度相同时(97.5%),等量分层抽样法的实际样本量仅为传统方式样本量的约90%。研究结果印证了分类精度及稳定性随着总样本量的增加而增加这一普遍认识,但当总样本量超过一定值时,精度增长速度变慢。该方法可以获取类间均衡、类内多样化的样本集,为农作物遥感地面样本点布设、快速高效分类提供参考。 展开更多
关键词 农业 遥感 作物分类 样本点布设 抽样底图 聚类分析
下载PDF
合理进行多元分析——主成分分析 被引量:1
19
作者 胡纯严 胡良平 《四川精神卫生》 2023年第S01期48-54,共7页
本文目的是介绍与主成分分析有关的基本概念、计算方法、两个实例以及SAS实现。基本概念包括相关矩阵、特征值与特征向量、主成分变量、主成分表达式和主成分的性质;计算方法涉及特征值与特征向量的求法、主成分分析的计算原理以及系数... 本文目的是介绍与主成分分析有关的基本概念、计算方法、两个实例以及SAS实现。基本概念包括相关矩阵、特征值与特征向量、主成分变量、主成分表达式和主成分的性质;计算方法涉及特征值与特征向量的求法、主成分分析的计算原理以及系数估计和个数的确定;两个实例中的资料分别为“20例肝病患者的4项肝功能指标的测定结果”和“23种肿瘤类期刊的文献计量学指标的调查结果”;借助SAS对两个实例中的定量资料进行了主成分分析,并基于主成分的计算结果分别实现了样品聚类和样品排序,并对输出结果作出了解释。 展开更多
关键词 特征值 特征向量 主成分分析 样品聚类 样品排序
下载PDF
基于有序样本聚类的城市轨道交通站点差异化高峰时段识别方法 被引量:3
20
作者 苏月同 徐天捷 +1 位作者 蒲一超 许项东 《交通运输工程与信息学报》 2023年第2期123-140,共18页
识别城市轨道交通站点高峰时段,对合理分配站内管理资源、制定乘客限流和错峰出行方案,从而缓解线路站点的高峰拥挤现象等具有重要作用。在现有多数城市的实践和研究中,主要依据人工经验确定全网或单条线路固定长度的高峰时段,但随着城... 识别城市轨道交通站点高峰时段,对合理分配站内管理资源、制定乘客限流和错峰出行方案,从而缓解线路站点的高峰拥挤现象等具有重要作用。在现有多数城市的实践和研究中,主要依据人工经验确定全网或单条线路固定长度的高峰时段,但随着城市轨道网络规模和客流的增长,该方法难以体现不同站点和线路高峰时段的差异性,为车站开展精细化运营管理带来了挑战。针对城市轨道交通网络中的每个站点,本文基于以5 min为单元的进出站连续客流数据,提出了一种基于有序样本聚类的站点级差异化高峰时段识别方法。根据识别结果,进一步定义高峰时段时间窗最大客流、峰左(右)客流比和高峰时段长度三个指标,将网络中的站点高峰分为无高峰、微弱高峰、明显高峰三类。最后,以上海轨道交通18条运营线路5个工作日的客流数据为例,验证了方法的有效性。分析结果表明:①所提出方法可同时辨识出高峰时段的开始时刻和结束时刻,无须预先确定高峰时段长度,并且针对高峰时段的特点,使用定制化聚类参数,能够识别全网各站点差异化高峰时段;②同一条线路中站点距市中心越远,其进站早高峰时段开始越早,验证了辨识差异化高峰时段的必要性。 展开更多
关键词 城市轨道交通 进出站客流 高峰时段 差异化识别 有序样本聚类
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部