期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
数据要素集聚、财政支持与高技术产业绿色韧性
1
作者 张晓莉 段彩泉 《技术经济与管理研究》 北大核心 2024年第7期64-69,共6页
激活数据要素新价值是赋能高技术产业绿色韧性的重要通道。选取2013—2022年我国30个省级面板数据,实证分析数据要素集聚对高技术产业绿色韧性的作用机制。基准回归结果显示,数据要素集聚能显著提升高技术产业绿色韧性。门槛效应检验结... 激活数据要素新价值是赋能高技术产业绿色韧性的重要通道。选取2013—2022年我国30个省级面板数据,实证分析数据要素集聚对高技术产业绿色韧性的作用机制。基准回归结果显示,数据要素集聚能显著提升高技术产业绿色韧性。门槛效应检验结果表明,随着数据要素集聚度不断提高以及财政支持力度逐渐加大,数据要素集聚对高技术产业绿色韧性的促进作用呈现出边际递增的非线性特征。有鉴于此,从打造数据要素全链条循环体系、促进有为政府和有效市场紧密结合、积极完善区域间数字基础设施建设三方面提出相关政策建议,以增强高技术产业绿色韧性和发展硬实力。 展开更多
关键词 数据要素集聚 财政支持 高技术产业 绿色韧性
下载PDF
数据要素集聚赋能数字新质生产力研究
2
作者 梁文明 李娜 《统计与信息论坛》 北大核心 2024年第10期13-23,共11页
数字经济时代数据要素渗透于社会生产全过程,促使劳动者、劳动资料和劳动对象等生产力中诸多要素发生变革,成为赋能新质生产力发展的重要引擎。对此,基于2011-2021年中国278个城市的数据,测算数字新质生产力指标,并运用双重差分模型识... 数字经济时代数据要素渗透于社会生产全过程,促使劳动者、劳动资料和劳动对象等生产力中诸多要素发生变革,成为赋能新质生产力发展的重要引擎。对此,基于2011-2021年中国278个城市的数据,测算数字新质生产力指标,并运用双重差分模型识别国家大数据综合试验区建设的数据要素集聚对数字新质生产力的影响。研究结果表明:数据要素集聚显著地促进了数字新质生产力的发展。经过安慰剂检验、PSM-DID、内生性处理等一系列稳健性检验后,结论依然成立。机制分析表明,数据要素集聚通过驱动人力资本升级、提升技术创新水平和增强数字基础设施服务效能,赋能数字新质生产力发展。进一步分析发现,国家大数据综合试验区建设的数据要素集聚对数字新质生产力具有显著的正向空间溢出效应,且该效应在不同区域表现出一定的异质性。基于研究结论,建议持续推进国家大数据综合试验区建设,因地制宜进行定位和布局;同时,应完善人才培养机制、加强数据安全防护、创建区域技术创新联盟平台,以充分释放数字新质生产力。 展开更多
关键词 数据要素集聚 数字新质生产力 国家大数据综合试验区 空间溢出效应 双重差分模型
下载PDF
大数据综合试验区建设与产业链现代化——影响效应与作用机理
3
作者 越琳 《技术经济与管理研究》 北大核心 2024年第10期153-158,共6页
选取2000—2021年中国30个省级面板数据,利用多期DID方法(Time-varying DID),实证检验国家级大数据综合试验区设立对产业链现代化的影响效应、作用机理与重要条件。研究结果表明,国家级大数据综合试验区建设能够推动产业链现代化,从动... 选取2000—2021年中国30个省级面板数据,利用多期DID方法(Time-varying DID),实证检验国家级大数据综合试验区设立对产业链现代化的影响效应、作用机理与重要条件。研究结果表明,国家级大数据综合试验区建设能够推动产业链现代化,从动态效应来看,随着年份推移,试点政策对产业链现代化的促进效果逐渐增强。该结论在经过PSM-DID检验、缩尾处理等一系列稳健性检验后依然成立。机制分析表明,技术进步、产业结构升级和人力资本积累是国家级大数据综合试验区建设赋能产业链现代化的有效路径。核心结论为实现数据要素与产业链现代化深度融合的政策愿景提供了经验证据和决策参考。 展开更多
关键词 数据综合试验区 数据要素集聚 产业链现代化 试点政策
下载PDF
基于最小生成树的不平衡数据集聚类算法
4
作者 蓝欢玉 《信息与电脑》 2023年第14期120-122,共3页
采用传统不平衡数据集聚类算法直接对数据集编码树进行构建,而未对数据集密度特征进行提取,造成传统算法数据聚类效果差,因此提出了基于最小生成树的不平衡数据集聚类算法。先利用数据区域密度的敏感性,提取数据密度特征,再利用提取的... 采用传统不平衡数据集聚类算法直接对数据集编码树进行构建,而未对数据集密度特征进行提取,造成传统算法数据聚类效果差,因此提出了基于最小生成树的不平衡数据集聚类算法。先利用数据区域密度的敏感性,提取数据密度特征,再利用提取的数据集密度特征构建编码树,并计算不平衡聚类状态下的数据集,最后基于最小生成树实现不平衡数据集聚类。设计对比实验,实验结果表明该研究算法聚类效果最好,具有研究价值。 展开更多
关键词 最小生成树 不平衡数据 数据集聚 聚类算法
下载PDF
数据要素对商贸流通业的影响——基于人力资本的调节效应
5
作者 刘聪 《商业经济研究》 北大核心 2024年第10期23-26,共4页
本文基于2012-2021年我国30个省份商贸流通业的面板数据,运用调节效应模型和空间杜宾模型探究数据要素集聚对商贸流通业效率的影响和空间特征,并评估人力资本结构在其中发挥的调节作用。研究发现:数据要素集聚对商贸流通业效率有显著的... 本文基于2012-2021年我国30个省份商贸流通业的面板数据,运用调节效应模型和空间杜宾模型探究数据要素集聚对商贸流通业效率的影响和空间特征,并评估人力资本结构在其中发挥的调节作用。研究发现:数据要素集聚对商贸流通业效率有显著的积极影响,促进了商贸流通业的效率提升;异质性分析发现,数据要素集聚对东部地区商贸流通业效率具有更强的提升作用,且随着数据要素集聚水平的提高,其对商贸流通业效率的提升作用在渐趋强化;调节效应检验发现,人力资本结构高级化在数据要素集聚与商贸流通业效率之间发挥正向调节作用;空间效应检验发现,数据要素集聚能推动本省商贸流通业效率提升,同时还存在正向溢出效应,对邻近地区的商贸流通业效率也具有显著的正向促进作用。 展开更多
关键词 数据要素集聚 商贸流通业 效率提升 人力资本结构 空间杜宾模型
下载PDF
一种基于半监督的大规模数据集聚类算法 被引量:1
6
作者 申彦 宋顺林 朱玉全 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期372-382,共11页
待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚... 待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚类结果质量不高,并且也不稳定.对此,吸收半监督聚类的思想,提出了基于标记集的半监督一遍扫描K均值算法,该算法利用驻留主存的标记集指导聚类过程,使得聚类效率以及聚类结果的质量得到了进一步的提高.在人工生成数据集以及1998KDD数据集上验证了该算法的有效性. 展开更多
关键词 大规模数据集聚 半监督聚类 聚类数据压缩 数据挖掘 K均值聚类
下载PDF
聚集数据线性模型的参数估计问题
7
作者 滕树军 《天津商学院学报》 2002年第3期26-28,共3页
在X列降秩条件下给出Xβ的两种估计 ,并研究它们之间的关系 ,取消了一般情形下关于X列满秩的假设 .
关键词 集聚数据线性模型 参数估计 最佳线性无偏估计 广义逆 正投影阵 可估函数 满秩
下载PDF
“智”巢何以引凤:智慧城市建设对地区创业活跃度的影响 被引量:5
8
作者 谭伟杰 胡润哲 《经济与管理研究》 北大核心 2024年第1期75-93,共19页
智慧城市试点政策对培育新型智慧城市、发展平台经济以及促进城市创业活动的影响是值得关注的议题。本文以2012年以来分三批推行的智慧城市试点政策作为准自然实验,借助计算机编程技术(Python)爬取中国工商企业注册数据和北大法宝政策... 智慧城市试点政策对培育新型智慧城市、发展平台经济以及促进城市创业活动的影响是值得关注的议题。本文以2012年以来分三批推行的智慧城市试点政策作为准自然实验,借助计算机编程技术(Python)爬取中国工商企业注册数据和北大法宝政策数据库,基于simhash算法和jieba分词等对相关政策文本进行量化分析,并运用多期双重差分法评估试点政策对创业活跃度的影响及其内在作用机理。研究发现,智慧城市试点政策能够提高试点城市的创业活跃度。机制检验结果表明,智慧产业政策通过促进数据要素集聚提升城市创业活跃度,智慧政务和智慧民生政策通过优化营商环境促进了城市创业。异质性分析结果表明,试点政策的创业效应存在于大中型城市、高市场潜能、高数字经济发展水平和区位优势较好的城市;试点政策对低污染制造业和服务业的创业活跃度提升发挥效应,但同时也抑制了高污染制造业的创业活跃度。结合机器学习算法进行反事实检验,结果表明试点政策的创业效应具有阶段性特征,持续性创业效应需要进一步发挥与其他相关措施的协同作用。 展开更多
关键词 智慧城市 创业活跃度 营商环境 数据要素集聚 机器学习
下载PDF
FDI对我国产业集聚影响的实证分析 被引量:6
9
作者 邹滨 《漳州师范学院学报(哲学社会科学版)》 2011年第4期44-48,共5页
FDI对我国不同地区集聚度的影响应该是不同的,那么究竟存在怎样的差异?在分析检验我国省际FDI与产业集聚存在相互关系的同时,通过模型的构建和运用回归分析,并利用2000~2010年中国省际面板数据,检验结果证实了FDI对我国产业集聚的... FDI对我国不同地区集聚度的影响应该是不同的,那么究竟存在怎样的差异?在分析检验我国省际FDI与产业集聚存在相互关系的同时,通过模型的构建和运用回归分析,并利用2000~2010年中国省际面板数据,检验结果证实了FDI对我国产业集聚的影响存在较大的省际差异和地区差异。实证结果揭示了FDI作为促进产业集聚的重要因素,能够有效地发挥中间传导作用,促进产业的集聚。 展开更多
关键词 FDI 产业集聚:面板数据
下载PDF
基于改进式k-prototypes聚类的坏数据辨识与修正 被引量:5
10
作者 王孝慈 董树锋 +2 位作者 刘育权 王莉 李俊格 《电测与仪表》 北大核心 2022年第2期9-15,共7页
工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征... 工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征,削弱负荷坏数据对聚类结果的影响,使坏数据辨识和修复结果更准确。改进式k-prototypes算法通过随机初始化,并行计算择优,克服了标准k-prototypes容易随初始聚类中心陷入局部最优解的缺陷;并通过聚类数量的自适应处理,解决了主观决定聚类数量的问题。基于聚类结果,根据正态分布原则确定负荷数据可行域,识别坏数据,并利用类中心置换法进行修正。实验表明,该方法较只考虑负荷数据的模糊均值聚类法效果更好,坏数据识别的召回率与修正的准确率显著提高。 展开更多
关键词 k-prototypes聚类 混合数据集聚 数据辨识 类中心置换修正法 工业负荷预处理
下载PDF
数据要素集聚、科技创新与数字新质生产力
11
作者 褚希伟 王婧卜 《商业研究》 2024年第5期1-9,共9页
基于中国2013—2022年30个省份面板数据,借助双向固定效应模型、中介效应模型,实证考察数据要素集聚对数字新质生产力的影响效应,以及科技创新在二者间发挥的作用机制。研究结果表明:数据要素集聚能够有效促进数字新质生产力提升;中介... 基于中国2013—2022年30个省份面板数据,借助双向固定效应模型、中介效应模型,实证考察数据要素集聚对数字新质生产力的影响效应,以及科技创新在二者间发挥的作用机制。研究结果表明:数据要素集聚能够有效促进数字新质生产力提升;中介效应检验结果表明,科技创新在数据要素集聚驱动数字新质生产力过程中发挥中介效应;异质性检验发现,相较于数字经济发展水平低组和市场化程度低组,数据要素集聚对数字新质生产力的促进作用在数字经济发展水平高组和市场化程度高组更显著。据此,应健全数据要素发展体系、完善科技创新体制机制、因地制宜制定数据要素配置方案,提升数字新质生产力发展水平。 展开更多
关键词 数据要素集聚 数字新质生产力 科技创新 中介效应模型
下载PDF
数据要素集聚对科技创新的影响研究——基于大数据综合试验区的准自然实验 被引量:20
12
作者 刘传明 陈梁 魏晓敏 《上海财经大学学报(哲学社会科学版)》 北大核心 2023年第5期107-121,共15页
数据要素高效集聚对于改善数据要素的配置效率,提升科技创新水平具有重要意义。文章以大数据综合试验区建设为研究对象,从劳动力资源配置、研发投入和人力资本三方面剖析数据要素集聚对科技创新的影响机理并进行实证检验。结果显示,数... 数据要素高效集聚对于改善数据要素的配置效率,提升科技创新水平具有重要意义。文章以大数据综合试验区建设为研究对象,从劳动力资源配置、研发投入和人力资本三方面剖析数据要素集聚对科技创新的影响机理并进行实证检验。结果显示,数据要素集聚显著提高了试点地区科技创新水平,且促进作用主要体现在数字基础设施、市场化程度、数字经济发展水平较高的样本组。数据要素集聚通过缓解劳动资源错配、提升研发投入水平和人力资本水平等路径对科技创新产生正向影响。进一步研究发现,数据要素集聚具有显著的空间溢出效应,大数据综合试验区的数据要素集聚存在向邻近地区正向溢出的现象,从而提升了周边地区科技创新水平。因此,为了构筑国家竞争新优势,应积极推动大数据综合试验区梯度式扩容,推进数据要素开放与大数据融合应用,以更好地释放数据要素集聚的红利。 展开更多
关键词 数据综合实验区 数据要素集聚 科技创新 双重差分法
原文传递
中国城际社交关系网络特征分析 被引量:10
13
作者 李清泉 常晓猛 +3 位作者 萧世伦 鄢科 乐阳 陈碧宇 《深圳大学学报(理工版)》 EI CAS 北大核心 2013年第5期441-449,共9页
基于中国大型社交网络人际社交关系,以新浪微博为例,构建中国城际地理社交关系网络,提出以城市社交通量指数、城际社交通量指数和城市社交集聚指数为主要评价指标,借此评价城市社交活跃度与影响力、城际社交强度以及城市社交偏好性,分... 基于中国大型社交网络人际社交关系,以新浪微博为例,构建中国城际地理社交关系网络,提出以城市社交通量指数、城际社交通量指数和城市社交集聚指数为主要评价指标,借此评价城市社交活跃度与影响力、城际社交强度以及城市社交偏好性,分析中国城市社交网络的拓扑特征.研究显示,中国城际社交网络具有明显的全局异构性和局部异构性,在地理空间分布上呈现空间分异现象.城市的社交通量与集聚指数呈较强的正相关,深刻影响中国社会文明进程的一二线城市属于社交寡占型城市,与外界交流相比中小城市社交偏好更为集聚.该研究可为探讨线上网络空间与线下现实空间的映射关系,揭示社交网络信息流的地理空间传播路径、预测网络热点事件时空演化趋势及时空影响范围提供理论依据. 展开更多
关键词 中国城际地理网络 社交网络 新浪微博 社交通量 空间分异 局部异构性 集聚数据 社交时空延伸
下载PDF
分块自适应加权改进大规模概率模糊聚类 被引量:2
14
作者 景慎艳 刘松迪 《火力与指挥控制》 CSCD 北大核心 2021年第12期88-93,共6页
为解决传统基于贝叶斯理论的概率模糊聚类(BayesianFuzzyClustering,BFC)算法在处理大规模数据集聚类时的时间开销和存储代价瓶颈,提出基于数据分块的单程自适应加权BFC算法,算法在大规模数据集分块的基础上,设计了基于数据加权的改进BF... 为解决传统基于贝叶斯理论的概率模糊聚类(BayesianFuzzyClustering,BFC)算法在处理大规模数据集聚类时的时间开销和存储代价瓶颈,提出基于数据分块的单程自适应加权BFC算法,算法在大规模数据集分块的基础上,设计了基于数据加权的改进BFC算法,用于数据分块内数据聚类,以挑选出对聚类贡献最具代表的标识数据及其自适应权值,在块间迭代聚类过程中,将标识数据及其权值合并到下一数据块中并参与聚类,从而将上一数据块的聚类信息有效地传递到下一数据块中,最后分析算法的收敛性和时间复杂度。实验结果表明,算法在继承传统BFC算法良好聚类性能基础上,减少计算复杂度,有效提高聚类效率,适用于大规模数据集聚类。 展开更多
关键词 大规模数据集聚 数据分块 加权概率模糊聚类 自适应数据加权 聚类信息传递
下载PDF
Min-wise hash function-based sampling over distributed data streams
15
作者 崇志宏 倪巍伟 +2 位作者 徐立臻 吕建华 谢英豪 《Journal of Southeast University(English Edition)》 EI CAS 2009年第4期456-459,共4页
In order to avoid the redundant and inconsistent information in distributed data streams, a sampling method based on min-wise hash functions is designed and the practical semantics of the union of distributed data str... In order to avoid the redundant and inconsistent information in distributed data streams, a sampling method based on min-wise hash functions is designed and the practical semantics of the union of distributed data streams is defined. First, for each family of min-wise hash functions, the data with the minimum hash value are selected as local samples and the biased effect caused by frequent updates in a single data stream is filtered out. Secondly, for the same hash function, the sample with the minimum hash value is selected as the global sample and the local samples are combined at the center node to filter out the biased effect of duplicated updates. Finally, based on the obtained uniform samples, several aggregations on the defined semantics of the union of data streams are precisely estimated. The results of comparison tests on synthetic and real-life data streams demonstrate the effectiveness of this method. 展开更多
关键词 data streams AGGREGATION rain-wise hashing
下载PDF
未确知聚类在专利质量评价中的应用 被引量:6
16
作者 张妮妮 孙胜娟 张永健 《现代电子技术》 北大核心 2020年第8期143-146,共4页
随着人们对知识产权的重视,作为其重要表征的专利的数量呈现爆发式增长,然而专利的质量却没有随之增长。大量的低质量专利不但作用有限,反而会造成社会资源浪费和遏制创新。对于专利质量的评价,目前还没有统一的标准。文中首先对国内外... 随着人们对知识产权的重视,作为其重要表征的专利的数量呈现爆发式增长,然而专利的质量却没有随之增长。大量的低质量专利不但作用有限,反而会造成社会资源浪费和遏制创新。对于专利质量的评价,目前还没有统一的标准。文中首先对国内外的专利质量指标进行分析,选取出对专利质量影响较大的指标,构建专利质量评价指标模型。同时,以钢铁行业相关专利为目标数据集,分别采用未确知聚类和模糊均值聚类算法对目标专利质量进行分析评价。最终,将目标专利数据聚类出不同的级别,得出高质量专利。在聚类过程中,发现未确知聚类算法在效率和准确率上都有良好的表现。 展开更多
关键词 专利质量评价 未确知聚类 专利数据分析 评价模型构建 数据集聚 对比实验
下载PDF
A new clustering algorithm for large datasets 被引量:1
17
作者 李清峰 彭文峰 《Journal of Central South University》 SCIE EI CAS 2011年第3期823-829,共7页
The Circle algorithm was proposed for large datasets.The idea of the algorithm is to find a set of vertices that are close to each other and far from other vertices.This algorithm makes use of the connection between c... The Circle algorithm was proposed for large datasets.The idea of the algorithm is to find a set of vertices that are close to each other and far from other vertices.This algorithm makes use of the connection between clustering aggregation and the problem of correlation clustering.The best deterministic approximation algorithm was provided for the variation of the correlation of clustering problem,and showed how sampling can be used to scale the algorithms for large datasets.An extensive empirical evaluation was given for the usefulness of the problem and the solutions.The results show that this method achieves more than 50% reduction in the running time without sacrificing the quality of the clustering. 展开更多
关键词 data mining Circle algorithm clustering categorical data clustering aggregation
下载PDF
Multiple k-hop clusters based routing scheme to preserve source-location privacy in WSNs 被引量:3
18
作者 任炬 张尧学 刘康 《Journal of Central South University》 SCIE EI CAS 2014年第8期3155-3168,共14页
Privacy is becoming one of the most notable challenges threatening wireless sensor networks(WSNs).Adversaries may use RF(radio frequency) localization techniques to perform hop-by-hop trace back to the source sensor&#... Privacy is becoming one of the most notable challenges threatening wireless sensor networks(WSNs).Adversaries may use RF(radio frequency) localization techniques to perform hop-by-hop trace back to the source sensor's location.A multiple k-hop clusters based routing strategy(MHCR) is proposed to preserve source-location privacy as well as enhance energy efficiency for WSNs.Owing to the inherent characteristics of intra-cluster data aggregation,each sensor of the interference clusters is able to act as a fake source to confuse the adversary.Moreover,dummy traffic could be filtered efficiently by the cluster heads during the data aggregation,ensuring no energy consumption be burdened in the hotspot of the network.Through careful analysis and calculation on the distribution and the number of interference clusters,energy efficiency is significantly enhanced without reducing the network lifetime.Finally,the security and delay performance of MHCR scheme are theoretically analyzed.Extensive analysis and simulation results demonstrate that MHCR scheme can improve both the location privacy security and energy efficiency markedly,especially in large-scale WSNs. 展开更多
关键词 wireless sensor networks source-location privacy energy efficiency k-hop cluster circular routing
下载PDF
Linear manifold clustering for high dimensional data based on line manifold searching and fusing 被引量:1
19
作者 黎刚果 王正志 +2 位作者 王晓敏 倪青山 强波 《Journal of Central South University》 SCIE EI CAS 2010年第5期1058-1069,共12页
High dimensional data clustering,with the inherent sparsity of data and the existence of noise,is a serious challenge for clustering algorithms.A new linear manifold clustering method was proposed to address this prob... High dimensional data clustering,with the inherent sparsity of data and the existence of noise,is a serious challenge for clustering algorithms.A new linear manifold clustering method was proposed to address this problem.The basic idea was to search the line manifold clusters hidden in datasets,and then fuse some of the line manifold clusters to construct higher dimensional manifold clusters.The orthogonal distance and the tangent distance were considered together as the linear manifold distance metrics. Spatial neighbor information was fully utilized to construct the original line manifold and optimize line manifolds during the line manifold cluster searching procedure.The results obtained from experiments over real and synthetic data sets demonstrate the superiority of the proposed method over some competing clustering methods in terms of accuracy and computation time.The proposed method is able to obtain high clustering accuracy for various data sets with different sizes,manifold dimensions and noise ratios,which confirms the anti-noise capability and high clustering accuracy of the proposed method for high dimensional data. 展开更多
关键词 linear manifold subspace clustering line manifold data mining data fusing clustering algorithm
下载PDF
A FUZZY CLOPE ALGORITHM AND ITS OPTIMAL PARAMETER CHOICE 被引量:1
20
作者 Li Jie Gao Xinbo Jiao Licheng 《Journal of Electronics(China)》 2006年第3期384-388,共5页
Among the available clustering algorithms in data mining, the CLOPE algorithm attracts much more attention with its high speed and good performance. However, the proper choice of some parameters in the CLOPE algorithm... Among the available clustering algorithms in data mining, the CLOPE algorithm attracts much more attention with its high speed and good performance. However, the proper choice of some parameters in the CLOPE algorithm directly affects the validity of the clustering results, which is still an open issue. For this purpose, this paper proposes a fuzzy CLOPE algorithm, and presents a method for the optimal parameter choice by defining a modified partition fuzzy degree as a clustering validity function. The experimental results with real data set illustrate the effectiveness of the proposed fuzzy CLOPE algorithm and optimal parameter choice method based on the modified partition fuzzy degree. 展开更多
关键词 Data mining Cluster analysis Cluster validity Categorical attributes Optimal parameter choice
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部