期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
不均衡数据集中KNN分类器样本裁剪算法 被引量:2
1
作者 景永霞 苟和平 +1 位作者 冯百明 李勇 《科学技术与工程》 北大核心 2013年第16期4720-4723,共4页
针对KNN算法在分类时的样本相似度计算开销大,在处理不均衡数据集时少数类分类误差大的问题,提出一种在不均衡数据集下基于密度的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据并计算每个样本类的平均相似度和样本平... 针对KNN算法在分类时的样本相似度计算开销大,在处理不均衡数据集时少数类分类误差大的问题,提出一种在不均衡数据集下基于密度的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据并计算每个样本类的平均相似度和样本平均密度,以此获得样本类裁剪的相似度阈值,然后将样本类内相似度小于类相似度阈值的样本进行合并,减少训练样本总数。实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,有效地减少分类计算开销,并能在一定程度上提高少数类的分类性能。 展开更多
关键词 KNN分类 聚类 样本裁剪 密度 相似度
下载PDF
一种新的Apriori改进算法 被引量:4
2
作者 景永霞 王治和 杜跃 《长春理工大学学报(自然科学版)》 2007年第2期67-69,共3页
Apriori算法是挖掘布尔关联规则频繁项集的最有影响的数据挖掘算法之一,但由于数据挖掘本身决定其面临的是海量数据,因此在许多情况下会产生大量候选项集,从而严重影响挖掘的效率。本文提出一种简单有效的Apriori改进算法。
关键词 数据挖掘 频繁项集 关联规则 APRIORI算法
下载PDF
基于Web Services的数据挖掘系统设计与实现 被引量:2
3
作者 景永霞 苟和平 朱亚玲 《兰州文理学院学报(自然科学版)》 2014年第2期54-57,共4页
随着分布式系统的发展,许多信息资源分布在网络中不同的信息系统中,给信息的共享和知识的发现造成了很大的困难.提出了一种基于Web Services的数据挖掘系统框架,开发数据挖掘中间DMS件(Data Mining Service)实现对异构信息系统的透明访... 随着分布式系统的发展,许多信息资源分布在网络中不同的信息系统中,给信息的共享和知识的发现造成了很大的困难.提出了一种基于Web Services的数据挖掘系统框架,开发数据挖掘中间DMS件(Data Mining Service)实现对异构信息系统的透明访问,把局部和全局的挖掘结果都包装成XML格式.实验表明该系统能够有效地解决了由于系统和信息的异构所带来的数据挖掘困难问题. 展开更多
关键词 WEB SERVICES 数据挖掘 XML
下载PDF
基于Web Services的实验教学平台研究与设计 被引量:1
4
作者 景永霞 苟和平 朱亚玲 《洛阳理工学院学报(自然科学版)》 2014年第2期93-96,共4页
为了实现计算机类课程实验的跟踪管理,设计了一种基于Web Services的实验教学平台,该平台在Web Services框架上建立通用的实验管理服务作为信息提供者为用户提供相关实验教学管理服务,采用XML技术实现数据存储与通信。XML格式的实验项... 为了实现计算机类课程实验的跟踪管理,设计了一种基于Web Services的实验教学平台,该平台在Web Services框架上建立通用的实验管理服务作为信息提供者为用户提供相关实验教学管理服务,采用XML技术实现数据存储与通信。XML格式的实验项目数据被下载到客户端并解析处理,最终的实验结果封装为XML上传至服务端,将WEB服务和实验管理服务部署在不同的服务器之上,有效地减轻了WEB服务端的负荷,并实现系统的跨平台运行。 展开更多
关键词 WEB SERVICES 实验平台 XML
下载PDF
基于分布式数据库的关联规则挖掘算法 被引量:4
5
作者 景永霞 王治和 苟和平 《湛江师范学院学报》 2007年第6期74-77,共4页
现有的数据挖掘算法和模型主要是基于大型数据库或数据仓库的环境,大多采用集中式处理.而目前绝大部分的大型数据库都是以分布式的形式存在的,因此.提出新的分布式关联规则挖掘算法是非常必要的.针对FDM 算法中可能造成频繁项集丢失的缺... 现有的数据挖掘算法和模型主要是基于大型数据库或数据仓库的环境,大多采用集中式处理.而目前绝大部分的大型数据库都是以分布式的形式存在的,因此.提出新的分布式关联规则挖掘算法是非常必要的.针对FDM 算法中可能造成频繁项集丢失的缺点,提出了一种改进的分布式关联规则挖掘算法 DARM,该算法同时也减少了各分站点问的通讯量.从而提高了整个挖掘算法的效率. 展开更多
关键词 分布式数据挖掘 频繁项集 关联规则
下载PDF
基于差别对象对的属性约简算法
6
作者 景永霞 王治和 苟和平 《沈阳理工大学学报》 CAS 2008年第1期18-20,69,共4页
属性约简是粗糙集理论的核心问题之一,当问题的规模比较大时,基于差别矩阵的属性约简算法存放差别矩阵的空间过大,相应地,其时间复杂度也比较高.针对这一问题,提出了基于差别对象对的改进属性约简算法,由于该算法不再需要存储差别矩阵,... 属性约简是粗糙集理论的核心问题之一,当问题的规模比较大时,基于差别矩阵的属性约简算法存放差别矩阵的空间过大,相应地,其时间复杂度也比较高.针对这一问题,提出了基于差别对象对的改进属性约简算法,由于该算法不再需要存储差别矩阵,因而降低了存储量和计算量,从而提高了算法的效率. 展开更多
关键词 粗糙集 属性约简 差别对象对
下载PDF
正、负关联规则挖掘算法的实现
7
作者 景永霞 王治和 杜跃 《甘肃联合大学学报(自然科学版)》 2007年第2期63-65,共3页
关联规则挖掘寻找给定数据集中项之间的有趣关系,是数据挖掘的主要研究方面.传统的关联规则挖掘算法仅能挖掘正关联规则,事实上,负关联规则也包含了非常有价值的信息,对于决策的作用也是不容忽视的.
关键词 数据挖掘 关联规则 负关联规则 置信度
下载PDF
基于能力评价的计算机专业创新创业课程体系构建研究 被引量:1
8
作者 景永霞 苟和平 陈莉莉 《齐齐哈尔高等师范专科学校学报》 2023年第6期103-105,共3页
为了使传统教育不断适应地方经济社会发展,需要良好的创新创业课程支撑,本文对传统计算机类专业创新创业课程进行改造升级,通过搭建三类合作机制的课程设计决策支持平台,组织校内外专家对人才培养目标进行分析,实现创新创业课程体系构... 为了使传统教育不断适应地方经济社会发展,需要良好的创新创业课程支撑,本文对传统计算机类专业创新创业课程进行改造升级,通过搭建三类合作机制的课程设计决策支持平台,组织校内外专家对人才培养目标进行分析,实现创新创业课程体系构建、实践内容与环节设计,探索建立四个层次的创新创业教育课程,同时,通过搭建三类实践支持平台,把创新创业课程实践、创新工程实践和创业实践结合起来,建立创新创业实践体系。 展开更多
关键词 新工科 创新创业 计算机专业 课程体系
下载PDF
基于DBSCAN聚类的改进KNN文本分类算法 被引量:5
9
作者 苟和平 景永霞 +1 位作者 冯百明 李勇 《科学技术与工程》 北大核心 2013年第1期219-222,共4页
K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度。当训练样本过多时,计算代价大,分类效率降低。因此,提出一种基于DBSCAN聚类的改进算法。利用DBSCAN聚类消除训练样本的噪声数据。同时,对于核心样本... K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度。当训练样本过多时,计算代价大,分类效率降低。因此,提出一种基于DBSCAN聚类的改进算法。利用DBSCAN聚类消除训练样本的噪声数据。同时,对于核心样本集中的样本,根据其样本相似度阈值和密度进行样本裁剪,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够在保持基本分类能力不变的情况下,有效地降低分类计算量。 展开更多
关键词 K最近邻 文本分类 样本裁剪
下载PDF
一种基于粗糙集的改进KNN文本分类算法 被引量:3
10
作者 苟和平 景永霞 +1 位作者 冯百明 李勇 《科学技术与工程》 北大核心 2012年第20期4926-4929,共4页
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一。在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空... K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一。在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间。以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。 展开更多
关键词 K最近邻 文本分类 粗糙集 近似空间
下载PDF
一种基于信息网格的多源信息集成方案 被引量:3
11
作者 苟和平 冯百明 景永霞 《微电子学与计算机》 CSCD 北大核心 2008年第11期121-124,128,共5页
随着分布式系统的推广,各种与企业某一活动相关的信息资源分布在各个异构的信息源上,致使给企业用户全面、正确的决策带来极大的困难.为了有效地利用这些信息资源,提出了一种基于信息网格的多源信息集成方案,并利用XML技术来集成各个分... 随着分布式系统的推广,各种与企业某一活动相关的信息资源分布在各个异构的信息源上,致使给企业用户全面、正确的决策带来极大的困难.为了有效地利用这些信息资源,提出了一种基于信息网格的多源信息集成方案,并利用XML技术来集成各个分布自治的异构信息源上的信息,提供给所有用户一个透明的访问接口. 展开更多
关键词 信息网格 多源信息 信息集成 IDML
下载PDF
基于BERT语义分析和CNN的短文本分类研究 被引量:1
12
作者 景永霞 苟和平 刘强 《洛阳理工学院学报(自然科学版)》 2023年第4期78-83,共6页
针对短文本数据量较小情况下CNN模型无法获得较好文本分类特征造成文本分类精度不高的问题,提出一种结合BERT语义分析和CNN的短文本分类模型,通过对BERT预训练模型进行微调获得文本向量表示,文本向量能够体现文本特征的全局语义关系,并... 针对短文本数据量较小情况下CNN模型无法获得较好文本分类特征造成文本分类精度不高的问题,提出一种结合BERT语义分析和CNN的短文本分类模型,通过对BERT预训练模型进行微调获得文本向量表示,文本向量能够体现文本特征的全局语义关系,并将文本向量表示数据输入CNN模型进行分类模型训练,获得最终的文本分类特征实现分类。此方法能够实现短文本分类精度的有效提升。 展开更多
关键词 短文本 词向量 文本分类 语义分析
下载PDF
基于BERT语义分析的短文本分类研究 被引量:1
13
作者 景永霞 苟和平 刘强 《兰州文理学院学报(自然科学版)》 2023年第6期46-49,共4页
为了提升短文本分类效果,解决一词多义带来的短文本分类精度不高的问题,提出一种基于BERT语义分析的短文本分类模型,通过建立BERT词向量实现文本语义表示,解决文本词的二义性问题,同时对输出的各个词(字)向量进行融合,获得最后的文本语... 为了提升短文本分类效果,解决一词多义带来的短文本分类精度不高的问题,提出一种基于BERT语义分析的短文本分类模型,通过建立BERT词向量实现文本语义表示,解决文本词的二义性问题,同时对输出的各个词(字)向量进行融合,获得最后的文本语义表示向量,实现短文本分类.实验数据采用今日头条中文短文本数据集,实验结果表明,通过此方法能够有效提升短文本分类的精度. 展开更多
关键词 文本分类 短文本 语义分析 词向量
下载PDF
基于密度的KNN分类器样本裁剪算法 被引量:2
14
作者 苟和平 景永霞 +1 位作者 冯百明 李勇 《佳木斯大学学报(自然科学版)》 CAS 2013年第2期242-244,248,共4页
KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训练样本裁剪算法,对训练样本的各个样本类进行聚类,根据密度不同聚集成不同的簇,删除噪声数据并计算每... KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训练样本裁剪算法,对训练样本的各个样本类进行聚类,根据密度不同聚集成不同的簇,删除噪声数据并计算每个样本类的相似度阈值,然后将样本类内大于类相似度阈值的样本进行合并,以减少训练样本总数.实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,实现各个样本类内高相似度样本的合并,减少分类计算开销. 展开更多
关键词 KNN分类 聚类 样本裁剪 相似度阈值
下载PDF
遗留信息共享的一种实现方案 被引量:1
15
作者 苟和平 冯百明 景永霞 《兰州理工大学学报》 CAS 北大核心 2007年第6期93-96,共4页
在分析遗留系统特点的基础上,提出实现遗留信息共享的一种方案,建立遗留信息的一种封装协议——REML.REML利用网格服务实现各类遗留信息的重新利用,使得TILS这类系统中的遗留信息不必经过重新开发新系统就能被网格用户所访问,实现遗留... 在分析遗留系统特点的基础上,提出实现遗留信息共享的一种方案,建立遗留信息的一种封装协议——REML.REML利用网格服务实现各类遗留信息的重新利用,使得TILS这类系统中的遗留信息不必经过重新开发新系统就能被网格用户所访问,实现遗留信息资源的共享.通过该方案,企业可以根据自身的目标,动态地集成这些分布在不同遗留系统中的信息资源.设计实现基于该方案的原型软件,验证此方案的有效性和实用性. 展开更多
关键词 信息网格 WEB服务 遗留信息 REML
下载PDF
基于关联规则挖掘的粗糙集属性值约简算法研究 被引量:1
16
作者 杜跃 王治和 景永霞 《苏州科技学院学报(自然科学版)》 CAS 2008年第1期16-19,44,共5页
粗糙集理论中约简是一个重要的研究课题,它包括属性约简和属性值约简两方面内容。针对目前属性值约简只能实现约简,而不能计算各个规则的出现次数的问题,结合关联规则和粗糙集两方面的优点,对冗余规则和不一致规则进行处理,获得具有实... 粗糙集理论中约简是一个重要的研究课题,它包括属性约简和属性值约简两方面内容。针对目前属性值约简只能实现约简,而不能计算各个规则的出现次数的问题,结合关联规则和粗糙集两方面的优点,对冗余规则和不一致规则进行处理,获得具有实际意义的约简表。实验证明,此算法是有效的。 展开更多
关键词 关联规则 粗糙集 值约简 属性 决策表
下载PDF
传感器实时信息共享的一种实现方案
17
作者 苟和平 冯百明 +1 位作者 邹燕飞 景永霞 《计算机应用研究》 CSCD 北大核心 2008年第3期833-835,共3页
针对企业中会存在的各类传感器所产生的关于自然现象的一些实时信息,如果能够得到及时的分析处理,并作出相应的决策,将会极大地提高企业的运作效率。提出了一种在信息网格中集成传感器的方法,并以智能数字磁场计HMR2300为例说明其实现... 针对企业中会存在的各类传感器所产生的关于自然现象的一些实时信息,如果能够得到及时的分析处理,并作出相应的决策,将会极大地提高企业的运作效率。提出了一种在信息网格中集成传感器的方法,并以智能数字磁场计HMR2300为例说明其实现过程。实践表明,该方法能够更方便、更快捷地将传感器集成在信息网格中,实现实时信息共享。 展开更多
关键词 信息网格 传感器 WEB服务 REML
下载PDF
在网格中重用遗留代码的一种实现方案
18
作者 苟和平 冯百明 +1 位作者 邹燕飞 景永霞 《西北师范大学学报(自然科学版)》 CAS 2007年第4期28-32,共5页
针对遗留代码的共享需求提出了在网格中重用LC(Legacy Code)的M-W(Migration-Wrapping)方法.该方法把LC变换为XML格式,迁移到Web服务器之后,包装、部署成Web服务以供访问者调用.采用M-W方法,只需付出低廉的代价就可实现大量LC在新系统... 针对遗留代码的共享需求提出了在网格中重用LC(Legacy Code)的M-W(Migration-Wrapping)方法.该方法把LC变换为XML格式,迁移到Web服务器之后,包装、部署成Web服务以供访问者调用.采用M-W方法,只需付出低廉的代价就可实现大量LC在新系统中的重新利用. 展开更多
关键词 网格 WEB服务 代码重用 XML
下载PDF
基于数组的关联规则挖掘算法 被引量:1
19
作者 杜跃 王治和 景永霞 《甘肃联合大学学报(自然科学版)》 2007年第3期56-57,72,共3页
提出了基于数组的关联规则挖掘算法,该算法只扫描一次数据库,将数据库中的数据存于数组中,提高了内存的利用效率,同时也提高了算法效率.
关键词 数据挖掘 关联规则 数组 频繁项集
下载PDF
分布式关联规则挖掘研究
20
作者 王治和 景永霞 杜辉 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2010年第4期114-118,共5页
针对分布式关联规则挖掘算法FDM可能造成频繁项集丢失的缺点,提出了一种改进的分布式环境下关联规则挖掘算法.该算法采用全局局部通信模式,通过对候选项集建立对应的频繁标记,把频繁标记和频繁项集的支持计数作为各局部站点和全局站点... 针对分布式关联规则挖掘算法FDM可能造成频繁项集丢失的缺点,提出了一种改进的分布式环境下关联规则挖掘算法.该算法采用全局局部通信模式,通过对候选项集建立对应的频繁标记,把频繁标记和频繁项集的支持计数作为各局部站点和全局站点之间的传输内容.该算法不仅保证了数据挖掘结果的完整性和正确性,同时也减少了站点间的通讯量. 展开更多
关键词 分布式环境 数据挖掘 关联规则 FDM
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部