期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于DBSCAN聚类的改进KNN文本分类算法 被引量:5
1
作者 苟和平 景永霞 +1 位作者 冯百明 李勇 《科学技术与工程》 北大核心 2013年第1期219-222,共4页
K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度。当训练样本过多时,计算代价大,分类效率降低。因此,提出一种基于DBSCAN聚类的改进算法。利用DBSCAN聚类消除训练样本的噪声数据。同时,对于核心样本... K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度。当训练样本过多时,计算代价大,分类效率降低。因此,提出一种基于DBSCAN聚类的改进算法。利用DBSCAN聚类消除训练样本的噪声数据。同时,对于核心样本集中的样本,根据其样本相似度阈值和密度进行样本裁剪,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够在保持基本分类能力不变的情况下,有效地降低分类计算量。 展开更多
关键词 K最近邻 文本分类 样本裁剪
下载PDF
一种基于粗糙集的改进KNN文本分类算法 被引量:3
2
作者 苟和平 景永霞 +1 位作者 冯百明 李勇 《科学技术与工程》 北大核心 2012年第20期4926-4929,共4页
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一。在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空... K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一。在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间。以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。 展开更多
关键词 K最近邻 文本分类 粗糙集 近似空间
下载PDF
一种基于信息网格的多源信息集成方案 被引量:3
3
作者 苟和平 冯百明 景永霞 《微电子学与计算机》 CSCD 北大核心 2008年第11期121-124,128,共5页
随着分布式系统的推广,各种与企业某一活动相关的信息资源分布在各个异构的信息源上,致使给企业用户全面、正确的决策带来极大的困难.为了有效地利用这些信息资源,提出了一种基于信息网格的多源信息集成方案,并利用XML技术来集成各个分... 随着分布式系统的推广,各种与企业某一活动相关的信息资源分布在各个异构的信息源上,致使给企业用户全面、正确的决策带来极大的困难.为了有效地利用这些信息资源,提出了一种基于信息网格的多源信息集成方案,并利用XML技术来集成各个分布自治的异构信息源上的信息,提供给所有用户一个透明的访问接口. 展开更多
关键词 信息网格 多源信息 信息集成 IDML
下载PDF
基于密度的KNN分类器样本裁剪算法 被引量:2
4
作者 苟和平 景永霞 +1 位作者 冯百明 李勇 《佳木斯大学学报(自然科学版)》 CAS 2013年第2期242-244,248,共4页
KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训练样本裁剪算法,对训练样本的各个样本类进行聚类,根据密度不同聚集成不同的簇,删除噪声数据并计算每... KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训练样本裁剪算法,对训练样本的各个样本类进行聚类,根据密度不同聚集成不同的簇,删除噪声数据并计算每个样本类的相似度阈值,然后将样本类内大于类相似度阈值的样本进行合并,以减少训练样本总数.实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,实现各个样本类内高相似度样本的合并,减少分类计算开销. 展开更多
关键词 KNN分类 聚类 样本裁剪 相似度阈值
下载PDF
遗留信息共享的一种实现方案 被引量:1
5
作者 苟和平 冯百明 景永霞 《兰州理工大学学报》 CAS 北大核心 2007年第6期93-96,共4页
在分析遗留系统特点的基础上,提出实现遗留信息共享的一种方案,建立遗留信息的一种封装协议——REML.REML利用网格服务实现各类遗留信息的重新利用,使得TILS这类系统中的遗留信息不必经过重新开发新系统就能被网格用户所访问,实现遗留... 在分析遗留系统特点的基础上,提出实现遗留信息共享的一种方案,建立遗留信息的一种封装协议——REML.REML利用网格服务实现各类遗留信息的重新利用,使得TILS这类系统中的遗留信息不必经过重新开发新系统就能被网格用户所访问,实现遗留信息资源的共享.通过该方案,企业可以根据自身的目标,动态地集成这些分布在不同遗留系统中的信息资源.设计实现基于该方案的原型软件,验证此方案的有效性和实用性. 展开更多
关键词 信息网格 WEB服务 遗留信息 REML
下载PDF
传感器实时信息共享的一种实现方案
6
作者 苟和平 冯百明 +1 位作者 邹燕飞 景永霞 《计算机应用研究》 CSCD 北大核心 2008年第3期833-835,共3页
针对企业中会存在的各类传感器所产生的关于自然现象的一些实时信息,如果能够得到及时的分析处理,并作出相应的决策,将会极大地提高企业的运作效率。提出了一种在信息网格中集成传感器的方法,并以智能数字磁场计HMR2300为例说明其实现... 针对企业中会存在的各类传感器所产生的关于自然现象的一些实时信息,如果能够得到及时的分析处理,并作出相应的决策,将会极大地提高企业的运作效率。提出了一种在信息网格中集成传感器的方法,并以智能数字磁场计HMR2300为例说明其实现过程。实践表明,该方法能够更方便、更快捷地将传感器集成在信息网格中,实现实时信息共享。 展开更多
关键词 信息网格 传感器 WEB服务 REML
下载PDF
在网格中重用遗留代码的一种实现方案
7
作者 苟和平 冯百明 +1 位作者 邹燕飞 景永霞 《西北师范大学学报(自然科学版)》 CAS 2007年第4期28-32,共5页
针对遗留代码的共享需求提出了在网格中重用LC(Legacy Code)的M-W(Migration-Wrapping)方法.该方法把LC变换为XML格式,迁移到Web服务器之后,包装、部署成Web服务以供访问者调用.采用M-W方法,只需付出低廉的代价就可实现大量LC在新系统... 针对遗留代码的共享需求提出了在网格中重用LC(Legacy Code)的M-W(Migration-Wrapping)方法.该方法把LC变换为XML格式,迁移到Web服务器之后,包装、部署成Web服务以供访问者调用.采用M-W方法,只需付出低廉的代价就可实现大量LC在新系统中的重新利用. 展开更多
关键词 网格 WEB服务 代码重用 XML
下载PDF
信息集成系统中的缓存数据更新方案
8
作者 苟和平 景永霞 李勇 《佳木斯大学学报(自然科学版)》 CAS 2010年第3期325-328,共4页
为了维护信息集成系统中的数据一致性,本文提出了一种缓存数据实时更新方案,根据信息全局模式和各个信息源输出模式之间映射关系的不同,分别采取不同的更新定位方式,实现对应全局缓存数据的实时更新,有效地解决了源数据和全局缓存数据... 为了维护信息集成系统中的数据一致性,本文提出了一种缓存数据实时更新方案,根据信息全局模式和各个信息源输出模式之间映射关系的不同,分别采取不同的更新定位方式,实现对应全局缓存数据的实时更新,有效地解决了源数据和全局缓存数据之间的不一致问题,提高了信息查询结果的准确性. 展开更多
关键词 信息集成 数据缓存 一致性 更新
下载PDF
基于XML Schema的Deep Web查询接口分类研究
9
作者 苟和平 景永霞 吴多智 《长春大学学报》 2016年第4期13-18,共6页
Deep Web在线数据库蕴含大量的信息,但由于这些信息检索困难,利用率不高,本文提出一种基于XML Schema的查询接口分类方法,建立数据查询接口的XML Schema文档,通过各数据源名的语言学相似度实现查询接口的初次分类;根据查询接口标签属性... Deep Web在线数据库蕴含大量的信息,但由于这些信息检索困难,利用率不高,本文提出一种基于XML Schema的查询接口分类方法,建立数据查询接口的XML Schema文档,通过各数据源名的语言学相似度实现查询接口的初次分类;根据查询接口标签属性,建立特征-接口向量空间模型实现查询接口向量化,再采用KNN算法进行二次分类,减少KNN算法分类带来的计算开销,提高Deep Web数据检索的效率。 展开更多
关键词 DEEP Web XML SCHEMA 查询接口 分类
下载PDF
信息集成系统中的XML Schema匹配算法研究
10
作者 苟和平 景永霞 李勇 《佳木斯大学学报(自然科学版)》 CAS 2014年第3期455-458,共4页
模式匹配是信息集成过程的关键技术之一,本文提出一种基于XML Schema的模式集成,主要采用基于节点对之间的语言学和结构相似度实现XML Schema匹配,为避免两个节点本身代表不同的含义但却由于其结构相似性很高而集成在一起的情况,采用语... 模式匹配是信息集成过程的关键技术之一,本文提出一种基于XML Schema的模式集成,主要采用基于节点对之间的语言学和结构相似度实现XML Schema匹配,为避免两个节点本身代表不同的含义但却由于其结构相似性很高而集成在一起的情况,采用语言学相似度过滤掉语言学相似度小于指定阈值的节点,使其不再参与后续的结构匹配算法.通过案例分析表明,此方案能够达到较好的效果. 展开更多
关键词 信息集成 XML 模式匹配
下载PDF
XML Schema匹配中的元素相似性度量算法研究
11
作者 苟和平 景永霞 姜永亮 《沈阳理工大学学报》 CAS 2014年第5期15-20,共6页
为了实现XML Schema自动匹配,解决XML数据共享问题,提出一种基于语义和结构的模式自动匹配算法。首先采用基于单词网络(wordnet)的语义匹配算法及字符串结构匹配(n-grams)算法计算来自两个模式树中节点对名称相似度,然后获取包含此节点... 为了实现XML Schema自动匹配,解决XML数据共享问题,提出一种基于语义和结构的模式自动匹配算法。首先采用基于单词网络(wordnet)的语义匹配算法及字符串结构匹配(n-grams)算法计算来自两个模式树中节点对名称相似度,然后获取包含此节点对的各自路径集,再通过计算对应路径集中每对路径的最大相似度获得此节点对的结构相似度。实验分析表明此方法具有较好的查全率和查准率。 展开更多
关键词 XML SCHEMA 模式匹配 语义 路径相似
下载PDF
在企业信息网格中集成ELI的研究
12
作者 苟和平 冯百明 景永霞 《天水师范学院学报》 2007年第2期32-34,43,共4页
在企业信息网格中集成ELI(Enterprise Legacy Information)的M-W(Migration-Wrapping)方法,把ELI迁移到Web服务器之后,将其包装成Web服务以供Web服务调用者访问,实现了ELI与新建立应用系统的集成,有效地解决了企业在长期运行过程中形成... 在企业信息网格中集成ELI(Enterprise Legacy Information)的M-W(Migration-Wrapping)方法,把ELI迁移到Web服务器之后,将其包装成Web服务以供Web服务调用者访问,实现了ELI与新建立应用系统的集成,有效地解决了企业在长期运行过程中形成的“信息孤岛”问题。 展开更多
关键词 企业信息网格 WEB服务 信息集成 XML
下载PDF
液-液相转移催化法合成N,N'-二芳氧基乙酰基芳二胺 被引量:6
13
作者 陈继畴 朱自贤 +4 位作者 苟和平 杨立荣 魏太保 杨素铀 王秀春 《应用化学》 CAS CSCD 北大核心 1992年第6期103-106,共4页
我们曾报道芳氧基乙酰芳胺的合成及生物活性的研究。为了探索结构与生物活性之问的关系我们设计在具有生物活性的芳氧基乙酰芳胺母体分子中再引入一个芳氧基乙酰芳胺基,试图筛选出活性更强的新品种。借鉴文献[1]选择的反应条件。
关键词 二芳氧基 乙酰基 芳二胺 催化
下载PDF
不均衡数据集中KNN分类器样本裁剪算法 被引量:2
14
作者 景永霞 苟和平 +1 位作者 冯百明 李勇 《科学技术与工程》 北大核心 2013年第16期4720-4723,共4页
针对KNN算法在分类时的样本相似度计算开销大,在处理不均衡数据集时少数类分类误差大的问题,提出一种在不均衡数据集下基于密度的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据并计算每个样本类的平均相似度和样本平... 针对KNN算法在分类时的样本相似度计算开销大,在处理不均衡数据集时少数类分类误差大的问题,提出一种在不均衡数据集下基于密度的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据并计算每个样本类的平均相似度和样本平均密度,以此获得样本类裁剪的相似度阈值,然后将样本类内相似度小于类相似度阈值的样本进行合并,减少训练样本总数。实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,有效地减少分类计算开销,并能在一定程度上提高少数类的分类性能。 展开更多
关键词 KNN分类 聚类 样本裁剪 密度 相似度
下载PDF
基于Web Services的数据挖掘系统设计与实现 被引量:2
15
作者 景永霞 苟和平 朱亚玲 《兰州文理学院学报(自然科学版)》 2014年第2期54-57,共4页
随着分布式系统的发展,许多信息资源分布在网络中不同的信息系统中,给信息的共享和知识的发现造成了很大的困难.提出了一种基于Web Services的数据挖掘系统框架,开发数据挖掘中间DMS件(Data Mining Service)实现对异构信息系统的透明访... 随着分布式系统的发展,许多信息资源分布在网络中不同的信息系统中,给信息的共享和知识的发现造成了很大的困难.提出了一种基于Web Services的数据挖掘系统框架,开发数据挖掘中间DMS件(Data Mining Service)实现对异构信息系统的透明访问,把局部和全局的挖掘结果都包装成XML格式.实验表明该系统能够有效地解决了由于系统和信息的异构所带来的数据挖掘困难问题. 展开更多
关键词 WEB SERVICES 数据挖掘 XML
下载PDF
基于Web Services的实验教学平台研究与设计 被引量:1
16
作者 景永霞 苟和平 朱亚玲 《洛阳理工学院学报(自然科学版)》 2014年第2期93-96,共4页
为了实现计算机类课程实验的跟踪管理,设计了一种基于Web Services的实验教学平台,该平台在Web Services框架上建立通用的实验管理服务作为信息提供者为用户提供相关实验教学管理服务,采用XML技术实现数据存储与通信。XML格式的实验项... 为了实现计算机类课程实验的跟踪管理,设计了一种基于Web Services的实验教学平台,该平台在Web Services框架上建立通用的实验管理服务作为信息提供者为用户提供相关实验教学管理服务,采用XML技术实现数据存储与通信。XML格式的实验项目数据被下载到客户端并解析处理,最终的实验结果封装为XML上传至服务端,将WEB服务和实验管理服务部署在不同的服务器之上,有效地减轻了WEB服务端的负荷,并实现系统的跨平台运行。 展开更多
关键词 WEB SERVICES 实验平台 XML
下载PDF
基于分布式数据库的关联规则挖掘算法 被引量:4
17
作者 景永霞 王治和 苟和平 《湛江师范学院学报》 2007年第6期74-77,共4页
现有的数据挖掘算法和模型主要是基于大型数据库或数据仓库的环境,大多采用集中式处理.而目前绝大部分的大型数据库都是以分布式的形式存在的,因此.提出新的分布式关联规则挖掘算法是非常必要的.针对FDM 算法中可能造成频繁项集丢失的缺... 现有的数据挖掘算法和模型主要是基于大型数据库或数据仓库的环境,大多采用集中式处理.而目前绝大部分的大型数据库都是以分布式的形式存在的,因此.提出新的分布式关联规则挖掘算法是非常必要的.针对FDM 算法中可能造成频繁项集丢失的缺点,提出了一种改进的分布式关联规则挖掘算法 DARM,该算法同时也减少了各分站点问的通讯量.从而提高了整个挖掘算法的效率. 展开更多
关键词 分布式数据挖掘 频繁项集 关联规则
下载PDF
湿陷性黄土地基处理方案之比较 被引量:2
18
作者 苟和平 《杨凌职业技术学院学报》 2009年第4期11-12,共2页
陕西关中地区大多为湿陷性或自重湿陷性黄土,在工程建设中,地基处理方案的确定往往需要慎之又慎,随着建筑物抗震等级的提高,也为地基处理提出了更高要求。本文通过关中地区某工程自重湿陷性黄土地基处理方案的比较,提出了技术上可行、... 陕西关中地区大多为湿陷性或自重湿陷性黄土,在工程建设中,地基处理方案的确定往往需要慎之又慎,随着建筑物抗震等级的提高,也为地基处理提出了更高要求。本文通过关中地区某工程自重湿陷性黄土地基处理方案的比较,提出了技术上可行、经济上合理的处理方案,收到了良好的效果。 展开更多
关键词 湿陷性黄土 地基处理 方案
下载PDF
注册表中失效信息的自动删除机制研究
19
作者 冯百明 邹燕飞 苟和平 《西北师范大学学报(自然科学版)》 CAS 2007年第6期34-37,共4页
提出了一种LG结构,用本地和全局两级注册表实现注册表中过时信息的自动注销,使得信息和所描述的资源情况相一致.实际系统运行的结果证明提出的方法是可行的.
关键词 两级注册表 信息服务 分布式系统
下载PDF
基于差别对象对的属性约简算法
20
作者 景永霞 王治和 苟和平 《沈阳理工大学学报》 CAS 2008年第1期18-20,69,共4页
属性约简是粗糙集理论的核心问题之一,当问题的规模比较大时,基于差别矩阵的属性约简算法存放差别矩阵的空间过大,相应地,其时间复杂度也比较高.针对这一问题,提出了基于差别对象对的改进属性约简算法,由于该算法不再需要存储差别矩阵,... 属性约简是粗糙集理论的核心问题之一,当问题的规模比较大时,基于差别矩阵的属性约简算法存放差别矩阵的空间过大,相应地,其时间复杂度也比较高.针对这一问题,提出了基于差别对象对的改进属性约简算法,由于该算法不再需要存储差别矩阵,因而降低了存储量和计算量,从而提高了算法的效率. 展开更多
关键词 粗糙集 属性约简 差别对象对
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部