-
题名一种基于信息增益的K-NN改进算法
被引量:5
- 1
-
-
作者
豆增发
王英强
王保保
-
机构
西安电子科技大学计算机学院
西安思源学院计算机科学与技术系
-
出处
《电子科技》
2006年第12期52-56,共5页
-
文摘
K-最近邻(K-nearestneighbor,简称KNN)算法是一种在人工智能领域如专家系统、数据挖掘、模式识别等方面广泛应用的算法。该算法简单有效,易于实现,但是其K值难以确定,而且分类结果易受单个属性干扰。文中提出了一种简单易行的K值确定方法,并利用Quinlan信息增益理论,提出了基于信息增益的K-最近邻改进算法。通过实验证明,改进后的K-NN算法具有较强的抗干扰能力和较好的精确性。
-
关键词
K-最近邻算法
信息增益
信息熵
-
Keywords
K-Nearest neighbour algorithm
information gain
information entropy
-
分类号
TP182
[自动化与计算机技术—控制理论与控制工程]
-
-
题名B+树在数据库索引中的应用
被引量:6
- 2
-
-
作者
王英强
石永生
-
机构
西安思源学院计算机科学与技术系
西安思源学院电子与信息工程系
-
出处
《长江大学学报(自科版)(上旬)》
CAS
2008年第1期233-235,共3页
-
文摘
索引是数据库中建立记录间有规律排序的主要方式,它可以显著提高文件的操作速度。当数据库中记录的数目和数据量很大的时候,顺序查找速度会明显下降。为了提高查找速度,必须对文件建立索引。数据库索引的设计与实现有几种方法,主要阐述了使用B+树实现索引的方法。通过对B+树定义及算法的描述,可以看到使用B+树能够方便、有效的建立数据库的索引,并且能够有效减少查找时磁盘的I/O次数,提高数据查找的效率。
-
关键词
B+树
数据库
索引
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-