-
题名用于文本相似度计算的新核函数
被引量:4
- 1
-
-
作者
王秀红
鞠时光
-
机构
江苏大学科技信息研究所
江苏大学理学院
加州大学戴维斯分校农业与环境科学学院
江苏大学计算机科学与通信工程学院
-
出处
《通信学报》
EI
CSCD
北大核心
2012年第12期43-48,共6页
-
文摘
为了提高文本相似检测的综合表现,在文本文档相似特征的基础上构造了新的核函数S_Wang核函数。结合文本相似计算过程中的实际情况,将待比对的文本表示成向量,考虑通过2个向量间的乘积和欧氏距离来描述向量之间的相似程度,从而构造了适合文本相似度计算的新核函数,并根据Mercer定理证明了所构造函数可以作为核函数。实验验证了新构造的核函数在文本文档相似度计算中的表现,实验结果表明S_Wang核其相似度计算精度和综合指标均分别优于Cauchy核、潜在语义核(LSK)以及CLA复合核。S_Wang核适用于文本相似度计算。
-
关键词
信息检索
文本相似度
核函数
S_Wang核
潜在语义核
CAUCHY核
cla复合核
-
Keywords
information retrieval
text similarity
kernel function
S_Wang kernel
LSK
Cauchy kernel
cla kernel
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于混合隶属度的模糊简约双支持向量机研究
被引量:4
- 2
-
-
作者
王伟
任建华
刘晓帅
孟祥福
-
机构
辽宁工程技术大学电子与信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2015年第10期36-41,共6页
-
基金
国家青年科学基金项目(No.61003162)
辽宁省教育厅项目(No.L2013131)
-
文摘
双支持向量机是一种新的非平行二分类算法,其处理速度比传统支持向量机快很多,但是双支持向量机在训练之前要进行大量的复杂逆矩阵计算;在非线性情况下,它不能像传统支持向量机那样把核技巧直接运用到对偶优化问题中;并且双支持向量机没有考虑不同输入样本点会对最优分类超平面产生不同的影响。针对这些情况,提出了一种模糊简约双支持向量机。该模糊简约双支持向量机通过对二次规划函数和拉格朗日函数的改进,省略大量的逆矩阵计算,同时核技巧能直接运用到非线性分类情况下;对于混合模糊隶属度函数,不仅每个样本点到类中心的距离影响着该混合模糊隶属度,而且该样本点的邻域密度同样影响着该混合模糊隶属度。实验结果表明,与支持向量机、标准双支持向量机、双边界支持向量机、模糊双支持向量机相比,具有该混合模糊隶属度函数的简约双支持向量机不仅分类时间短,计算简单,而且分类精度高。
-
关键词
双支持向量机
支持向量机
逆矩阵
核技巧
模糊隶属度
分类
-
Keywords
twin support vector machine
support vector machine
inverse matrices
kernel trick
fuzzy membership
clas-sification
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-