期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于混合模型的中国人名自动识别 被引量:10
1
作者 毛婷婷 李丽双 黄德根 《中文信息学报》 CSCD 北大核心 2007年第2期22-28,共7页
本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法。该方法首先按字抽取特征向量的属性得到训练集,采用多项式核函数建立SVM人名识别模型,然后在特征空间中计算测试样本到SVM最优超平面的距离,当该距离大于给... 本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法。该方法首先按字抽取特征向量的属性得到训练集,采用多项式核函数建立SVM人名识别模型,然后在特征空间中计算测试样本到SVM最优超平面的距离,当该距离大于给定的阈值时使用SVM对测试样本进行分类,否则使用概率统计方法。实验表明,采用混合模型,对样本在空间的不同分布使用不同的方法可以取得比单独使用SVM或概率统计更好的分类效果,系统开式综合指标F-值比单纯使用支持向量机方法提高了1.51%。 展开更多
关键词 计算机应用 中文信息处理 支持向量机 概率统计 混合模型 人名识别
下载PDF
基于字符语言模型的垃圾邮件过滤 被引量:8
2
作者 苏绥 林鸿飞 叶正 《中文信息学报》 CSCD 北大核心 2009年第2期41-47,共7页
基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。该文先简单综述了当前基于内容的垃圾邮件过滤中采用的各种技术,在此基础上提出将基于字符的语言模型应用于垃圾邮件过滤任务中,并通过实验对比了该方法与Na ve Bayes、SVM和基于... 基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。该文先简单综述了当前基于内容的垃圾邮件过滤中采用的各种技术,在此基础上提出将基于字符的语言模型应用于垃圾邮件过滤任务中,并通过实验对比了该方法与Na ve Bayes、SVM和基于词的语言模型方法的性能差异,以及不同n值、不同特征选择方式对过滤结果的影响。实验结果表明,基于字符的语言模型实现简单且具有很高的性能,能较好地满足大规模在线邮件系统的需要,具有很高的实用价值。 展开更多
关键词 计算机应用 中文信息处理 垃圾邮件过滤 语言模型 朴素贝叶斯 支撑向量机 n—Gram
下载PDF
基于语料库的名词短语识别方法 被引量:2
3
作者 李荣 郑家恒 《济南大学学报(自然科学版)》 CAS 2007年第3期243-245,271,共4页
名词短语识别是自然语言处理领域的非常重要的子任务。利用最大熵法(ME)、支持向量机法(SVM)和隐马尔可夫模型(HMM)3种有代表性的统计方法对汉语文本进行名词短语识别,并对实验结果进行比较分析。结果表明HMM法在封闭测试中优势明显,SV... 名词短语识别是自然语言处理领域的非常重要的子任务。利用最大熵法(ME)、支持向量机法(SVM)和隐马尔可夫模型(HMM)3种有代表性的统计方法对汉语文本进行名词短语识别,并对实验结果进行比较分析。结果表明HMM法在封闭测试中优势明显,SVM法在小样本模式的开放测试中表现良好,而最大熵方法在两种测试中的识别结果均比较理想。分析表明,HMM方法侧重应用在与线性序列相关的现象上;SVM方法适用于有限的汉语带标信息的分类问题;而最大熵方法特别适用于把不受限的文本特征加入统计模型中的情况。 展开更多
关键词 中文信息处理 最大熵 支持向量机 隐马尔可夫模型 短语识别
下载PDF
基于双树复数小波的视觉信息处理模型
4
作者 董立娟 练秋生 《微计算机信息》 北大核心 2007年第02Z期254-255,186,共3页
本文基于双树复数小波变换的多尺度、多方向选择特性,对Jim Mutch提出的视觉信息处理模型进行改进。改进后算法大大提高了运算速度,同时获得的特征向量具有尺度、旋转和平移不变性。最后,利用支持向量基进行分类识别。Cal-tech101人脸... 本文基于双树复数小波变换的多尺度、多方向选择特性,对Jim Mutch提出的视觉信息处理模型进行改进。改进后算法大大提高了运算速度,同时获得的特征向量具有尺度、旋转和平移不变性。最后,利用支持向量基进行分类识别。Cal-tech101人脸数据库的实验结果表明,该方法能够取得较好的分类效果。 展开更多
关键词 视觉信息处理 hmax模型 支持向量机
下载PDF
基于离散核支持向量机的文本自动分类 被引量:3
5
作者 傅鹏 张德运 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1778-1782,共5页
传统基于向量空间模型的文本分类方法需要对文档进行预处理,同时也会损失很多有用的信息。该文提出一种基于离散核支持向量机的文本分类方法,直接根据文档的字符序列构造离散核,用于支持向量机分类算法,比较文档之间的相似性,从而改善... 传统基于向量空间模型的文本分类方法需要对文档进行预处理,同时也会损失很多有用的信息。该文提出一种基于离散核支持向量机的文本分类方法,直接根据文档的字符序列构造离散核,用于支持向量机分类算法,比较文档之间的相似性,从而改善文本分类的效果。证明了离散核支持向量机方法的时间复杂度与文本的长度成O(n)关系。在R eu ters-21578文档集上将离散核方法与多项式核、高斯核方法进行比较,实验结果表明该文所提方法在简化分类方法的同时也可以提高分类的精度。 展开更多
关键词 信息处理 支持向量机 离散核 文本分类 向量空间模型
原文传递
基于高光谱图像与视觉词袋模型的稻种发芽率预测研究 被引量:1
6
作者 于施淼 卢伟 +2 位作者 丁冬 洪德林 党晓景 《激光与光电子学进展》 CSCD 北大核心 2016年第1期107-114,共8页
为实现稻种品质的快速鉴定,以稻种最重要的品质参数之一——发芽率作为主要评价指标,通过高光谱成像技术结合视觉词袋(Bo VW)模型的方法进行稻种发芽率的分级评价。挑选Y两优302、两优108和内5优8015三个品种的杂交水稻种子各100粒,在温... 为实现稻种品质的快速鉴定,以稻种最重要的品质参数之一——发芽率作为主要评价指标,通过高光谱成像技术结合视觉词袋(Bo VW)模型的方法进行稻种发芽率的分级评价。挑选Y两优302、两优108和内5优8015三个品种的杂交水稻种子各100粒,在温度40℃、相对湿度100%条件下对三种稻种分别老化处理0、1、2、3、4 d,得到5个活力梯度的稻种。采集300粒稻种的高光谱图像,随机分为训练集(200份)和测试集(100份)。图像采集完毕后,进行稻种发芽实验,第14天时计算发芽率。采用主成分分析(PCA)方法选取特征波长,利用密集尺度不变特征变换(SIFT)算法提取稻种图像局部特征,再根据K-means算法聚类生成视觉词典。利用以径向基(RBF)核为核函数的支持向量机(SVM)分类器建立稻种发芽率分级预测模型,判别精度为95.65%。结果表明,采用高光谱成像技术结合视觉词袋模型进行水稻发芽率的快速、无损预测是可行的。 展开更多
关键词 图像处理 高光谱成像 视觉词袋 稻种 发芽率 支持向量机
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部