期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
Remove Redundancy Samples for SVM in A Chinese Word Segmentation Task
1
作者 Feiliang Ren Tianshun Yao 《通讯和计算机(中英文版)》 2006年第5期103-107,共5页
关键词 文字处理 变参数系统 软件开发 数据处理
下载PDF
Feature study for improving Chinese overlapping ambiguity resolution based on SVM 被引量:1
2
作者 熊英 朱杰 《Journal of Southeast University(English Edition)》 EI CAS 2007年第2期179-184,共6页
In order to improve Chinese overlapping ambiguity resolution based on a support vector machine, statistical features are studied for representing the feature vectors. First, four statistical parameters-mutual informat... In order to improve Chinese overlapping ambiguity resolution based on a support vector machine, statistical features are studied for representing the feature vectors. First, four statistical parameters-mutual information, accessor variety, two-character word frequency and single-character word frequency are used to describe the feature vectors respectively. Then other parameters are tried to add as complementary features to the parameters which obtain the best results for further improving the classification performance. Experimental results show that features represented by mutual information, single-character word frequency and accessor variety can obtain an optimum result of 94. 39%. Compared with a commonly used word probability model, the accuracy has been improved by 6. 62%. Such comparative results confirm that the classification performance can be improved by feature selection and representation. 展开更多
关键词 support vector machine Chinese overlapping ambiguity Chinese word segmentation word probability model
下载PDF
利用word2vec对中文词进行聚类的研究 被引量:29
3
作者 郑文超 徐鹏 《软件》 2013年第12期160-162,共3页
文本聚类在数据挖掘和机器学习中发挥着重要的作用,该技术经过多年的发展,已产生了一系列的理论成果。本文在前人研究成果的基础上,探索了一种新的中文聚类方法。本文先提出了一种中文分词算法,用来将中文文本分割成独立的词语。再对处... 文本聚类在数据挖掘和机器学习中发挥着重要的作用,该技术经过多年的发展,已产生了一系列的理论成果。本文在前人研究成果的基础上,探索了一种新的中文聚类方法。本文先提出了一种中文分词算法,用来将中文文本分割成独立的词语。再对处理后的语料使用Word2Vec工具集,应用深度神经网络算法,转化为对应的词向量。最后,将词向量之间的余弦距离定义为词之间的相似度,通过使用K-means聚类算法将获取的词向量进行聚类,最终可以返回语料库中同输入词语语意最接近的词。本文从网络上抓取了2012年的网络新闻数据,应用上述方法进行了实验,取得了不错的实验效果。 展开更多
关键词 数据挖掘 聚类 分词 词向量 神经网络
下载PDF
基于Sword2vect的中文在线商品评价情感分析 被引量:6
4
作者 厍向阳 杨瑞丽 董立红 《西安科技大学学报》 CAS 北大核心 2020年第3期504-511,共8页
商品的在线评论情感分析已经成为一个热门的研究话题。为了更好地解决情感分析中词语的上下文信息和词语的情感信息缺失问题,提出了一种基于句子情感得分加权句向量的Sword2vect情感分析方法,对中文在线评价进行情感分析。首先用基于词... 商品的在线评论情感分析已经成为一个热门的研究话题。为了更好地解决情感分析中词语的上下文信息和词语的情感信息缺失问题,提出了一种基于句子情感得分加权句向量的Sword2vect情感分析方法,对中文在线评价进行情感分析。首先用基于词典的方法计算出评论句子的情感得分并对其进行预处理保证所有正向评论句子的情感得分为正,负向评论情感得分为负,用word2vect算法得到含有上下文信息评论的句子向量,然后用情感得分对句子向量进行加权得到情感句向量Sword2vect,用支持向量机算法对训练数据集进行训练得到模型,最后调用训练好的模型对测试数据集进行情感分析。采用基于情感得分加权的Sword2vect算法和word2vect词向量算法以及tf_idf特征词向量算法分别对京东手机在线评价以及谭松波酒店评价这2个数据集进行情感分析,从精确度、时间等方面进行比较。实验结果表明:基于情感得分加权的Sword2vect算法精确度较word2vect词向量算法精确度提升了10%~20%,相比于tf_idf特征词向量精度提升了20%~30%,Sword2vect算法的时间效率较其他2个算法也得到了较大的提升。 展开更多
关键词 情感分析 word2vect 支持向量机 情感词向量
下载PDF
基于统计语言模型改进的Word2Vec优化策略研究 被引量:13
5
作者 张克君 史泰猛 +1 位作者 李伟男 钱榕 《中文信息学报》 CSCD 北大核心 2019年第7期11-19,共9页
该文从训练词向量的语言模型入手,研究了经典skip-gram、CBOW语言模型训练出的词向量的优缺点,引入TFIDF文本关键词计算法,提出了一种基于关键词改进的语言模型。研究发现,经典skip-gram、CBOW语言模型只考虑到词本身与其上下文的联系,... 该文从训练词向量的语言模型入手,研究了经典skip-gram、CBOW语言模型训练出的词向量的优缺点,引入TFIDF文本关键词计算法,提出了一种基于关键词改进的语言模型。研究发现,经典skip-gram、CBOW语言模型只考虑到词本身与其上下文的联系,而改进的语言模型通过文本关键词建立了词本身与整个文本之间的联系,在词向量训练结果的查准率和相似度方面,改进模型训练出的词向量较skip-gram、CBOW语言模型有一个小幅度的提升。通过基于维基百科1.5GB中文语料的词向量训练实验对比后发现,使用CBOW-TFIDF模型训练出的词向量在相似词测试任务中结果最佳;把改进的词向量应用到情感倾向性分析任务中,正向评价的精确率和F1值分别提高了4.79%、4.92%,因此基于统计语言模型改进的词向量,对于情感倾向性分析等以词向量为基础的应用研究工作有较为重要的实践意义。 展开更多
关键词 词向量 统计语言模型 tfidf 文本关键词 CBOW-tfidf
下载PDF
融合深度特征的Sword2vect商品在线评价情感分析 被引量:1
6
作者 厍向阳 杨瑞丽 《计算机应用与软件》 北大核心 2020年第6期212-217,共6页
商品在线评论情感分析已经成为一个热门的研究话题。为了更好地解决情感分析中词语的上下文信息、深度信息和情感信息缺失问题,提出一种融合深度特征的Sword2vect情感分析方法。用情感得分加权word2vect词向量得到含有上下文和情感信息... 商品在线评论情感分析已经成为一个热门的研究话题。为了更好地解决情感分析中词语的上下文信息、深度信息和情感信息缺失问题,提出一种融合深度特征的Sword2vect情感分析方法。用情感得分加权word2vect词向量得到含有上下文和情感信息的Sword2vect;基于注意力的长短期记忆神经网络得到深度特征AttBilstm;融合深度特征的Sword2vect进行情感分析。在深度学习框架tensorflow进行实验并与已有的方法在准确率、召回率、F1等评价指标上进行比较,验证了该算法的有效性。 展开更多
关键词 情感分析 word2vect 支持向量机 情感词向量 长短期记忆神经网络
下载PDF
基于自适应中文分词和近似SVM的文本分类算法 被引量:21
7
作者 冯永 李华 +1 位作者 钟将 叶春晓 《计算机科学》 CSCD 北大核心 2010年第1期251-254,293,共5页
中文分词的难点在于处理歧义和识别未登录词,传统字典的匹配算法很大程度上是依靠字典的代表性而无法有效地识别新词,特别是对于各种行业领域的知识管理。基于二元统计模型的分词算法能很好地适应不同的语料信息,且时间和精度都能满足... 中文分词的难点在于处理歧义和识别未登录词,传统字典的匹配算法很大程度上是依靠字典的代表性而无法有效地识别新词,特别是对于各种行业领域的知识管理。基于二元统计模型的分词算法能很好地适应不同的语料信息,且时间和精度都能满足文本知识管理的应用需要。近似支持向量机是将问题归结成仅含线性等式约束的二次规划问题,该算法的时间复杂度和空间复杂度比传统SVM算法的均有降低。在利用自适应分词算法进行分词的基础上,再利用近似支持向量机进行文本分类。实验表明,该方法能够自动适应行业领域的知识管理,且满足文本知识管理对训练时间敏感和需要处理大量文本的苛刻环境要求,从而具备较大的实用价值。 展开更多
关键词 自适应中文分词 近似支持向量机 文本分类 知识管理
下载PDF
基于排序式SVM的搜索自适应排序系统实现 被引量:2
8
作者 薛晓慧 芮光辉 +1 位作者 李炜东 袁培森 《计算机技术与发展》 2021年第10期203-208,214,共7页
随着社会信息化的程度不断提高,搜索引擎作为广泛使用的信息检索工具,用户对于搜索引擎智能化和个性化的需求不断提高,其中元搜索引擎由于能够整合多个独立型搜索引擎的结果而被广泛研究。为了解决当前元搜索引擎信息覆盖率不足和查准... 随着社会信息化的程度不断提高,搜索引擎作为广泛使用的信息检索工具,用户对于搜索引擎智能化和个性化的需求不断提高,其中元搜索引擎由于能够整合多个独立型搜索引擎的结果而被广泛研究。为了解决当前元搜索引擎信息覆盖率不足和查准率不高的问题,并为用户提供个性化和智能化的搜索结果,设计并实现了一个网页个性化搜索自适应排序系统。该系统基于元搜索引擎,针对中文语境,利用ICTCLAS中文分词方法和TF-IDF算法,选取若干常用独立型搜索引擎计算相似度并合并搜索结果,再基于Ranking SVM排序学习方法,对合并后的结果进行重排序得到个性化的搜索结果。利用Java和JSP实现上述系统并测试,实验结果表明该系统在中文语境下能对多个独立型搜索引擎的结果进行整合,能对整合结果进行个性化的重排序。 展开更多
关键词 信息检索 元搜索引擎 分词处理 关键字提取 Ranking svm
下载PDF
基于SVM的生物医学事件触发词识别研究 被引量:2
9
作者 魏培文 段德全 +1 位作者 孙印杰 毛文涛 《信阳师范学院学报(自然科学版)》 CAS 北大核心 2015年第3期446-449,共4页
研究了基于支持向量机(Support Vector Machine,SVM)方法下的生物医学事件触发词识别的问题.利用SVM对事件抽取的过程进行分类,建立相应的模型来对生物医学事件中的触发词进行识别,得到了相应的实验结果,并验证了此方法的可行性.
关键词 支持向量机(svm) 生物医学 事件抽取 触发词识别
下载PDF
基于SVM的词频统计中文分词研究 被引量:10
10
作者 朱小娟 陈特放 《微计算机信息》 北大核心 2007年第30期205-207,共3页
本文详细介绍SVM(支持向量机)在词频统计中文分词中的应用。可将输入的连续字串进行分词处理,输出分割后的汉语词串,一般为二字词串,并得到一个词典。词典中不重复地存储了每次处理中得到的词语,以及这些词语出现的频率。选用了互信息... 本文详细介绍SVM(支持向量机)在词频统计中文分词中的应用。可将输入的连续字串进行分词处理,输出分割后的汉语词串,一般为二字词串,并得到一个词典。词典中不重复地存储了每次处理中得到的词语,以及这些词语出现的频率。选用了互信息原理进行统计。并采用SVM算法,分词的准确性与传统相比有了很大的提高,并具有一定的稳定性。 展开更多
关键词 中文分词 词频统计 互信息 支持向量机
下载PDF
PSO-SVM算法在智能建筑环境监控系统中的应用 被引量:9
11
作者 傅军栋 邹欢 康水华 《华东交通大学学报》 2016年第1期121-127,共7页
针对智能建筑环境监控系统中,多个传感器独立工作可能会造成系统误判的问题,提出了一种基于粒子群优化支持向量机(PSO-SVM)的环境质量综合评价模型,即利用粒子群算法快速优化支持向量机的惩罚参数和核函数参数,然后采用Zig Bee无线传感... 针对智能建筑环境监控系统中,多个传感器独立工作可能会造成系统误判的问题,提出了一种基于粒子群优化支持向量机(PSO-SVM)的环境质量综合评价模型,即利用粒子群算法快速优化支持向量机的惩罚参数和核函数参数,然后采用Zig Bee无线传感网络采集的环境数据对PSO-SVM分类模型进行训练和测试。实验结果表明PSO-SVM分类器对环境质量判断的平均精度达到94.44%,且分类结果稳定。将这种方法应用于智能建筑环境监控系统中,可以增加系统监测数据的准确性,提高系统工作的可靠性。 展开更多
关键词 环境监控 多传感器 粒子群优化 支持向量机
下载PDF
SVM和RNN在网络评论情感分析中的比较研究 被引量:3
12
作者 吴国栋 刘国良 +1 位作者 张凯 涂立静 《上海工程技术大学学报》 CAS 2019年第4期378-383,共6页
随着电子商务的迅猛发展,网络评论情感分析研究日益受到重视.分别从传统的机器学习模型和深度学习模型视角,运用支持向量机(Support Vector Machine,SVM)和循环神经网络(Recurrent Neural Network,RNN)方法对向量化表示后的网络评论文... 随着电子商务的迅猛发展,网络评论情感分析研究日益受到重视.分别从传统的机器学习模型和深度学习模型视角,运用支持向量机(Support Vector Machine,SVM)和循环神经网络(Recurrent Neural Network,RNN)方法对向量化表示后的网络评论文本进行情感倾向的学习分析.研究表明,在精确率、召回率及F1等评价指标方面,基于RNN模型的评论情感分析效果明显优于SVM模型.该结果可以帮助消费者更好进行网络消费决策. 展开更多
关键词 支持向量机 循环神经网络 评论文本 情感分析 词向量
下载PDF
基于主动学习的SVM评论内容分类算法的研究 被引量:6
13
作者 段友祥 张晓天 《计算机与数字工程》 2022年第3期608-612,共5页
随着信息时代的到来,互联网平台上的文本数据开始爆发式增长,其中难免夹杂着一些不法数据。这些数据往往隐藏在海量数据中,因此给平台检索这些不法数据增加了难度。在这种情况下再用传统的文本分类方法已经不能满足需求了。因此论文根... 随着信息时代的到来,互联网平台上的文本数据开始爆发式增长,其中难免夹杂着一些不法数据。这些数据往往隐藏在海量数据中,因此给平台检索这些不法数据增加了难度。在这种情况下再用传统的文本分类方法已经不能满足需求了。因此论文根据文本数据的特点提出了基于主动学习的SVM评论内容分类方法,该方法使用主动学习的思想将敏感词向量、k-means聚类算法和SVM分类算法结合在一起,在使用更少训练集的基础上提高文本分类的准确率。实验结果表明,使用论文提出的方法对文本进行分类,在分类时间和结果准确率方面上都得到了一定程度的提高。 展开更多
关键词 文本分类 主动学习 K-MEANS svm 敏感词向量
下载PDF
超像素词包模型与SVM分类的图像标注 被引量:3
14
作者 於敏 于凤芹 陈莹 《传感器与微系统》 CSCD 2016年第12期63-65,共3页
为了改善基于词包模型与支持向量机(SVM)分类一幅图对应一个标签的单标签分类问题,提出了一种基于超像素词包模型与SVM分类的图像标注算法。将超像素分割结果作为词包模型的基本单元,用词包模型生成的视觉词汇表示超像素区域特征,保留... 为了改善基于词包模型与支持向量机(SVM)分类一幅图对应一个标签的单标签分类问题,提出了一种基于超像素词包模型与SVM分类的图像标注算法。将超像素分割结果作为词包模型的基本单元,用词包模型生成的视觉词汇表示超像素区域特征,保留了图像中的同质区域,很好地利用了图像的区域特征。仿真结果表明,该方法能有效改善基于词包模型与SVM分类的单标签分类问题,且分类的准确性有所提高。 展开更多
关键词 超像素分割 词包模型 支持向量机分类 视觉词汇 图像分类 图像标注
下载PDF
基于PSO-SVM的普米语语谱图识别 被引量:5
15
作者 杨花 江涛 +3 位作者 董华珍 陈绍雄 傅美君 潘文林 《云南民族大学学报(自然科学版)》 CAS 2018年第5期439-443,共5页
使用基于粒子群算法优化支持向量机识别算法实现对普米语语音的识别.首先通过傅立叶变换绘制出每条普米语语料的语谱图;再次,提取每张语谱图的图像特征构建特征向量;最后,运用支持向量机实现对普米语孤立词的分类.在运用支持向量机进行... 使用基于粒子群算法优化支持向量机识别算法实现对普米语语音的识别.首先通过傅立叶变换绘制出每条普米语语料的语谱图;再次,提取每张语谱图的图像特征构建特征向量;最后,运用支持向量机实现对普米语孤立词的分类.在运用支持向量机进行分类时,为了能够找到全局最优解,使用粒子群算法对支持向量机中的惩罚参数c和核函数参数g进行了优化,基于最优参数的分类准确率达到了89. 8%. 展开更多
关键词 普米语 直方图均衡化 粒子群算法(PSO) 支持向量机(svm)
下载PDF
一种基于SVM和规则消除组合型歧义的算法 被引量:2
16
作者 刘禹孜 何中市 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第10期50-53,共4页
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类... 歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径. 展开更多
关键词 自然语言处理 中文分词 组合型歧义 支持向量机 规则
下载PDF
基于卷积神经网络的SVM疾病症状分类模型 被引量:5
17
作者 张强强 苏变萍 李敏 《传感器与微系统》 CSCD 2020年第3期64-67,71,共5页
为解决疾病症状分类时传统特征提取方法存在特征维度较高和数据稀疏的问题,以及结合卷积神经网络(CNN)和支持向量机(SVM)的优势,提出了一种基于卷积神经网络的SVM疾病症状分类模型。用Skip-Gram根据维基中文语料库训练词向量,构成疾病... 为解决疾病症状分类时传统特征提取方法存在特征维度较高和数据稀疏的问题,以及结合卷积神经网络(CNN)和支持向量机(SVM)的优势,提出了一种基于卷积神经网络的SVM疾病症状分类模型。用Skip-Gram根据维基中文语料库训练词向量,构成疾病症状文本二维特征矩阵,即卷积神经网络的输入层;通过卷积层提取文本特征,使用1-max pooling策略在池化层得到文本的局部最优特征;将局部最优特征组成融合特征向量作为SVM分类器的输入得到分类结果。经过与传统特征提取算法和CNN算法的实验结果的对比,验证了提出的模型在准确率、召回率和F1三个评价指标上均有显著提高。 展开更多
关键词 疾病症状分类 词向量 卷积神经网络 支持向量机 Skip-Gram模型
下载PDF
基于词向量与SVM的移动机器人自然语言导航指令识别 被引量:2
18
作者 王思远 王恒升 刘通 《计算机与现代化》 2017年第9期24-28,55,共6页
针对基于自然语言指令的移动机器人导航控制中导航指令识别这一问题,尝试以词向量和支持向量机(SVM)相结合的方式解决。利用Skip-gram训练具有导航特性的语言模型。将语言模型生成的词向量利用Skip-gram模型的加法组合运算特性进行特征... 针对基于自然语言指令的移动机器人导航控制中导航指令识别这一问题,尝试以词向量和支持向量机(SVM)相结合的方式解决。利用Skip-gram训练具有导航特性的语言模型。将语言模型生成的词向量利用Skip-gram模型的加法组合运算特性进行特征融合生成特征向量,特征向量作为SVM模型的特征输入,完成自然语言的导航指令识别任务。本文方法克服了人工定义SVM模型的特征向量繁琐及覆盖不全的问题。实验结果表明,本文方法具有较好的分类效果,平均F1值提高了2%。 展开更多
关键词 词向量 支持向量机 自然语言处理 移动机器人导航
下载PDF
基于PCA-SVM算法的酒店评论文本情感分析研究 被引量:3
19
作者 王大伟 周志玮 曹红根 《现代计算机》 2019年第21期13-17,49,共6页
针对当前文本情感分析精度不高的问题,提出将PCA-SVM算法应用于文本分析。为了减少样本训练的负担,评论文本经过预处理、分词、去停用词和提取特征词向量以后,通过PCA算法对文本词向量进行降维,在降低维度的同时,可以最大限度得保留样... 针对当前文本情感分析精度不高的问题,提出将PCA-SVM算法应用于文本分析。为了减少样本训练的负担,评论文本经过预处理、分词、去停用词和提取特征词向量以后,通过PCA算法对文本词向量进行降维,在降低维度的同时,可以最大限度得保留样本的原始数据特征。分别使用Naive Bayes算法、Logistic Regression算法以及SVM算法作为文本分类模型,对三种不同算法场景下的Accuracy和AUC两个指标参数做分析对比,实验结果表明PCA-SVM算法在中文文本情感分析领域具有一定的优势。 展开更多
关键词 分词 词向量 PCA svm 情感分析
下载PDF
基于SVM的中文垃圾邮件预测系统研究 被引量:5
20
作者 徐娟 卞良 《数字技术与应用》 2020年第1期38-39,共2页
为有效拦截、过滤垃圾邮件,本文研究基于SVM的中文垃圾邮件过滤技术。经测试实验表明,该方法能够有效的预测中文垃圾邮件,在准确率、精度、召回率方面表现较优。
关键词 支持向量机算法 中文垃圾邮件预测 中文分词
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部