期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于语义空间的支持向量机的文本过滤被引量：3

Text filtering based on support vector machine of semantic space

下载PDF

导出

摘要传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息,影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空间的支持向量机的文本过滤,用语义来表示文本和用户模板。该方法主要通过奇异值分解提取文本的潜在语义空间,在语义空间上训练支持向量机得到用户模板和过滤阈值,文本流上的文本映射到语义空间上,在语义空间上计算用户模板和新文本的相似度。实验表明:该方法的过滤性能可以达到 98. 67%。 Traditionally, text filtering based on support vector machine uses the vector space model to represent the text and user profile. Vector space model draws the noise into the system because it assumes that the word in the text is independent and it influences the performance of the filtering. The proposed method was based on vector support machine of semantic space in which text and user profile were represented by the semantic space. The proposed approach used the singular-value decomposition to derive a latent semantic space. User profile and filtering threshold could been got by training the support vector machine in the semantic space. And the similarity between the user profile and new text was computed by cosine measure, after the new text was mapped into the semantic space. Experimental results show that the filtering rate of our approach can get 98.67%.

作者沈丽虹周昌乐

机构地区浙江大学人工智能研究所厦门大学人工智能研究所

出处《计算机应用》 CSCD 北大核心 2005年第3期664-665,共2页 journal of Computer Applications

基金福建省科技计划重点资助项目(001J005)

关键词文本过滤奇异值分解支持向量机语义空间 text filtering singular value decomposition support vector machine semantic space

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1VapnikVN.统计学习理论的本质[M].北京：清华大学出版社,2000..
2BELKIN N, CROFT BW. Information filtering and information retrieval: two sides of the same coin?[J]. Communications of the ACM, 1992,35(12):29-38.
3JOACHIMS T. Text Categorization with Support Vector Machines: learning with many relevant features[A]. Proceedings 10th European Conference on Machine Learning[C], 1998.137-142.
4LEOPOLD E, KINDERMAN J. Text Categorization with Support Vector Machines, How to Represent Texts in Input Space?[J]. Machine Learning,1998, 46(1-3):423-444.
5DEERWESTER S, DUMAIS ST, FURNAS GW, et al. Indexing by Latent Semantic Analysis[J]. Journal of the American Society for Information Science, 1990, 41(6): 391-407.

共引文献170

1李盼池,许少华.支持向量机及其在复杂水淹层识别中的应用[J].计算机应用,2004,24(9):147-149. 被引量：18
2李忠伟,张健沛,张福顺,安辉.基于SVM的虚拟企业伙伴决策系统的设计与实现[J].计算机工程与应用,2004,40(19):198-199. 被引量：2
3张辉,张浩,徐征,陆剑峰.基于支持向量机的供应链伙伴企业选择方法的研究[J].计算机集成制造系统,2004,10(7):796-800. 被引量：10
4汪江,陆颂元.汽轮发电机组故障诊断GA-SVM模型方法的研究[J].汽轮机技术,2005,47(1):1-3. 被引量：6
5袁圣江.基于粗糙集和支持向量机的机械故障诊断系统[J].微机发展,2005,15(3):110-112. 被引量：4
6田雪,纪玉波,杨旭.基于支持向量机的自动人脸识别[J].计算机工程,2005,31(5):191-193. 被引量：3
7郑水波,唐厚君,韩正之,张勇.基于支持向量机的ESP系统传感器故障诊断方法[J].系统仿真学报,2005,17(3):682-684. 被引量：5
8郑水波,韩正之,唐厚君,张勇.最小二乘支持向量机在汽车动态系统辨识中的应用[J].上海交通大学学报,2005,39(3):392-395. 被引量：21
9杨一文,杨朝军.基于支持向量机的金融时间序列预测[J].系统工程理论方法应用,2005,14(2):176-181. 被引量：20
10缪科,张太镒,孙建成,汤少杰.正交频分复用系统非线性信道估计算法[J].西安交通大学学报,2005,39(6):637-640. 被引量：4

<12 3 4 5…17 >

同被引文献23

1陈治纲,何丕廉,孙越恒,郑小慎.基于向量空间模型的文本分类系统的研究与实现[J].中文信息学报,2005,19(1):36-41. 被引量：43
2张宏莉,翟健宏,胡铭曾.信息内容安全的主要技术及国内外对比[J].计算机教育,2005(1):74-76. 被引量：3
3庄慧娟,张仁津,林筑英.基于Agent的远程教学系统模型建构[J].现代教育技术,2004,14(6):55-58. 被引量：11
4杨红颖,王向阳,赵红.一种基于多Agent的远程教学模型框架[J].现代远距离教育,2005(2):53-57. 被引量：19
5李开荣,林颖,杭月芹.基于语义模型的文档特征提取[J].计算机工程与应用,2005,41(17):173-176. 被引量：2
6王云,史浩山,巩进生.一种基于Web的智能化远程教育系统[J].电化教育研究,2005,26(8):33-36. 被引量：8
7高小宇,高庆狮,胡玥,李莉.基于语义单元表示树剪枝的高速多语言机器翻译[J].软件学报,2005,16(11):1909-1919. 被引量：13
8贺卫红,曹毅.基于向量空间模型文本过滤算法[J].系统工程,2005,23(10):122-125. 被引量：3
9邹娟,周经野,邓成.一种基于语义分析的中文特征值提取方法[J].计算机工程与应用,2005,41(36):164-166. 被引量：6
10曾致远,张莉.基于向量空间模型的网页文本表示改进算法[J].计算机工程,2006,32(3):134-135. 被引量：10

引证文献3

1任佳,宋志鹏.基于Web的智能化远程教学系统研究[J].现代远距离教育,2006(2):71-73. 被引量：7
2高庆狮,李莉,刘宏岚.基于语义单元表示树剪枝的关键字过滤方法[J].北京科技大学学报,2006,28(12):1191-1195. 被引量：7
3许琦.一种基于知网的文档语义模型构建方法[J].中国科技资源导刊,2010,42(4):55-60.

二级引证文献14

1刘俊晓,孟祥增.视频的内容分析与检索技术及其教学应用[J].现代远距离教育,2006(5):24-26. 被引量：4
2胡玥,高小宇,高庆狮.多语言机译系统中高质量语义单元库形成方法[J].北京科技大学学报,2008,30(6):698-704. 被引量：1
3王岗.浅谈网络教育中现代教育技术的革新[J].甘肃广播电视大学学报,2008,18(3):76-77. 被引量：2
4徐丽.远程教学网络应用服务器端的体系结构设计[J].天津理工大学学报,2009,25(4):82-84. 被引量：2
5帅正化,周学广.中文网页内容柔性过滤器的研究与实现[J].计算机与数字工程,2009,37(11):108-110.
6汪霞,郑宁,徐明,陈默.基于中文变形词匹配的贝叶斯邮件过滤模型[J].计算机应用与软件,2010,27(1):105-107. 被引量：3
7骆万文,高飞,周学广.抗中文主动干扰关键词过滤研究综述[J].吉首大学学报（自然科学版）,2011,32(3):30-35.
8史建伟,邹霞.基于Agent技术的网络协作学习模式的构建[J].唐山师范学院学报,2012,34(5):50-53.
9冯锡炜,汪俭华,冯瑶,林培光.发布/订阅系统语义Web匹配算法[J].北京科技大学学报,2013,35(4):544-550. 被引量：4
10刘亚丹,古发辉.智能化远程继续教育系统的设计与实现[J].电子世界,2013(11):128-129. 被引量：1

1樊康新,邱建林,顾卫江.基于VSM的自适应信息过滤系统的研究与设计[J].计算机时代,2009(11):1-3. 被引量：2
2白秀伟,惠晓威.物联网中间件数据处理研究[J].计算机测量与控制,2012,20(7):1938-1940. 被引量：6
3郗君甫,刘国华,李金才,唐军军,祁瑞丽.面向top-K分级的数据库关键词查询系统体系结构[J].燕山大学学报,2010,34(1):67-73. 被引量：1
4白海燕,朱礼军.关联数据的自动关联构建研究[J].现代图书情报技术,2010(2):44-49. 被引量：36
5朱逢春.基于DOM树的网页去噪技术[J].电子制作,2015,23(8Z). 被引量：1
6刘颖.贝叶斯方法在文本分类预处理中的应用[J].电脑与信息技术,2010,18(6):26-27. 被引量：1
7欧家权.电子邮件目录收割攻击的防御[J].计算机与现代化,2012(8):51-54.
8梁建飞,吐尔根.依布拉音,田生伟,赛依旦.阿不力米提.汉维主题网页自动获取技术的研究[J].计算机应用与软件,2012,29(1):42-45. 被引量：2
9魏晓宁,朱巧明.基于Nave Bayes模型的垃圾邮件过滤方法[J].南通大学学报（自然科学版）,2008,7(1):54-57. 被引量：3
10鲍蕾,黄曙光,李永亮.基于商空间粒度合成的中文文本表示法[J].小型微型计算机系统,2011,32(12):2434-2438.

计算机应用

2005年第3期

职称评审材料打包下载

相关作者

相关机构

相关主题

;

使用帮助返回顶部