一种基于ANN的智能网页信息过滤模型

An Intelligent Model of Information Filtering Based on Artificial Neural Networks

下载PDF

导出

摘要设计一个针对网络不良信息的智能信息过滤模型,通过对特征提取常用方法的研究,选择文档频率阈值、x2-统计量和人工提取相结合的方法来进行特征提取,并利用VSM方法来表示文本;同时提出创建主词典和同、近义词两个词典来作为特征词典,既降低向量空间维数,又提高了特征提取的准确率,利用KSOM网络来训练文本分类机。 Designs an adaptive webpages information filtering model for the harmful information in the webpages, selects a document frequency （DF）, x2-statistic extraction and the combination of manual extraction methods for feature extraction, and expresses the texts by Vector Space Model （VSM）. At the same time, proposes to create major dictionary and synonym and near-synonym dictionary as characteristic word dictionary. In this way, it can not only reduce the dimension of vector space, but also increase rate of accuracy in feature extraction, achieves the feature selection of the training texts, and trains a text automatic classification based on KSOM.

作者葛萌欧阳宏基刘敏娜

机构地区咸阳师范学院信息工程学院

出处《现代计算机》 2009年第9期18-21,共4页 Modern Computer

关键词信息过滤神经网络文本分类 Information Filtering Artificial Neural Networks Text Categorizing

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1叶微.连续输入的SOM算法的权值收敛性[J].陕西师范大学学报（自然科学版）,2001,29(3):24-26. 被引量：2
2梅海燕.信息过滤问题的研究[J].现代图书情报技术,2002(2):44-47. 被引量：36
3Belkin N, Croft WB. Information Filtering and Information Retrieval,Two Sides of the Same Coin. Communications of the ACM,Dec.1992,v35 ,n12:p.29-39.
4李嘉佑,何清,史忠植.机器学习与网络信息处理[J].计算机工程与应用,2004,40(33):189-191. 被引量：3
5刁倩,王永成,张惠惠,何骥.文本自动分类中的词权重与分类算法[J].中文信息学报,2000,14(3):25-29. 被引量：27
6Rocchio J.Relevance Feedback in Information Retrieval [A]. The Smart Retrieval System:Experiments in Automatic Document Processing[C].Englewood Cliffs,NJ:Prentice-Hall Inc,1997 : 313-323.
7鲁松,李晓黎,白硕,王实.文档中词语权重计算方法的改进[J].中文信息学报,2000,14(6):8-13. 被引量：120
8D Freitag. Machine Learning for Information Extraction in Information Domains. Machine Learning,2000,39(2-3) : 169-272.
9Saton G,Wong A,Yang CS. A Vector Space Model for Automatic Indexing. Communications of ACM, 1975,18 (11) :613-620.

二级参考文献14

1高文刘峰等.数字图书馆－－原理与技术实现[M].清华大学出版社,..
2[1]Warren R Greiff. A Theory of Term Weighting Based on Exploratory Data Analysis, www. cs. umass.edu/～ greiff/
3[2]Kaski S, Lagus K, Honkela T et al. Statistical Aspects of the WFEBSOM System in Organizing Document Collections. Computer Science and Statistics, 1998, (29) :281 - 290
4Yang Yiming，ProceedingsoftheSeventeenthInternationalACMSIGIRConferenceonResearchandDevelopme，1994年，12页
5Lin Siming，Neural Computer，1998年，10期，807页
6Chen H,Schuffels C ,Orwig R.Internet Categorization and Search:A Self-Organizing Approach[J].Journal of Visual Communication and Image Representation, 1996 ;7 ( 1 ): 88～102
7E Bonabeau ,M Dorigo ,G Theraulaz. Inspiration for optimization from social insect behaviour[J].Nature,2000;406(6)
8J Kennedy,R C Eberhart. Swarm Intelligence[M].Morgan Kaufmann Publishers, 2000
9Zhongzhi Shi,Bin Wu,Qing He et al. IDSIS:Intelligent Document Semantic Indexing System[C].In:The 17th IFIP World Computer Congress, Montreal, 2002
10Ziyan Jia,Qing He,Haijun Zhang et al.Special Topic Organization and Retrieval System[C].In :International Conference on Intelligent Information Technology, Beijing, 2002

共引文献182

1周延泉,张传福,张瑞华,李蕾,何华灿.移动个性化信息服务中的用户兴趣模型[J].北京邮电大学学报,2006,29(z2):144-147. 被引量：1
2贺国旗,张强.基于用户模型的文献检索研究[J].雁北师范学院学报,2002,18(5):29-32. 被引量：1
3王洪,贾惠波,徐端颐.基于中文学术期刊人工标引的自动分类新算法[J].现代图书情报技术,2002(S1):59-62. 被引量：1
4李渝勤,孙丽华.基于规则的自动分类在文本分类中的应用[J].中文信息学报,2004,18(4):9-14. 被引量：20
5董超峰,杨跃龙.信息过滤与信息流通研究[J].商业文化（学术版）,2009,0(8):342-343.
6王小云.基于知识服务过程中的分类研究[J].现代情报,2004,24(7):187-189. 被引量：1
7邵晓良,刘红.Web信息采集中军事主题信息的识别[J].情报杂志,2004,23(7):14-16. 被引量：2
8李国臣,段建勇.基于语法语义信息量化模型的语素字再分类[J].计算机工程,2004,30(11):37-39.
9许增福,梁静国,田晓宇.基于FVSM和自组织映射网络的Web文本自动分类方法[J].哈尔滨工业大学学报,2004,36(9):1168-1172. 被引量：2
10胡卓颖,徐可,万中英,陆玉昌,丁树良.专题型网页搜集系统的设计与实现[J].计算机与现代化,2004(10):1-5.

1周祥,郑应平,王令群.一种基于Web服务的网页智能推荐方法[J].计算机应用研究,2006,23(9):46-48.
2赵文清,朱永利,高伟华.一个基于决策粗糙集理论的信息过滤模型[J].计算机工程与应用,2007,43(7):185-187. 被引量：15
3崔虹燕.基于安全审计的网络信息过滤研究[J].兰州工业高等专科学校学报,2007,14(3):23-26. 被引量：1
4韩旭.探讨Internet网络安全的信息过滤模型[J].计算机光盘软件与应用,2013,16(22):165-166.
5迟学芝,董春玲,朱晓丽.基于BP神经网络与GA算法的信息过滤模型研究[J].信息技术与信息化,2007(3):81-83.
6夏文文,王士同.基于核的双自组织特征映射网络在预测中的应用[J].计算机工程与设计,2008,29(9):2324-2327.
7网页打印更节省智能网页打印功能，小窍门大省心[J].文明,2007(11):144-144.
8吕滨,雷国华,于燕飞,杨泽雪,王亚东.基于语义分析的网络不良信息过滤系统研究[J].计算机应用与软件,2010,27(2):283-285. 被引量：7
9迟学芝,朱晓丽,赵志刚.基于BP人工神经网络的信息过滤技术研究[J].电脑开发与应用,2007,20(6):58-60. 被引量：1
10张晓冬,张书杰,邢俊丽,李俊玉.关于信息过滤模型的探讨[J].计算机工程与应用,2002,38(5):99-100. 被引量：18

现代计算机

2009年第9期

浏览历史

内容加载中请稍等...

一种基于ANN的智能网页信息过滤模型

参考文献9

二级参考文献14

共引文献182

相关作者

相关机构

相关主题

浏览历史