基于模糊相关的Web文档分类方法被引量：3

Classification Approach Based on Fuzzy Related Technology for Web Document

下载PDF

导出

摘要面对Internet上不断增长的巨大信息量,如何使用户获得有趣的和有用的信息已成为信息检索急需解决的问题。由于Web文档往往具有不确定的特征,使得利用模糊集合理论对信息检索过程的不确定性建立模型成为可能。文章提出了一种基于模糊相关技术的Web文档分类方法,实验结果表明,该方法比基于向量空间模型的Web分类方法有较高的分类精度。 Due to the explosive growth of available information on the WWW, it is not uncommon that the users on WWW often find themselves overwhelmed with the large amount of information that might be of their interest and usefulness. To alleviate this problem, there is a need for an intelligent tool to help the users screening and filtering for interesting and useful information. Web documents tend to have unpredictable characteristics. Motivated by these fuzzy characteristics, the fuzzy related technology in classifying Web documents into a predefined set of categories is adopted. The experimental results show that the approach yields higher classification accuracy compared to the vector space model.

作者雷景生

机构地区海南大学信息科学技术学院

出处《计算机工程》 EI CAS CSCD 北大核心 2005年第24期13-14,17,共3页 Computer Engineering

基金教育部重点资助项目海南省自然科学基金资助项目

关键词文本挖掘文档分类信息过滤 Text mining Document classification Information filtering

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1Wang J. A Survey of Web Caching Schemes for the Internet. ACM Comput. Commun. Rev.,1999, 29(5): 36-46.
2Cooley R, Mobasher B, Srivastava J. Web Mining: Information and Pattern Discovery on the World Wide Web. In: Proc. of 9^th IEEE Int.Conf. Tools Artif. Intell (ICTAI'97),1997-11:558-567.
3Salton G, Buckley C. Term-weighting Approaches in Automatic Text Retrieval. In: Inf. Proc. of Mgt.,1988:513-523.
4Ogawa Y, Morita T, Kobayashi K. A Fuzzy Document Retrieval System Using the Keyword Connection Matrix and a Learning Method. Fuzzy Sets Syst.,1991, 39 (7): 163-179.

同被引文献14

1董祥军,王淑静,宋瀚涛,陆玉昌.负关联规则的研究[J].北京理工大学学报,2004,24(11):978-981. 被引量：33
2易高翔,程耕国.数据挖掘在Web智能化中应用研究[J].计算机工程与设计,2005,26(1):58-60. 被引量：14
3马光志,张生庭.基于关联规则的Web文档分类[J].计算机工程与设计,2005,26(9):2515-2518. 被引量：8
4但微,才书训.电子商务中Web挖掘技术的应用探讨[J].计算机技术与发展,2006,16(1):207-209. 被引量：12
5张业鹏,张道德.贝叶斯算法在文本自动分类系统中的应用[J].计算机与现代化,2006(2):36-37. 被引量：4
6胡和平,易高翔.一种基于容错粗糙集的Web文档分类方法[J].小型微型计算机系统,2006,27(2):305-307. 被引量：3
7饶文碧,柯慧燕,张丽.一种扩展的基于VSM的Web文本分类算法[J].计算机应用与软件,2006,23(10):113-115. 被引量：2
8朱玉全,孙蕾,杨鹤标,宋余庆.基于频繁模式树的负关联规则挖掘算法[J].计算机工程,2006,32(22):51-52. 被引量：3
9徐春荣,欧阳为民,勾海波.Web文本分类及其阻塞减少策略[J].计算机应用与软件,2007,24(1):58-60. 被引量：1
10Greenstein M, Vasarhelyi M. Electronic Commerce: Security, Risk Management and Control[M]. Boston, USA: McGraw-Hill, 2002.

引证文献3

1汪志圣,李龙澍.Web文档分类方法的比较与分析[J].滁州学院学报,2007,9(6):33-35.
2王庆,王铮,汪定伟.Web挖掘在电子商务货源搜索中的应用[J].计算机工程,2008,34(11):197-199. 被引量：6
3石芙芙,董祥军,陈修宽.负关联规则在Web文档分类中的研究[J].信息化纵横,2009(13):1-3.

二级引证文献6

1霍亮,杨柳,张俊芝.客户行为的Web挖掘及个性化推荐[J].河北大学成人教育学院学报,2009,11(4):121-123.
2姜晓刚.农村图书馆检索系统研究[J].安徽农业科学,2010,38(13):7122-7123. 被引量：1
3于秀梅,张昕若.基于Web的电子商务系统的设计与实现[J].计算机与数字工程,2010,38(8):78-80. 被引量：4
4邹腊梅,龚向坚,欧阳利军.基于用户历史及兴趣度的HC-HITS算法研究[J].南华大学学报（自然科学版）,2013,27(2):54-57.
5张娴.从电子商务分类需求视角探讨数据挖掘技术的应用[J].信息通信,2013,26(7):147-147. 被引量：1
6吕刚.数据挖掘技术在当前电子商务实践中的运用[J].魅力中国,2010,0(7X):173-173.

1常小红,张明.基于RBFN的交互式图像检索方法[J].计算机技术与发展,2007,17(9):31-34. 被引量：2
2钱秋银,张正兰.一种基于多分类SVM的相关反馈图像检索方法[J].计算机技术与发展,2009,19(8):65-68. 被引量：3
3邢海燕,祝咏晨.基于模糊相关的文本特征选择方法[J].现代计算机,2008,14(12):86-88.
4邱云飞,王建坤,李雪,邵良杉.基于线性组合文本特征选择方法[J].计算机应用研究,2011,28(6):2099-2101. 被引量：4
5李斌.人机对话的信息系统:信息的检索和存取[J].管理观察,1997,0(11):49-49.
6汪小珍,李龙澍.基于模糊集的信息检索方法[J].计算机技术与发展,2010,20(2):37-39. 被引量：3
7吴进.基于FPGA的信息检索技术实现研究[J].微计算机信息,2008,24(14):190-191.
8赵正文,康耀红.统计语言模型在信息检索中的应用[J].计算机工程与应用,2006,42(36):158-161. 被引量：1
9刘俊熙.搜索引擎的搜索、索引和检索技术的关联分析[J].图书馆学研究,2005(9):84-86. 被引量：2
10林荣,姜云飞.基于特征模糊相关的特征聚类算法[J].现代计算机,2004,10(10):6-9.

计算机工程

2005年第24期

浏览历史

内容加载中请稍等...

基于模糊相关的Web文档分类方法被引量：3

参考文献4

同被引文献14

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于模糊相关的Web文档分类方法 被引量：3

参考文献4

同被引文献14

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于模糊相关的Web文档分类方法被引量：3