一种利用相邻页面信息修正分类结果的方法
摘要
提出一种利用相邻网页信息修正分类结果的方法。这种方法首先利用NaiveBayes分类器分类待分类网页;其次对待分类网页做链接分析并计算页面与链出页面的相似度,对初始分类结果做修正,得到最终分类结果。根据该方法实现了网页自动分类原型系统,并进行分类实验,实验表明该方法有效提高了分类性能。
出处
《福建电脑》
2008年第4期78-79,共2页
Journal of Fujian Computer
参考文献7
-
1冯是聪,单松巍,龚笔宏,张志刚,李晓明.“天网”目录导航服务研究[J].计算机研究与发展,2004,41(4):653-659. 被引量:8
-
2Dou Shen;Sun Jiantao;Qiang Yang.A comparison of implicit and explicit links for Web page classification,2006.
-
3Joachims T;Cristianini N;Shawe-Taylor J.Composite kemels for hypertext categorisation,2001.
-
4Shih LK;Karger DR.Using URLs and table layout for Web classification tasks,2004.
-
5Glover EJ;Tsioutsiouliklis K;Lawrence S;Pennock DM,Flake GW.Using web structure for classifying and describing Web pages,2002.
-
6Yang Y;Alattery S;Ghani R.A study of approaches to hypertext categorization,2002(2-3).
-
7Oh HJ;Myaeng SH;Lee MH.A practical hypertext categorization method using links and incrementally available class information,2000.
二级参考文献10
-
1WebInfomallWebsitshttp://net.cs.pku.edu.cn/-webg/infomall/index.html . 2002
-
2TianwangsearchengineWebsits http://e.pku.edu.cn . 1997
-
3http://cn.yahoo.com . 2003
-
4YYang,XLiu.Are examinationoftextcategorizationmethods[].ACMSIGIRConfonResearchandDevelopmentinInformationRetrieval.1999
-
5FengShicong,ShanSongwei,ZhangZhigongetal.AdatasetofChineseWebpagesanditscategorization[].ProcoftheCross straitInformationTechnologyWorkshop.2002
-
6YYang,JanOPedersen.Acomparativestudyonfeatureselectionintextcategorization[].ThethInt’’lConfonMachineLearning.1997
-
7YYang.Astudyonthresholdingstrategiesfortextcategoriza tion[].ACMSIGIRConfonResearchandDevelopmentinInforma tionRetrieval.2001
-
8SChakrabarti.Dataminingforhypertext:Atutorialsurvey[].ACMSIGKDDExplorations.2000
-
9LeiMing,WangJianyong,ChenBaojueetal.Improvedrele vancerankinginwebgather[].JournalofComputerScienceandTechnology.2001
-
10WangJianyong,ShanSongwei,LeiMingetal.Websearchen gine:Characteristicsofuserbehaviorsandtheirimplication[].Sci enceinChinaSeriesF.2001
共引文献7
-
1刘华.超大规模分类语料库构建[J].现代图书情报技术,2006(1):71-73. 被引量:6
-
2谷峰,刘晨曦,吴扬扬.基于序列数据挖掘的中文网页特征选择方法[J].山东大学学报(理学版),2006,41(3):97-100. 被引量:2
-
3刘华.网页信息抽取及建库系统C#实现[J].计算机工程,2006,32(16):49-51. 被引量:5
-
4魏丽霞,郑家恒.基于网页文本结构的网页去重[J].计算机应用,2007,27(11):2854-2856. 被引量:13
-
5郭淼霞,吴扬扬.基于Web超链接结构信息的网页分类技术研究[J].泉州师范学院学报,2008,26(4):25-29. 被引量:4
-
6张爱华,荆继武,向继.中文文本分类中的文本表示因素比较[J].中国科学院研究生院学报,2009,26(3):400-407. 被引量:5
-
7余一骄,刘芹.基于语义的中文网页检索[J].计算机科学,2012,39(8):79-87. 被引量:4
-
1陈佳,张燕.基于LPC1768的九轴传感器角度修正系统的设计[J].电脑知识与技术(过刊),2015,21(10X):170-171.
-
2郭淼霞,吴扬扬.基于Web超链接结构信息的网页分类技术研究[J].泉州师范学院学报,2008,26(4):25-29. 被引量:4
-
3谭艳霞,徐珂.基于大型网站的搜索引擎网页更新方法研究[J].微计算机信息,2005,21(12X):125-126. 被引量:4
-
4景哲.一种改进的RSSI井下定位算法[J].测试技术学报,2013,27(5):440-443. 被引量:2
-
5方家豪,叶欣,董伟,盛鑫军,朱向阳.基于加速度信息修正的四旋翼位置估计算法研究[J].传感技术学报,2016,29(11):1684-1691. 被引量:5
-
6廖周宇,王钰婷,唐凤仙.基于像素邻域信息噪声修正的FCM图像分割算法[J].软件导刊,2015,14(8):199-201. 被引量:1
-
7周军,何力,韩伟红,邓璐.基于机器学习的中文评论倾向性分类实证研究[J].信息网络安全,2013(10):164-166. 被引量:2
-
8葛琦,韦志辉,张建伟,冯灿,詹天明.结合改进FCM算法的多相位CV模型[J].中国图象图形学报,2011,16(4):547-553. 被引量:8
-
9王爱丽,董宝田,孙远运,武威.基于联合多特征直方图的Mean Shift行人跟踪方法研究[J].铁道学报,2016,38(12):76-85. 被引量:3
-
10田斌,田红心,易克初.一种改进的汉语N元文法统计语言模型[J].西安电子科技大学学报,2000,27(1):62-64. 被引量:3