期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
基于改进朴素贝叶斯算法的主题网页识别的研究
下载PDF
职称材料
导出
摘要
主题网页识别是面向主题爬虫的重要组成部分,因此网页主题识别的准确率对后续的研究工作至关重要。首先,提取出能体现网页主题的文本,然后利用改进朴素贝叶斯算法对提取的文本的主题进行识别,结果表明该方法能取得较好的识别效果。
作者
马进
朱艳辉
刘璟
田海龙
机构地区
湖南工业大学计算机与通信学院
出处
《信息通信》
2018年第3期13-14,共2页
Information & Communications
关键词
主题网页
主题爬虫
朴素贝叶斯算法
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
引文网络
相关文献
节点文献
二级参考文献
62
参考文献
5
共引文献
281
同被引文献
0
引证文献
0
二级引证文献
0
参考文献
5
1
刘金红,陆余良.
主题网络爬虫研究综述[J]
.计算机应用研究,2007,24(10):26-29.
被引量:132
2
段晓丽,王宇,谷静,刘玮楠.
基于正文特征及网页结构的主题网页信息抽取[J]
.计算机工程与应用,2012,48(30):151-156.
被引量:10
3
任永功,杨荣杰,尹明飞,马名威.
基于信息增益的文本特征选择方法[J]
.计算机科学,2012,39(11):127-130.
被引量:31
4
李静梅,孙丽华,张巧荣,张春生.
一种文本处理中的朴素贝叶斯分类器[J]
.哈尔滨工程大学学报,2003,24(1):71-74.
被引量:76
5
程克非,张聪.
基于特征加权的朴素贝叶斯分类器[J]
.计算机仿真,2006,23(10):92-94.
被引量:40
二级参考文献
62
1
单丽莉,刘秉权,孙承杰.
文本分类中特征选择方法的比较与改进[J]
.哈尔滨工业大学学报,2011,43(S1):319-324.
被引量:25
2
黄玲,陈龙.
基于网页分块的正文信息提取方法[J]
.计算机应用,2008,28(S2):326-328.
被引量:13
3
张志刚,陈静,李晓明.
一种HTML网页净化方法[J]
.情报学报,2004,23(4):387-393.
被引量:57
4
王琦,唐世渭,杨冬青,王腾蛟.
基于DOM的网页主题信息自动提取[J]
.计算机研究与发展,2004,41(10):1786-1792.
被引量:81
5
李卫,刘建毅,何华灿,王枞.
基于主题的智能Web信息采集系统的研究与实现[J]
.计算机应用研究,2006,23(2):163-166.
被引量:15
6
胡国平,张巍,王仁华.
基于双层决策的新闻网页正文精确抽取[J]
.中文信息学报,2006,20(6):1-9.
被引量:16
7
赵欣欣,索红光,刘玉树.
基于标记窗的网页正文信息提取方法[J]
.计算机应用研究,2007,24(3):144-145.
被引量:33
8
M Pankaj and W W Benjamin. Artificial neural networks:concepts and theory[M]. Los Alamitos, Calif. : IEEE Computer Society Press,1992.
9
J R Quinlan. C4.5: programs for machine learning[M]. San Mateo, Calif. : Morgan Kaufmann Publishers,1993.
10
R O Duda, P E Hart, D G Stork. Pattern Classification(2nd Edition) [ M]. Wiley - Interscience. 2000.
共引文献
281
1
郑杏冉,黄卫东.
网民心理视角下突发公共事件情感主题研究[J]
.知识管理论坛,2024(1):93-107.
2
张继超,刘宁,宋伟东,李建飞.
一种特征选择的全极化雷达影像分类方法[J]
.测绘科学,2022,47(6):127-134.
被引量:3
3
刘颖.
浅析贝叶斯方法在文本分类中的应用[J]
.电脑知识与技术(过刊),2007(22):1074-1076.
4
赵志滨,贾岩峰,姚兰,鲍玉斌.
含有丰富结构化数据的Web页面分类技术的研究[J]
.计算机研究与发展,2013,50(S1):53-60.
被引量:5
5
吴艳,刘建波.
电子邮件自动处理的用户模型设计[J]
.沈阳化工学院学报,2005,19(4):289-291.
6
胡学钢,郭亚光.
一种基于粗糙集的朴素贝叶斯分类算法[J]
.合肥工业大学学报(自然科学版),2006,29(2):169-172.
被引量:11
7
周俐霞,何安元.
基于流量均衡的垃圾邮件过滤网关集群系统模型[J]
.盐城工学院学报(自然科学版),2006,19(1):23-27.
被引量:2
8
袁方,苑俊英.
基于类别核心词的朴素贝叶斯中文文本分类[J]
.山东大学学报(理学版),2006,41(3):111-114.
被引量:12
9
任喜峰.
基于朴素贝叶斯分类的考试成绩监测机制的研究[J]
.科技信息,2007(1):37-38.
被引量:1
10
任喜峰.
基于朴素贝叶斯分类的考试成绩监测机制研究[J]
.统计与决策,2007,23(22):163-164.
被引量:4
1
团中央:“中国扶贫助农公益行”活动启动[J]
.农家书屋,2017,0(9):5-5.
2
吴林,王永滨.
基于语义相似聚合的主题爬虫算法研究[J]
.中国传媒大学学报(自然科学版),2018,25(1):28-31.
3
葛召华,张中坤,李博.
基于知识图谱的水利数据垂直搜索应用[J]
.山东水利,2018(5):1-2.
被引量:4
4
张广德,于连城,张译,李金湖,徐欣杰.
基于数据挖掘的电网数据分析方法[J]
.国外电子测量技术,2018,37(7):24-28.
被引量:8
5
洛松求培,安见才让.
藏文网页主题爬虫系统的实现[J]
.电子技术与软件工程,2018(10):157-158.
6
张倩,林安成,廖秀秀.
自动结构化数据的电商网站主题爬虫研究[J]
.计算机系统应用,2018,27(7):90-95.
7
周雪,刘乃文.
引入主题链接块因子的候选链接搜索策略研究[J]
.计算机与数字工程,2018,46(5):874-878.
被引量:1
信息通信
2018年 第3期
职称评审材料打包下载
相关作者
内容加载中请稍等...
相关机构
内容加载中请稍等...
相关主题
内容加载中请稍等...
浏览历史
内容加载中请稍等...
;
用户登录
登录
IP登录
使用帮助
返回顶部