1
Web页面清洗技术的研究与实现
周源远
王继成
郑刚
张福炎
《计算机工程》
CAS
CSCD
北大核心
2002
20
2
Web页面中文文本主题的自动提取研究
韩客松
王永成
滕伟
《情报学报》
CSSCI
北大核心
2001
12
3
基于Web的新闻文本分类技术的研究
胡凌云
胡桂兰
徐勇
李龙澍
《安徽大学学报(自然科学版)》
CAS
北大核心
2010
7
4
基于PageRank和锚文本的网页排序研究
刘菁菁
林鸿飞
赵晶
《计算机工程与应用》
CSCD
北大核心
2007
6
5
一种Web文本的自动提取方法
印国成
孙茂圣
《江苏科技大学学报(自然科学版)》
CAS
北大核心
2010
1
6
基于用户搜索意图的Web网页动态泛化
王大玲
于戈
鲍玉斌
张沫
沈洲
《软件学报》
EI
CSCD
北大核心
2010
14
7
基于Java Applet与servlet通信技术的Web文本页面保护方法
唐建平
刘晓玲
《内蒙古大学学报(自然科学版)》
CAS
CSCD
北大核心
2003
0
8
基于文本分类的林业Web黄页分类系统
王欢
武刚
杨抒
《计算机系统应用》
2012
2
9
基于叠加编码的Web网页抓取路径损耗估计
邢计亮
《科技通报》
北大核心
2015
1
10
支持维、哈、柯文的Web浏览器的研究与实现
李端端
吾守尔.斯拉木
艾尼宛尔.托乎提
《新疆大学学报(自然科学版)》
CAS
2014
0
11
一种基于自动WEB数据抽取生成黄页的方法
扬抒
陈尚安
武刚
《微计算机信息》
2010
0
12
基于Python爬虫技术的网页内容文本大数据提取方法研究
党浩予
《电脑与电信》
2023
0
13
基于内容相似度的网页正文提取
王利
刘宗田
王燕华
廖涛
《计算机工程》
CAS
CSCD
北大核心
2010
20
14
基于SVM的中文网页分类方法的研究
牛强
王志晓
陈岱
夏士雄
《计算机工程与设计》
CSCD
北大核心
2007
22
15
基于正文结构和长句提取的网页去重算法
黄仁
冯胜
杨吉云
刘宇
敖民
《计算机应用研究》
CSCD
北大核心
2010
13
16
一种基于预分类的高效SVM中文网页分类器
许世明
武波
马翠
邸思
徐洪奎
杜如虚
《计算机工程与应用》
CSCD
北大核心
2010
19
17
基于改进K最近邻分类算法的不良网页并行识别
徐雅斌
李卓
陈俊伊
《计算机应用》
CSCD
北大核心
2013
6
18
基于Lucene的中文全文检索系统的研究与设计
索红光
孙鑫
《计算机工程与设计》
CSCD
北大核心
2008
6
19
基于支持向量机的中文网页自动分类
贾泂
梁久祯
《计算机工程》
EI
CAS
CSCD
北大核心
2005
12
20
一种改进的页面相似性度量方法
张霞
王建东
顾海花
《计算机工程与应用》
CSCD
北大核心
2010
4