-
题名面向用户行为的页面质量评估
- 1
-
-
作者
王晓光
刘奕群
金奕江
岑荣伟
马少平
茹立云
-
机构
清华大学计算机系智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)
-
出处
《计算机科学与探索》
CSCD
2010年第7期589-598,共10页
-
基金
国家自然科学基金No.60736044
60903107
高等院校博士学科点专项科研基金No.20090002120005~~
-
文摘
页面质量评估在搜索引擎系统中具有极其关键的作用,传统的方法是基于页面链接关系进行页面质量评估。但由于当前Web环境的复杂性,传统方法已经难以适应当前的Web环境,近年来,用户行为被用来弥补完全依赖链接关系方法的不足。用户行为可以分为两类:浏览行为和搜索行为。利用浏览行为构造了用户浏览图;提出了一种利用用户搜索行为的新方法,此方法构造了用户搜索图;合并用户浏览图和用户搜索图得到用户浏览搜索图。实验表明用户浏览搜索图的性能比较接近用户浏览图的性能,并超过全网的性能,同时用户浏览搜索图能够评价的页面数要大于用户浏览图。
-
关键词
页面质量评估
用户行为
用户浏览图
用户搜索图
用户浏览搜索图
-
Keywords
page quality estimation
user behavior
user browsing graph
user searching graph
user browsing- searching graph
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种互联网新闻网页的采集分析方法
被引量:1
- 2
-
-
作者
吴定明
赵东岩
-
机构
北京大学计算机研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第36期169-172,共4页
-
基金
国家部委"十一五"预研项目(the Pre-Research Project of the"Eleventh Five-Year-Plan"of China Ministries and Commissions No.2006BAH02A10)
-
文摘
设计了一种采集分析互联网新闻网页的方法。该方法根据给定的新闻网站的入口地址在网络上找出所有的相关链接;区分这些链接所指向的页面特征,过滤掉相关性不大的内容,提取所有新闻网页的链接;进而进行多层次链接分析,根据新闻的图片、标题字体属性及日期,采用NewsPageRank算法计算每个新闻链接的权重。测试结果表明该方法对Internet上的新闻站点普遍具有较好的分析效果,性能可以满足实用要求。
-
关键词
链接分析
页面评估
互联网
网页采集
链接识别
链接权重
网页权重分析
新闻网页
-
Keywords
analyze hyperlinks
PageRank
Internet
collect web pages
identify hyperlinks
hyperlink weight
analyze page weight
news page
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-