-
题名基于P2P网络模型的Web搜索引擎用户隐私保护
被引量:7
- 1
-
-
作者
徐洋
王鹏举
张焕国
谢晓尧
-
机构
贵州师范大学贵州省信息与计算科学重点实验室
武汉大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2016年第10期3057-3060,共4页
-
基金
国家重点基础研究发展计划资助项目(2014CB340600)
国家自然科学基金重点资助项目(61332019)
+3 种基金
贵州省基础研究重大项目(黔科合JZ字[2014]2001号)
黔科合人才团队项目((2012)4009)
贵州省科技合作计划重点项目(黔科合LH字[2015]7763号)
住房和城乡建设部科学技术计划项目(2016-K3-009)
-
文摘
针对网页搜索引擎(Web search engine,WSE)中存在侵犯用户隐私的问题,提出一种基于P2P网络模型的WSE前端用户隐私保护方案。利用P2P网络架构来将用户根据他们的爱好进行分组,并构建多层隐私保护机制,通过节点转发来提交用户查询,WSE只能获得一组查询的简要特征并提供相应的服务;同时保护诚实用户不被WSE暴露,并将自私用户暴露给WSE。实验结果表明,该方案能够很好地保护用户隐私,并提供良好的服务质量。
-
关键词
网络安全
网页搜索引擎
隐私保护
P2P网络
用户暴露
-
Keywords
network security
Web search engine(WSE)
privacy protection
P2P network
exposed user
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名搜索引擎垃圾网页技术的原理与类型
- 2
-
-
作者
王明宸
-
机构
成都树德中学外国语校区
-
出处
《技术与市场》
2016年第12期110-110,共1页
-
文摘
在互联网规模的增长下,搜索引擎也成为人们获取信息的一个工具,但是,搜索引擎的应用也存在各种弊端。针对搜索引擎垃圾网页技术的原理与类型进行分析。
-
关键词
搜索引擎垃圾网页技术
原理
类型
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名网上搜索如何加速
- 3
-
-
作者
马相才
-
出处
《中国数据通信》
2003年第5期117-118,共2页
-
文摘
网上的信息搜索技术越来越多,怎样才能高效迅速地找到问题的答案?有几种技术可以使得更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧妙地结合使用会大大加快网页搜索进程。几乎所有流行的搜索引擎都提供按词组搜索的功能,按词组搜索是一种在浩瀚的网页搜索相关网页的最佳技术。
-
关键词
网上搜索
搜索速度
词组搜索
词组选择
网页搜索引擎
信息源
错误信息
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-
-
题名基于SMOTE和随机森林的Web spam检测
被引量:11
- 4
-
-
作者
房晓南
张化祥
高爽
-
机构
山东师范大学信息科学与工程学院
山东省分布式计算机软件新技术重点实验室
-
出处
《山东大学学报(工学版)》
CAS
北大核心
2013年第1期22-27,33,共7页
-
基金
国家自然科学基金资助项目(61170145)
教育部高等学校博士点专项基金资助项目(20113704110001)
山东省自然科学基金资助项目(ZR2010FM021)
-
文摘
Web spam是指采用某些技术手段,使得网页在搜索引擎检索结果中的排名高于其应得排名的行为,它严重影响搜索结果的质量。考虑到Web spam数据集的严重不平衡情况,本研究提出先使用SMOTE过抽样方法平衡数据集,再利用随机森林算法训练分类器。通过对常见的单分类器和集成学习分类器的对比实验,发现SMOTE+RF方法表现较为突出,并根据实验结果优化了方法中的重要参数,对使用SMOTE方法后AUC值提高的原因进行了分析。在WEBSPAM UK2007数据集上的实验证明,该方法可以显著提高分类器的分类效果,其AUC值已经超过了Web Spam Challenge 2008上的最好成绩。
-
关键词
集成学习
搜索引擎垃圾网页
随机森林
SMOTE
搜索引擎作弊
-
Keywords
ensemble learning
Web spare
random forests
SMOTE
search engine spamming
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-