期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于引用启发式和URL语义相结合的会话识别方法 被引量:3
1
作者 张帅 陈兴蜀 +1 位作者 童浩 崔晓靖 《计算机应用研究》 CSCD 北大核心 2014年第1期102-105,共4页
会话识别是Web日志的用户行为分析的关键步骤,精准的会话识别是有效进行用户行为分析的基础。已有的会话识别方法不能有效地动态适应不同的用户(如多IP单用户、单IP多用户)行为,在Web日志分析的基础上,提出了一种基于引用启发式和URL语... 会话识别是Web日志的用户行为分析的关键步骤,精准的会话识别是有效进行用户行为分析的基础。已有的会话识别方法不能有效地动态适应不同的用户(如多IP单用户、单IP多用户)行为,在Web日志分析的基础上,提出了一种基于引用启发式和URL语义相结合的会话识别方法。实验结果表明,改进后的会话识别方法能更有效地识别出用户的真实会话。 展开更多
关键词 WEB日志挖掘 会话识别 数据预处理 引用启发式 url语义
下载PDF
基于主题语义URL的信息搜索方法研究 被引量:2
2
作者 林晶 彭小宁 《计算机应用与软件》 CSCD 2015年第6期42-45,共4页
为提高主题网络爬虫的效率及收获率,提出一种基于主题语义URL的信息搜索方法。该方法将种子URL映射到主题树的主题结点上,以主题路径上的主题文本扩充种子URL的语义,引导爬虫高效准确地抓取主题页面,并利用链接重要度与页面重要度因子... 为提高主题网络爬虫的效率及收获率,提出一种基于主题语义URL的信息搜索方法。该方法将种子URL映射到主题树的主题结点上,以主题路径上的主题文本扩充种子URL的语义,引导爬虫高效准确地抓取主题页面,并利用链接重要度与页面重要度因子在抓取过程中自动选育新的URL优良种子。重点阐述上述搜索方法的原理及其在系统中的实现。实验结果表明,该搜索方法能有效改善网络爬虫的搜索效率及收获率,且种子链接的选育性能良好。 展开更多
关键词 主题树 url语义 搜索引擎 主题-url映射
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部