期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于网页日志的频繁模式挖掘 被引量:1
1
作者 沈明 邓玉芬 张博 《现代电子技术》 2010年第9期180-183,186,共5页
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供... 频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。 展开更多
关键词 模式挖掘 序列挖掘 图形挖掘 网页日志挖掘
下载PDF
基于云计算的大规模网页日志挖掘研究
2
作者 魏爽 《电脑知识与技术》 2014年第10期6603-6606,共4页
互联网上的数据规模大、种类多、变化快,而且越来越复杂。通过数据挖掘和分析,可以获取有潜在价值的信息。但是,传统的数据挖掘系统在数据存储和计算性能上存在瓶颈。通过使用云计算技术,设计了一个基于Hadoop架构的网页日志数据挖... 互联网上的数据规模大、种类多、变化快,而且越来越复杂。通过数据挖掘和分析,可以获取有潜在价值的信息。但是,传统的数据挖掘系统在数据存储和计算性能上存在瓶颈。通过使用云计算技术,设计了一个基于Hadoop架构的网页日志数据挖掘和分析平台来解决这个问题。同时,为了提高挖掘效率,为大规模网页日志挖掘实现了Apriori算法的并行化,并使用该平台验证了该行算法的效率。 展开更多
关键词 数据挖掘 网页日志挖掘 APRIORI算法 云计算 HADOOP
下载PDF
基于网页浏览日志的用户行为分析 被引量:13
3
作者 郭俊霞 高城 +1 位作者 许南山 卢罡 《计算机科学》 CSCD 北大核心 2014年第3期110-115,共6页
随着问答社区信息的长期积累,越来越多的过时信息充斥在其中并被搜索引擎检索,给信息需求者带来不便。用户的网页浏览日志中隐性地包含用户的行为习惯,通过分析得到这些信息对判断网页信息时效性有着重要意义。文中提出针对网页浏览日... 随着问答社区信息的长期积累,越来越多的过时信息充斥在其中并被搜索引擎检索,给信息需求者带来不便。用户的网页浏览日志中隐性地包含用户的行为习惯,通过分析得到这些信息对判断网页信息时效性有着重要意义。文中提出针对网页浏览日志的查询过程划分方法,并在划分的基础之上对大量真实用户的浏览行为习惯做了统计分析。结果显示,用户查询一次信息平均浏览8.05个页面,用时6.28分钟,有将近1/3的查询在交替并发中进行,另外用户对于网站站内搜索的依赖较高。从浏览日志数据集中选取了一个社区网站的浏览记录来进行初步的网页信息时效性分析,结果表明造成用户不满意的原因主要是查询相关度不高,而过时信息只是其中一小部分。 展开更多
关键词 网页浏览日志 用户行为分析 网页时效性 问答社区
下载PDF
中文网页搜索日志中的特殊命名实体挖掘 被引量:5
4
作者 张磊 王斌 +1 位作者 靖红芳 吴丽辉 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第5期119-122,共4页
利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方... 利用少量具有类别信息的种子词,结合特征选择技术来提取每个类别的特征信息;再利用这些特征信息,结合文本分类等数据挖掘技术来提取特殊命名实体.过程中只有构造种子词的环节需要人工辅助,其他环节均实现自动处理.实验证明,该系统和方法能够从查询日志中挖掘出高质量的命名实体列表,6个类别上识别结果的平均P@500达到了77%.系统的自动化程度和识别的效果均达到实用的要求. 展开更多
关键词 特殊命名实体 数据挖掘 信息检索 网页搜索日志
下载PDF
基于Web日志挖掘的网络用户行为交互式可视化分析
5
作者 刘翼 高明 +4 位作者 田亮亮 严都力 韦雨萌 李凯茵 张博欣 《延安大学学报(自然科学版)》 2023年第3期78-85,共8页
高校在校大学生用户群体的网络行为分析是一个有着普遍需求和意义的重要课题,具有丰富的现实意义与社会价值。本文提出网络用户行为交互式可视化分析方法,研究分析高校大学生用户群体网络行为的特征和兴趣。首先获取某高校真实的网络用... 高校在校大学生用户群体的网络行为分析是一个有着普遍需求和意义的重要课题,具有丰富的现实意义与社会价值。本文提出网络用户行为交互式可视化分析方法,研究分析高校大学生用户群体网络行为的特征和兴趣。首先获取某高校真实的网络用户访问日志;其次通过清洗缺省值、去重、规范化等数据预处理方法,选取日期、时间、用户账号和访问地址作为特征属性,并在数据集中标记出每个URL的主题分类和每个用户所属的学院等属性;然后从用户、主题分类、时序3个维度分析得出这些属性的分布情况,发现网络用户行为的区别和联系;最后利用ECharts交互式可视化工具展示分析结果。实验结果反映出当前大学生用户的网络行为特征及兴趣喜好,揭示了大学生用户的网络行为模式,为教学管理者的决策提供了数据支持。 展开更多
关键词 交互式可视化分析 网页日志挖掘 网络用户行为 主题分类 高校学生
下载PDF
数字参考服务的评价 被引量:11
6
作者 谭明君 《图书馆建设》 北大核心 2004年第2期53-55,共3页
随着数字参考服务越来越广泛地应用于各类型图书馆,系统地评估其在图书馆的应用状况已成为当务之急。近两年对于数字参考服务的评价问题业内人士已进行了或多或少的探讨。本文对数字参考服务的主要评估方法进行了一个较为全面的概括,对... 随着数字参考服务越来越广泛地应用于各类型图书馆,系统地评估其在图书馆的应用状况已成为当务之急。近两年对于数字参考服务的评价问题业内人士已进行了或多或少的探讨。本文对数字参考服务的主要评估方法进行了一个较为全面的概括,对国外的一些有代表性的评价标准也做了简略的介绍分析。 展开更多
关键词 数字参考服务 图书馆 评价标准 评估方法 案例分析法 成本效益分析法 讨论组 个人访谈法 观察法 调查法 网页日志 福开森 本格 RASD
下载PDF
博客现象与传统出版 被引量:5
7
作者 王蕾 《中国出版》 CSSCI 北大核心 2004年第8期51-53,共3页
关键词 “博客”现象 网络出版 网页日志 网站 传播模式
下载PDF
基于Web-log的频繁浏览路径挖掘
8
作者 罗超 《信息技术》 2004年第11期4-7,共4页
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点... 利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点优化和个性化服务等。 展开更多
关键词 数据挖掘 网页日志挖掘 频繁浏览路径
下载PDF
域外
9
作者 叶露怡 《计算机教与学.现代教学》 2005年第4期64-64,共1页
美国密歇根州Magnolia小学的一年级学生于今年初开始使用网页日志(Web Logs),网页日志又称Blog。同时,该州Joppa中学的学生也通过使用网页日志与其它学校的学生交换信息。但是,该州的教育官员提出要限制Blog的使用。他们认为虽然Blo... 美国密歇根州Magnolia小学的一年级学生于今年初开始使用网页日志(Web Logs),网页日志又称Blog。同时,该州Joppa中学的学生也通过使用网页日志与其它学校的学生交换信息。但是,该州的教育官员提出要限制Blog的使用。他们认为虽然Blog对鼓励学生表达和分享自己的想法以及训练他们的判断性思考能力很有帮助,但Blog的内容难以管理,还涉及到了学生隐私权等问题。 展开更多
关键词 网页日志 使用 BLOG 教学 一年级学生 学生隐私权 密歇根州 思考能力 小学 学校 中学
下载PDF
基于用户兴趣及术语间关系的查询扩展方法 被引量:1
10
作者 徐建民 陈振亚 崔琰 《山东大学学报(理学版)》 CAS CSCD 北大核心 2011年第5期49-53,共5页
针对传统查询扩展方法无法根据不同用户的需求进行检索的不足,提出一种基于用户兴趣和术语间关系进行查询扩展的方法。通过对用户浏览的网页文档及得到的网页日志进行挖掘得到一系列代表用户兴趣的术语,根据与初始查询词存在同义关系的... 针对传统查询扩展方法无法根据不同用户的需求进行检索的不足,提出一种基于用户兴趣和术语间关系进行查询扩展的方法。通过对用户浏览的网页文档及得到的网页日志进行挖掘得到一系列代表用户兴趣的术语,根据与初始查询词存在同义关系的用户兴趣术语及其权重对初始查询词权重进行调整,利用兴趣术语中与初始查询词存在本体关联关系的术语对初始查询进行扩展。实验结果表明,该方法相对于传统查询扩展方法在一定程度上提高了信息检索的查全率和查准率。 展开更多
关键词 查询扩展 网页日志 用户兴趣 同义词 本体关联
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部