期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
Agglomerative Approach for Identification and Elimination of Web Robots from Web Server Logs to Extract Knowledge about Actual Visitors 被引量:1
1
作者 Dilip Singh Sisodia Shrish Verma Om Prakash Vyas 《Journal of Data Analysis and Information Processing》 2015年第1期1-10,共10页
In this paper we investigate the effectiveness of ensemble-based learners for web robot session identification from web server logs. We also perform multi fold robot session labeling to improve the performance of lear... In this paper we investigate the effectiveness of ensemble-based learners for web robot session identification from web server logs. We also perform multi fold robot session labeling to improve the performance of learner. We conduct a comparative study for various ensemble methods (Bagging, Boosting, and Voting) with simple classifiers in perspective of classification. We also evaluate the effectiveness of these classifiers (both ensemble and simple) on five different data sets of varying session length. Presently the results of web server log analyzers are not very much reliable because the input log files are highly inflated by sessions of automated web traverse software’s, known as web robots. Presence of web robots access traffic entries in web server log repositories imposes a great challenge to extract any actionable and usable knowledge about browsing behavior of actual visitors. So web robots sessions need accurate and fast detection from web server log repositories to extract knowledge about genuine visitors and to produce correct results of log analyzers. 展开更多
关键词 web Robots web server log REPOSITORIES Ensemble Learning Bagging Boosting and Voting Actionable KNOWLEDGE Usable KNOWLEDGE Browsing Behavior GENUINE VISITORS
下载PDF
基于SQL Server 2005的Web日志挖掘系统构建 被引量:7
2
作者 王媛媛 钟永恒 《现代图书情报技术》 CSSCI 北大核心 2006年第5期58-61,共4页
分析W eb日志挖掘在图书馆中的应用,提出一种利用SQL Server 2005数据挖掘平台构建日志挖掘系统的方法,详细介绍系统主要组件的功能和实现方法,并给出相应的系统框架设计图,最后论述此设计的优点。
关键词 日志挖掘 web使用挖掘 SQL server 2005
下载PDF
基于SQL Server 2005的Web日志挖掘应用研究 被引量:2
3
作者 罗新 《现代计算机》 2008年第12期126-128,共3页
提出一个基于SQL Server 2005的Web日志挖掘解决方案,主要应用SSIS将日志数据从文本文件导入数据库,在SQL Server Management Studio中应用SQL语句和存储过程完成日志的预处理,然后应用SSAS完成数据挖掘任务,通过关联规则挖掘算法在Web... 提出一个基于SQL Server 2005的Web日志挖掘解决方案,主要应用SSIS将日志数据从文本文件导入数据库,在SQL Server Management Studio中应用SQL语句和存储过程完成日志的预处理,然后应用SSAS完成数据挖掘任务,通过关联规则挖掘算法在Web日志的应用实例证明解决方案的有效性。 展开更多
关键词 web日志挖掘 SQL server 2005 SSIS SSAS
下载PDF
基于Web使用挖掘的用户行为分析 被引量:27
4
作者 张波 巫莉莉 周敏 《计算机科学》 CSCD 北大核心 2006年第8期213-214,239,共3页
Web服务产生了大量的日志数据,这些数据记录了用户的行为信息。如何从海量的日志数据中自动、智能地抽取隐藏于其中的知识,这是本文要研究的问题。基于Web使用挖掘,对点击流数据源进行收集、预处理,并基于FP-tree的关联规则挖掘算法对... Web服务产生了大量的日志数据,这些数据记录了用户的行为信息。如何从海量的日志数据中自动、智能地抽取隐藏于其中的知识,这是本文要研究的问题。基于Web使用挖掘,对点击流数据源进行收集、预处理,并基于FP-tree的关联规则挖掘算法对用户行为进行分析,发现新模式,为优化网站建设提供有价值数据。 展开更多
关键词 web使用挖掘 点击流 web服务器日志 FP-TREE 关联规则
下载PDF
电子商务与Web数据挖掘 被引量:47
5
作者 邹显春 谢中 周彦晖 《计算机应用》 CSCD 北大核心 2001年第5期21-23,共3页
在电子商务中 ,运用数据挖掘技术对服务器上的日志文件等Web数据进行客户访问信息的Web数据挖掘 ,了解客户的访问行为 ,从而调整站点结构、市场策略等 ,使电子商务活动具有针对性。
关键词 电子商务 INTERNET web 数据挖掘 数据源
下载PDF
Web服务器攻击日志分析研究 被引量:5
6
作者 邓诗琪 刘晓明 +1 位作者 武旭东 雷敏 《信息网络安全》 2016年第6期56-61,共6页
互联网技术的飞速发展改变了人们的生活方式,其中电子商务是近年来应用最为广泛的互联网应用之一。越来越多的Web服务器部署在互联网上向外提供服务,因此针对电子商务Web服务器的攻击不断增加。OWASP组织每年都公布Web应用程序遭受到的... 互联网技术的飞速发展改变了人们的生活方式,其中电子商务是近年来应用最为广泛的互联网应用之一。越来越多的Web服务器部署在互联网上向外提供服务,因此针对电子商务Web服务器的攻击不断增加。OWASP组织每年都公布Web应用程序遭受到的最多的10种攻击技术,其中攻击危害性较大的有SQL注入、XSS攻击和DDo S攻击等。这些攻击一方面使得电子商务服务器无法向外提供服务,另一方面还可能造成电子商务服务器中数据和用户个人隐私的泄露,因此电子商务服务器的安全防护是Web服务器安全运维最为重要的一个环节。通过对Web服务器日志的分析研究可以对网站的攻击事件进行检测,进而掌握Web服务器被攻击的来源和原因等,提高Web服务器的安全防护能力。文章通过对Web服务器攻击日志进行分析,将Web服务器日志进行分类,通过将日志记录中各个字段值与具有攻击特征的模式进行匹配,并对模式匹配后的日志进行分析,发现常见的攻击类型和攻击源等信息,并以图形化的形式展示,以此提高网站服务器的安全运维能力。 展开更多
关键词 web服务器 攻击日志 日志分析
下载PDF
基于Web Service的钻孔柱状图网络成图系统研究 被引量:5
7
作者 牟乃夏 梁春利 +1 位作者 张灵先 刘文宝 《金属矿山》 CAS 北大核心 2010年第2期92-95,116,共5页
钻孔柱状图是地质勘查等领域的基础图件,地质调查的大规模展开和钻孔数据的保密性、安全性特点对钻孔柱状图的快速成图提出了更高的要求,现有的数据与软件绑定的钻孔自动成图系统难以满足上述要求。提出基于Web service的钻孔柱状图远... 钻孔柱状图是地质勘查等领域的基础图件,地质调查的大规模展开和钻孔数据的保密性、安全性特点对钻孔柱状图的快速成图提出了更高的要求,现有的数据与软件绑定的钻孔自动成图系统难以满足上述要求。提出基于Web service的钻孔柱状图远程成图方法,设计了钻孔数据存储层、钻孔数据标准化层、Web service产生层和用户表现层的4层远程成图架构,进行了Web service的接口设计,基于ArcGIS Server开发了成图系统。该系统使钻孔柱状图成图变为对不同图道的Web service的"积木式"搭建,客户端软件、网络浏览器和移动终端以相同方式使用Web service进行自定义制图,具有数据保密性强、网络远程操作、自定义成图等优点,已在多家大型单位使用,具有较强的实用价值。 展开更多
关键词 web Service钻孔柱状图 网络成图 ARCGIS server
下载PDF
基于server session约束的序列模式增长挖掘研究 被引量:1
8
作者 蔡宏果 元昌安 +2 位作者 罗锦光 张增银 石亚冰 《郑州大学学报(理学版)》 CAS 北大核心 2010年第1期24-28,共5页
在WUM(Web Usage Mining)中挖掘序列模式的背景下,提出了一种基于server session约束的序列模式增长挖掘算法.首先,为了更好地从网站服务器日志文件中挖掘模式和发现知识,提出了一种基于server session的服务器日志文件格式.同时,引入基... 在WUM(Web Usage Mining)中挖掘序列模式的背景下,提出了一种基于server session约束的序列模式增长挖掘算法.首先,为了更好地从网站服务器日志文件中挖掘模式和发现知识,提出了一种基于server session的服务器日志文件格式.同时,引入基于server session的约束概念,利用其能够减少初始序列模式和候选项集大小的特点来减少每次扫描后缀数据库的规模,再从预处理后的日志文件中挖掘WUM的频繁访问路径的序列模式.最后通过实验证明了算法的有效性和优越性. 展开更多
关键词 序列模式 服务器日志文件 服务器会话 web使用挖掘 数据挖掘
下载PDF
Web使用挖掘在远程开放教育网站建设的应用 被引量:3
9
作者 王杰 陈显强 +1 位作者 张晓平 梁燕燕 《现代计算机》 2008年第4期157-160,共4页
通过广东电大成绩查询网站的开发运行,应用Web使用挖掘技术,对成绩查询网站服务器日志数据及扩展的用户日志数据进行数据挖掘,分析了解学生的访问行为,从而可以为学生提供个性化、针对性的服务;同时基于Web使用挖掘的研究可以使网站结... 通过广东电大成绩查询网站的开发运行,应用Web使用挖掘技术,对成绩查询网站服务器日志数据及扩展的用户日志数据进行数据挖掘,分析了解学生的访问行为,从而可以为学生提供个性化、针对性的服务;同时基于Web使用挖掘的研究可以使网站结构更合理、更安全。 展开更多
关键词 数据挖掘 web使用挖掘 服务器日志 用户日志 成绩查询网站 远程开放教育管理模式
下载PDF
基于Web使用挖掘的学生思想动态分析 被引量:2
10
作者 刘雨露 《重庆三峡学院学报》 2007年第3期40-42,共3页
本文借助Web服务产生的大量日志数据,运用Web使用挖掘技术,对点击流数据源进行收集、预处理,并用基于Separate的约束性关联规则挖掘算法对学生的思想进行分析,发现学生的思想动态,为教育管理者管理学生提供决策依据。
关键词 web使用挖掘 点击流 web服务器日志 关联规则
下载PDF
Web服务器访问日志的保存方法及其实现 被引量:1
11
作者 高毅龙 《计算机工程》 CAS CSCD 北大核心 1999年第9期47-48,共2页
把IIS的自动日志保存功能和ASP技术相结合,提出一种Web日志保存方案并予以实现。该方法能够更加全面地获取用户访问信息,为分析用户需求,改进Web站点网页结构提供了丰富的信息;用户访问信息直接存储在Web数据库,为基于Weo信息的数... 把IIS的自动日志保存功能和ASP技术相结合,提出一种Web日志保存方案并予以实现。该方法能够更加全面地获取用户访问信息,为分析用户需求,改进Web站点网页结构提供了丰富的信息;用户访问信息直接存储在Web数据库,为基于Weo信息的数据挖掘(DataMining)提供了数据源.该方法已在Web站点的设计和运行中得到实际应用。 展开更多
关键词 web 服务器 日志 数据库 INTERNET网
下载PDF
基于LAMP的高性能Web服务器的架构 被引量:4
12
作者 桑一梅 《电脑学习》 2010年第6期44-46,共3页
文章提出了基于LAMP的高性能Web服务器的架构方案,采用了Apache日志、Webalizer日志分析、Cacti流量监控、入侵检测的方法,架构了一个完善的、稳定的、安全的、低廉的高性能Web服务器,满足了中小型企业的要求。
关键词 LAMP web服务器 Apache日志 流量控制 入侵检测和防御 系统调优
下载PDF
一种基于序列数的Web使用挖掘算法
13
作者 方刚 《计算机系统应用》 2010年第12期100-104,共5页
针对Web服务器日志中会话模式的页面属性为布尔量的特点,提出一种基于序列数的Web使用挖掘算法。该算法将用户会话模式转换成二进制数,然后用数字递增方式搜索候选频繁项;算法通过序列数的维来计算支持数,实现一次扫描用户会话模式,有... 针对Web服务器日志中会话模式的页面属性为布尔量的特点,提出一种基于序列数的Web使用挖掘算法。该算法将用户会话模式转换成二进制数,然后用数字递增方式搜索候选频繁项;算法通过序列数的维来计算支持数,实现一次扫描用户会话模式,有效地提高了Web使用挖掘的效率。实验表明其效率比现有算法更快速而有效。 展开更多
关键词 web使用挖掘 会话模式 web服务器日志 递增搜索 序列数
下载PDF
基于Web日志的序列模式挖掘应用研究
14
作者 王燕 《信息技术》 2009年第9期12-15,共4页
首先分析了序列模式挖掘算法——类Apriori算法,然后重点介绍了如何对Web服务产生的大量日志数据进行收集、预处理,并基于类Apriori算法对Web日志进行分析,发现新模式,为优化网站建设提供有价值数据。
关键词 数据挖掘 序列模式 类Aprior算法 web服务器日志
下载PDF
基于Web数据挖掘的文献个性化推荐系统的设计 被引量:3
15
作者 陈华 陆黎明 刘玉文 《山东大学学报(理学版)》 CAS CSCD 北大核心 2007年第11期69-72,共4页
基于数据挖掘的Web个性化信息推荐服务日益成为一个重要的应用技术,通过使用FP-tree关联规则挖掘算法对用户文献阅读信息进行分析,发现用户的阅读习惯和阅读兴趣,进而为用户进行个性化的文献推荐,从而提高网站对用户的吸引力。
关键词 web个性化信息服务 web服务器日志 FP-TREE 关联规则
下载PDF
基于WebGIS的Web服务器日志管理系统设计与实现
16
作者 张群 张雯 +2 位作者 李飞雪 李满春 陈东 《测绘与空间地理信息》 2013年第4期13-16,共4页
WebGIS优势是通过互联网对地理空间数据进行发布和应用,以实现空间数据的共享和相互操作。将WebGIS和富客户端技术引入Web服务器日志管理领域,从总体设计、数据库设计、实现框架等几个方面设计了Web服务器日志管理系统开发框架,并开发... WebGIS优势是通过互联网对地理空间数据进行发布和应用,以实现空间数据的共享和相互操作。将WebGIS和富客户端技术引入Web服务器日志管理领域,从总体设计、数据库设计、实现框架等几个方面设计了Web服务器日志管理系统开发框架,并开发了某工业园区信息共享平台日志管理系统。该系统可以高效便捷地实现网络访问数据空间可视化、访问流量在线监控、访问数据统计与分析等功能,为Web服务器运行维护提供科学的决策依据。 展开更多
关键词 日志管理系统 webGIS 富客户端应用 web服务器 信息共享平台
下载PDF
基于工作量和错误日志的Web应用可靠性度量方法 被引量:3
17
作者 袁佳琳 高建华 《计算机应用与软件》 CSCD 北大核心 2012年第10期44-47,179,共5页
Web应用环境复杂,传统基于故障测量的方法不能很好地满足系统可靠性度量的需求。充分考虑用户对系统的使用情况,从Web服务器日志中获取用户点击数、传输字节数、用户数和用户会话数,提出基于这四个指标的工作量测量法,并与传统的故障测... Web应用环境复杂,传统基于故障测量的方法不能很好地满足系统可靠性度量的需求。充分考虑用户对系统的使用情况,从Web服务器日志中获取用户点击数、传输字节数、用户数和用户会话数,提出基于这四个指标的工作量测量法,并与传统的故障测量法结合,采用Nelson模型进行系统可靠性评估。通过实验比较工作量测量的四种方法与故障测量方法的优劣。结果验证了基于工作量测量的方法能更稳定地评估Web应用的可靠性。 展开更多
关键词 web应用 web服务器日志 web工作量 可靠性
下载PDF
Web使用挖掘中数据预处理的研究 被引量:2
18
作者 田倩飞 左源瑞 廖鹏 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第6期79-84,共6页
对Web使用挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括数据的来源及清理、用户识别、会话识别、路径补充等步骤及其所采用的技术.在现有Web使用挖掘数据预处理的步骤上提出改进,即在路径补充后,利用最大向前序列法(MFR,Ma... 对Web使用挖掘中数据预处理阶段所采用的技术做了全面的研究,主要包括数据的来源及清理、用户识别、会话识别、路径补充等步骤及其所采用的技术.在现有Web使用挖掘数据预处理的步骤上提出改进,即在路径补充后,利用最大向前序列法(MFR,Max Forward Reference)进行二次会话识别,克服了原有会话识别中最大向前序列法的缺点.最后给出示例及其结果. 展开更多
关键词 web使用挖掘 web服务器日志 数据预处理
下载PDF
Web服务器攻击信息的查找与分析
19
作者 姚恺荣 《电脑知识与技术(过刊)》 2010年第17期4640-4641,共2页
查看Web服务器logging是有效防止攻击和入侵的一种基本方法。该文主要阐述如何通过Web服务器logging,在众多信息里查找、分析攻击和入侵的痕迹,并给出具体实例。
关键词 web服务器 logGING 攻击
下载PDF
改进的基于Web的频繁访问路径挖掘算法 被引量:1
20
作者 庞敏 赵乙国 周海英 《测试技术学报》 2009年第3期244-247,共4页
对于连续频繁访问路径的挖掘如果采用常见的序列模式挖掘算法,挖掘效率是比较低的,而且只能得到频繁访问路径.本文在研究访问路径性质的基础上给出了一种能从普通Web日志中挖掘出连续频繁访问路径的算法.设计了一种新颖的数据结构压缩... 对于连续频繁访问路径的挖掘如果采用常见的序列模式挖掘算法,挖掘效率是比较低的,而且只能得到频繁访问路径.本文在研究访问路径性质的基础上给出了一种能从普通Web日志中挖掘出连续频繁访问路径的算法.设计了一种新颖的数据结构压缩存储空间及存储所需挖掘信息.同时采用分区搜索的方式,为每个频繁节点构造一棵后缀树,通过遍历该后缀树挖掘出连续频繁访问路径.采用这种方法进行挖掘,无需生成候选集,而且一次就可以挖掘出所有以根节点为后缀的连续频繁访问路径. 展开更多
关键词 连续频繁访问路径 网络服务器日志 分区搜索 后缀树 频繁节点
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部