期刊文献+
共找到444篇文章
< 1 2 23 >
每页显示 20 50 100
基于Web-LogMining寻找目标网页最优期望定位 被引量:1
1
作者 丛蓉 王秀坤 +1 位作者 吴军 周岩 《计算机工程与应用》 CSCD 北大核心 2004年第34期151-153,178,共4页
为了优化网站的访问效能,实现网站实际结构与用户的使用行为相吻合,该文主要应用Web挖掘技术,以网站的服务器Web日志作为数据源,使用算法FEL和算法CRLL从用户访问事务序列中寻找目标网页的期望定位,并以最少“后退”次数为原则生成推荐... 为了优化网站的访问效能,实现网站实际结构与用户的使用行为相吻合,该文主要应用Web挖掘技术,以网站的服务器Web日志作为数据源,使用算法FEL和算法CRLL从用户访问事务序列中寻找目标网页的期望定位,并以最少“后退”次数为原则生成推荐链接列表。网站设计者可根据该列表,修改网页之间的链接关系,达到减少对目标网页搜索时间的目的。 展开更多
关键词 web挖掘 web文件 目标网页 期望定位
下载PDF
高效的WEB-Log Mining算法
2
作者 马涛 刘昱琨 王希雷 《微机发展》 2003年第4期71-72,75,共3页
通过对WEB服务器日志文件进行分析,可以发现相似的客户群体、相关WEB页面以及频繁访问路径。这里提出了一种新颖的WEB日志挖掘算法,该算法是以服务器日志文件中的不同会话为聚类对象,通过对不同会话实施空间距离聚类和层次结构比较聚类... 通过对WEB服务器日志文件进行分析,可以发现相似的客户群体、相关WEB页面以及频繁访问路径。这里提出了一种新颖的WEB日志挖掘算法,该算法是以服务器日志文件中的不同会话为聚类对象,通过对不同会话实施空间距离聚类和层次结构比较聚类,最终得到了满意的聚类结果。最后,给出了一个应用实例,实例表明,该方法是有效可行的。 展开更多
关键词 web-log mining算法 数据库 数据挖掘 会话 客户群体聚类 频繁访问路径
下载PDF
Mining Interesting Knowledge from Web-Log 被引量:1
3
作者 ZHOUHong-fang FENGBo-qin +1 位作者 HEIXin-hong LULin-tao 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期569-574,共6页
Web-log contains a lot of information related with user activities on the Internet. How to mine user browsing interest patterns effectively is an important and challengeable research topic. On the analysis of the pres... Web-log contains a lot of information related with user activities on the Internet. How to mine user browsing interest patterns effectively is an important and challengeable research topic. On the analysis of the present algorithm’s advantages and disadvantages we propose a new concept: support-interest. Its key insight is that visitor will backtrack if they do not find the information where they expect. And the point from where they backtrack is the expected location for the page. We present User Access Matrix and the corresponding algorithm for discovering such expected locations that can handle page caching by the browser. Since the URL-URL matrix is a sparse matrix which can be represented by List of 3-tuples, we can mine user preferred sub-paths from the computation of this matrix. Accordingly, all the sub-paths are merged, and user preferred paths are formed. Experiments showed that it was accurate and scalable. It’s suitable for website based application, such as to optimize website’s topological structure or to design personalized services. Key words Web Mining - user preferred path - Web-log - support-interest - personalized services CLC number TP 391 Foundation item: Supported by the National High Technology Development (863 program of China) (2001AA113182)Biography: ZHOU Hong-fang (1976-), female.Ph. D candidate, research direction: data mining and knowledge discovery in databases. 展开更多
关键词 web mining user preferred path web-log support-interest personalized services
下载PDF
基于XGMML-LOGML的Web日志挖掘 被引量:1
4
作者 余肖生 《重庆工学院学报(自然科学版)》 2008年第7期61-65,共5页
介绍了XGMML和LOGML语言,在此基础上讨论了Web日志文件的预处理过程和一个基于XGMML-LOGML的Web日志挖掘体系结构,实例表明:与原始日志文件挖掘相比,基于XGMML-LOGML处理的Web日志文件挖掘所需要的时间更少,挖掘的内容质量更高,能更好... 介绍了XGMML和LOGML语言,在此基础上讨论了Web日志文件的预处理过程和一个基于XGMML-LOGML的Web日志挖掘体系结构,实例表明:与原始日志文件挖掘相比,基于XGMML-LOGML处理的Web日志文件挖掘所需要的时间更少,挖掘的内容质量更高,能更好地满足用户的需求. 展开更多
关键词 logML XGMML web日志挖掘
下载PDF
基于Web-log的频繁浏览路径挖掘
5
作者 罗超 《信息技术》 2004年第11期4-7,共4页
利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点... 利用Web日志文件,采用LossyCounting算法对用户频繁浏览路径进行挖掘。在设计中,根据频繁路径挖掘的实际情况对算法进行了优化和改进。实验表明该方法能快速准确地发现用户频繁浏览路径,且具有较好的可扩展性,适用于电子商务网站的站点优化和个性化服务等。 展开更多
关键词 数据挖掘 网页日志挖掘 频繁浏览路径
下载PDF
基于分布式的web log挖掘模型 被引量:3
6
作者 罗建利 沈洁 +1 位作者 许有志 杭月芹 《计算机应用与软件》 CSCD 北大核心 2004年第9期30-32,35,共4页
本文提出了一种基于分布式weblog挖掘模型 ,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘 ,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担 ,体现并行计算、... 本文提出了一种基于分布式weblog挖掘模型 ,并针对该模型设计了一种有效的基于分布式的挖掘算法。该算法首先在各分布式服务器上进行关联规则挖掘 ,然后将各个服务器上的挖掘结果合成。这有利于减轻网络频繁的通讯负担 ,体现并行计算、异步挖掘。 展开更多
关键词 数据挖掘 关联规则 数据文件 数据转换 事务数据库 分布式服务器 web log挖掘模型
下载PDF
基于Hadoop的并行PSO-kmeans算法实现Web日志挖掘 被引量:13
7
作者 马汉达 郝晓宇 马仁庆 《计算机科学》 CSCD 北大核心 2015年第S1期470-473,共4页
互联网技术的迅速发展,使得基于单一结点的Web日志挖掘变得十分困难,而Hadoop云平台的出现,为这类问题提供了新的解决方案。但传统的Web日志挖掘聚类k-means算法对初始聚类中心的选择敏感等缺点,容易影响聚类准确率。针对这个问题,提出... 互联网技术的迅速发展,使得基于单一结点的Web日志挖掘变得十分困难,而Hadoop云平台的出现,为这类问题提供了新的解决方案。但传统的Web日志挖掘聚类k-means算法对初始聚类中心的选择敏感等缺点,容易影响聚类准确率。针对这个问题,提出基于粒子群算法(PSO)的k-means算法,使得k-means算法不受初始聚类中心的影响,并且在Hadoop平台上实现了算法的MapReduce编程。实验结果证明:提出的改进算法,与传统的k-means算法相比,具有更高的聚类准确率;与串行单机算法相比,运行效率也有很大的提升。 展开更多
关键词 HADOOP K-MEANS PSO MAPREDUCE web日志挖掘
下载PDF
Web Mining Model Based on Rough Set Theory
8
作者 吴冰 赵林度 《Journal of Southeast University(English Edition)》 EI CAS 2002年第1期54-58,共5页
Due to a great deal of valuable information contained in the Web log file, the result of Web mining can be used to enhance the decision making for electronic commerce (EC) operation and management. Because of ambiguo... Due to a great deal of valuable information contained in the Web log file, the result of Web mining can be used to enhance the decision making for electronic commerce (EC) operation and management. Because of ambiguous and abundance of the Web log file, the least decision making model based on rough set theory was presented for Web mining. And an example was given to explain the model. The model can predigest the decision making table, so that the least solution of the table can be acquired. According to the least solution, the corresponding decision for individual service can be made in sequence. Web mining based on rough set theory is also currently the original and particular method. 展开更多
关键词 web mining rough sets electronic commerce knowledge reasoning web log
下载PDF
扩展AL-log挖掘日志本体的ILP方法
9
作者 孙明 陈波 +1 位作者 刘东 周明天 《计算机应用研究》 CSCD 北大核心 2009年第6期2328-2331,共4页
为发现W eb使用记录中所蕴涵的用户访问模式,在深入分析日志本体中事件间的抽象关系后,提出适用于原子事件和复合事件间整分关系推理的ALC传播规则扩展已有的推理模式,并在此基础上提出一种挖掘日志本体的ILP方法。该方法结合描述逻辑和... 为发现W eb使用记录中所蕴涵的用户访问模式,在深入分析日志本体中事件间的抽象关系后,提出适用于原子事件和复合事件间整分关系推理的ALC传播规则扩展已有的推理模式,并在此基础上提出一种挖掘日志本体的ILP方法。该方法结合描述逻辑和Horn规则在知识表示和推理过程中互补的特点,采用AL-log混合系统构建知识库,利用约束SLD-反驳消解和扩展ALC传播规则从日志本体中学习用户访问模式,达到站点商业智能和个性化的目的。最后给出验证该方法的实例,实验结果表明了该方法的可行性和有效性。 展开更多
关键词 语义网使用挖掘 归纳逻辑程序设计 日志本体 AL-log 混合推理
下载PDF
基于Weblog的模糊聚类分析 被引量:1
10
作者 谢维奇 《电脑知识与技术》 2009年第4X期3051-3053,共3页
该文使用模糊聚类的方法对Web日志进行数据挖掘,给出了模糊聚类分析在数据挖掘中应用的主要步骤,最后用实例证明了Web模糊聚类的可行性。
关键词 web日志 模糊聚类 web数据挖掘
下载PDF
一种基于Web日志的Item-Based协同过滤算法改进
11
作者 王春才 邢晖 吕东方 《软件导刊》 2015年第3期46-48,共3页
在目前众多的电子商务推荐方法中,协同过滤的研究和应用最为广泛。但由于其自身存在的一些诸如数据稀疏性与缺少个性化等问题,导致推荐的准确度与效率不高。而且User-Based协同过滤算法存在用户规模过大、不易寻找最近邻的问题。因此,... 在目前众多的电子商务推荐方法中,协同过滤的研究和应用最为广泛。但由于其自身存在的一些诸如数据稀疏性与缺少个性化等问题,导致推荐的准确度与效率不高。而且User-Based协同过滤算法存在用户规模过大、不易寻找最近邻的问题。因此,引入了Web日志挖掘方法,并利用Item-Based等相关技术,以提高推荐准确度。 展开更多
关键词 web日志挖掘 Item-Based 协同过滤 电子商务
下载PDF
基于改进k-prototypes算法的Web日志分析系统的设计与实现
12
作者 罗冬梅 《吉林工程技术师范学院学报》 2015年第5期93-96,共4页
设计了一个基于改进k-prototypes算法的Web日志分析系统,结合学校网站采集的数据针对相关技术算法进行了应用及分析。
关键词 数据挖掘 web日志 k-prototypes算法
下载PDF
IMPROVING THE INTERESTINGNESS OF WEB USAGE MINING 被引量:1
13
作者 杨怡玲 管旭东 尤晋元 《Journal of Shanghai Jiaotong university(Science)》 EI 2002年第1期15-22,共8页
Improvement on mining the frequently visited groups of web pages was studied. First, in the data preprocessing phrase, we introduce an extra frame filtering step that reduces the negative influence of frame pages on t... Improvement on mining the frequently visited groups of web pages was studied. First, in the data preprocessing phrase, we introduce an extra frame filtering step that reduces the negative influence of frame pages on the result page groups. Through recognizing the frame pages in the site documents and constructing the frame subframe relation set, the subframe pages that influence the final mining result can be efficiently filtered. Second, we enhance the mining algorithm with the consideration of both the site topology and the content of the web pages. By the introduction of the normalized content link ratio of the web page and the group interlink degree of the page group, the enhanced algorithm concentrates more on the content pages that are less interlinked together. The experiments show that the new approach can effectively reveal more interesting page groups, which would not be found without these enhancements. 展开更多
关键词 data mining web mining web USAGE mining log analysis INTERESTINGNESS ENHANCEMENT
下载PDF
The design and implementation of web mining in web sites security 被引量:2
14
作者 LI Jian, ZHANG Guo-yin , GU Guo-chang, LI Jian-li College of Computer Science and Technology, Harbin Engineering University, Harbin 150001China 《Journal of Marine Science and Application》 2003年第1期81-86,共6页
The backdoor or information leak of Web servers can be detected by using Web Mining techniques on some abnormal Web log and Web application log data. The security of Web servers can be enhanced and the damage of illeg... The backdoor or information leak of Web servers can be detected by using Web Mining techniques on some abnormal Web log and Web application log data. The security of Web servers can be enhanced and the damage of illegal access can be avoided. Firstly, the system for discovering the patterns of information leakages in CGI scripts from Web log data was proposed. Secondly, those patterns for system administrators to modify their codes and enhance their Web site security were provided. The following aspects were described: one is to combine web application log with web log to extract more information,so web data mining could be used to mine web log for discovering the information that firewall and Information Detection System cannot find. Another approach is to propose an operation module of web site to enhance Web site security. In cluster server session, Density -Based Clustering technique is used to reduce resource cost and obtain better efficiency. 展开更多
关键词 data mining web log mining web sites security density-based clustering
下载PDF
Semantic Session Analysis for Web Usage Mining 被引量:1
15
作者 ZHANG Hui SONG Hantao XU Xiaomei 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期773-776,共4页
A semantic session analysis method partitioning Web usage logs is presented. Semantic Web usage log preparation model enhances usage logs with semantic. The Markov chain model based on ontology semantic measurement is... A semantic session analysis method partitioning Web usage logs is presented. Semantic Web usage log preparation model enhances usage logs with semantic. The Markov chain model based on ontology semantic measurement is used to identifying which active session a request should belong to. The competitive method is applied to determine the end of the sessions. Compared with other algorithms, more successful sessions are additionally detected by semantic outlier analysis. 展开更多
关键词 web usage mining web log preparation session analysis
下载PDF
基于概念格的web log分布式挖掘算法
16
作者 陈锦禾 沈洁 《扬州大学学报(自然科学版)》 CAS CSCD 2008年第1期38-42,共5页
提出一种有效的基于概念格的分布式挖掘算法,重点讨论由部分量化规则格提取的部分关联规则的合并技术,由于能对已存在关联规则的再利用,从而更有利于用概念格来挖掘关联规则.该算法根据对局部关联规则挖掘结果的分布式合成,有利于减轻... 提出一种有效的基于概念格的分布式挖掘算法,重点讨论由部分量化规则格提取的部分关联规则的合并技术,由于能对已存在关联规则的再利用,从而更有利于用概念格来挖掘关联规则.该算法根据对局部关联规则挖掘结果的分布式合成,有利于减轻网络频繁的通讯负担,体现并行计算、异步异构数据挖掘的优点. 展开更多
关键词 web log 关联规则 分布式挖掘 概念格
下载PDF
Web日志挖掘中的数据预处理的研究 被引量:57
17
作者 陆丽娜 杨怡玲 +1 位作者 管旭东 魏恒义 《计算机工程》 EI CAS CSCD 北大核心 2000年第4期66-67,72,共3页
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的... 为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。 展开更多
关键词 数据挖掘 web 日志挖掘 数据预处理 数据库
下载PDF
Web日志挖掘中的数据预处理技术研究 被引量:62
18
作者 赵伟 何丕廉 +1 位作者 陈霞 谢振亮 《计算机应用》 CSCD 北大核心 2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
Web日志挖掘技术进展 被引量:17
19
作者 陈新中 李岩 +2 位作者 杨炳儒 谢永红 张运涛 《系统工程与电子技术》 EI CSCD 北大核心 2003年第4期492-495,共4页
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方... 用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。 展开更多
关键词 AI 万维网 web挖掘 web日志挖掘
下载PDF
一种Web用户行为聚类算法 被引量:20
20
作者 业宁 李威 +1 位作者 梁作鹏 董逸生 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1364-1367,共4页
提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法... 提出了一种新的路径相似度系数计算方法 ,并使之与雅可比相似系数结合 ,用于计算用户访问行为的相似度 ,在此基础之上又提出了一种分析 Web用户行为的聚类算法 (FCC) ,通过挖掘 Web日志 ,找出具有相似行为的 Web用户 .由于 FCC聚类算法过滤了小于指定阈值的相似度系数 ,大大缩小了数据规模 ,很好地解决了其他聚类算法 (如层次聚类 )在高维空间聚类时的“维数灾难”问题 ,最后的实验结果很好 . 展开更多
关键词 web日志 数据挖掘 聚类 相似度
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部