期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于页面内容和站点结构的页面聚类挖掘算法 被引量:20
1
作者 杨怡玲 管旭东 尤晋元 《软件学报》 EI CSCD 北大核心 2002年第3期467-469,共3页
提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链接度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性.通过实验数据的比较,改进算法较一般算法的收敛性好,... 提出了结合站点拓扑结构和Web页面内容的页面聚类改进算法,改进算法引入Web页面的内容链接比和页组的组内链接度,并修改了频繁访问页组支持度的计算公式,以此来提高挖掘结果的兴趣性.通过实验数据的比较,改进算法较一般算法的收敛性好,发现的频繁访问页组的兴趣性高. 展开更多
关键词 日志分析 页面内容 站点结构 数据库 数据挖掘 页面聚类挖掘算法
下载PDF
基于页面聚类的Web应用测试方法研究 被引量:7
2
作者 尤枫 张雅峰 +1 位作者 赵瑞莲 马金慧 《计算机工程与应用》 CSCD 北大核心 2018年第5期51-56,137,共7页
现有的Web测试是由前端出发,通过分析页面DOM结构来获取状态与状态跳转的条件。但现有技术是将任何DOM节点的改变都认定为产生了新的DOM树,如果对于任何改变DOM结构的操作都认为是新操作来重新生成测试用例会浪费相当的时间和人力。提... 现有的Web测试是由前端出发,通过分析页面DOM结构来获取状态与状态跳转的条件。但现有技术是将任何DOM节点的改变都认定为产生了新的DOM树,如果对于任何改变DOM结构的操作都认为是新操作来重新生成测试用例会浪费相当的时间和人力。提出一种基于页面DOM相似度的Web应用单元测试方法。利用爬虫程序获取页面状态与相应的DOM结构;利用DOM相似度对DOM进行评价,并对DOM状态进行分类,利用分类簇的中心作为相应功能的操作结果,返回应用中寻找相应的代码块并且进行测试。实验结果表明:该方法可以有效地降低"单一DOM对应单一状态"模式中的冗余状态跳转,可以达到合理的功能发现率,同时有效降低冗余的待测试状态。 展开更多
关键词 页面相似度 页面聚类 WEB应用测试
下载PDF
基于有向带权图的页面聚类算法研究 被引量:2
3
作者 方杰 张结魁 周军 《计算机技术与发展》 2009年第9期49-53,共5页
聚类算法是数据挖掘中的一个重要的分析工具。Web使用挖掘中的聚类分析一般分为用户聚类和页面聚类。其中页面聚类是指导网站结构离线优化的重要方法。利用有向带权图表示用户的访问会话记录,对建立的有向带权图模型运用聚类算法实现页... 聚类算法是数据挖掘中的一个重要的分析工具。Web使用挖掘中的聚类分析一般分为用户聚类和页面聚类。其中页面聚类是指导网站结构离线优化的重要方法。利用有向带权图表示用户的访问会话记录,对建立的有向带权图模型运用聚类算法实现页面聚类。选取真实数据对典型的聚类算法K-means算法、DBSCAN算法和COBWEB算法进行实验。实验结果表明,在选取的数据集范围内,COBWEB算法准确率要高于K-means算法和DBSCAN算法,时间性能与用户访问频率矩阵大小有密切关系。 展开更多
关键词 有向带权图 算法 页面聚类 K-MEANS算法 DBSCAN算法 COBWEB算法
下载PDF
用页组拓扑平均距离改善页面聚类算法 被引量:1
4
作者 林文龙 刘业政 余智学 《计算机科学》 CSCD 北大核心 2008年第10期200-203,共4页
提出一种支持站点结构优化的页面聚类改进算法,通过引入图论中的拓扑平均距离,量化评估与挖掘站点结构中访问效率较低的内容文档集合为结构优化的兴趣页组,挖掘的页组具有更高的兴趣性,并将兴趣页组挖掘算法融入到拓扑优化算法中。实验... 提出一种支持站点结构优化的页面聚类改进算法,通过引入图论中的拓扑平均距离,量化评估与挖掘站点结构中访问效率较低的内容文档集合为结构优化的兴趣页组,挖掘的页组具有更高的兴趣性,并将兴趣页组挖掘算法融入到拓扑优化算法中。实验结果表明改进算法能更好地优化站点结构,较一般算法收敛性好。 展开更多
关键词 WEB使用挖掘 页面聚类 频繁访问页组 自适应站点
下载PDF
基于页面聚类的推荐算法的改进
5
作者 张海玉 刘志都 +1 位作者 杨彩 贾松浩 《计算机应用与软件》 CSCD 北大核心 2008年第9期15-16,48,共3页
基于页面聚类的推荐算法常被应用在个性化推荐系统中,但是很少考虑页面访问的顺序性。针对这种弊端,提出了一种新的路径相似度系数,同时在推荐算法中运用了关联规则,提高了推荐结果的准确性。
关键词 页面聚类推荐算法 相似度 WEB使用挖掘
下载PDF
基于页面聚类的个性化推荐算法研究
6
作者 王志松 张晶磊 《燕山大学学报》 CAS 2007年第3期217-220,共4页
聚类分析算法作为一种主要的Web使用挖掘技术,在个性化推荐系统中得到了广泛应用,然而面对Web动态性所引起的网页的更新以及用户行为方式的改变,已有的聚类算法并不能很好地解决这一问题。针对这一问题,本文以一种无向图的形式表示用户... 聚类分析算法作为一种主要的Web使用挖掘技术,在个性化推荐系统中得到了广泛应用,然而面对Web动态性所引起的网页的更新以及用户行为方式的改变,已有的聚类算法并不能很好地解决这一问题。针对这一问题,本文以一种无向图的形式表示用户对网站的访问,提出一种可实时反映网站及用户行为变化情况的增量式页面聚类算法,并在页面聚类的基础上提出相应的推荐决策算法动态生成页面推荐。 展开更多
关键词 页面聚类 个性化 推荐算法
下载PDF
一种基于页面聚类和排序算法的多元搜索引擎改进方案
7
作者 张泳 吕净 《计算机系统应用》 2007年第7期30-32,共3页
由于网络上信息数量庞大,多元搜索引擎可能会产生一个相当大的结果集,本文借鉴了Web挖掘中聚类算法FCMA和网页排序算法HITS的技术和思想,改进了多元搜索引擎的结构,以提高系统的查询效率。
关键词 多元搜索引擎 WEB挖掘 页面聚类 网页排序
下载PDF
基于ALCIF描述逻辑的Web页面聚类
8
作者 富豪 邓立国 《现代计算机》 2019年第12期41-45,共5页
在Web页面聚类过程中为了能有效处理标签内容以及标签内容之间的联系,选用ALCIF描述逻辑表示方法来对Web页面信息进行抽取与存储,并对抽取到的知识内容进行约减,从而实现对Web文档的降维,以此节约聚类时间。最后用实验证明这种知识表示... 在Web页面聚类过程中为了能有效处理标签内容以及标签内容之间的联系,选用ALCIF描述逻辑表示方法来对Web页面信息进行抽取与存储,并对抽取到的知识内容进行约减,从而实现对Web文档的降维,以此节约聚类时间。最后用实验证明这种知识表示方法对于Web页面聚类的有效性。 展开更多
关键词 Web页面聚类 ALCIF描述逻辑 K-MEANS
下载PDF
Web模糊聚类方法及其应用 被引量:7
9
作者 刘茂福 何炎祥 彭敏 《计算机科学》 CSCD 北大核心 2005年第1期155-158,共4页
本文提出了Web模糊聚类的概念,给出了Web模糊聚类的过程模型WFCM并进行了详细阐述,论述了Web模糊聚类在Web访问信息挖掘中,尤其是在Web用户聚类和Web页面聚类方面的应用,最后用实例证明了在Web页面聚类中使用Web模糊聚类的可行性。
关键词 Web模糊方法 WEB数据挖掘 WUM WFCM 可行性 Web页面聚类
下载PDF
模糊C均值聚类算法在Web使用挖掘上的应用研究 被引量:9
10
作者 吴瑛 王秋生 《计算机技术与发展》 2008年第6期32-35,共4页
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用... Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度。在这些数据准备工作的基础上,构造了用户-页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类。实验表明改进的FCM算法的有效性。 展开更多
关键词 模糊C均值 Web日志预处理 关联矩阵 用户 页面聚类
下载PDF
WEB访问的动态模糊聚类算法研究
11
作者 刘敏娴 马强 《微计算机信息》 2011年第12期141-143,共3页
Web访问挖掘在电子商务和个性化网站等方面应用非常广泛。针对Web用户聚类和页面聚类的问题,提出了动态模糊聚类的算法,使用该算法通过Web日志的访问数据构造模糊相似矩阵,很好的解决Web日志中用户聚类和网页聚类的问题,实验表明该方法... Web访问挖掘在电子商务和个性化网站等方面应用非常广泛。针对Web用户聚类和页面聚类的问题,提出了动态模糊聚类的算法,使用该算法通过Web日志的访问数据构造模糊相似矩阵,很好的解决Web日志中用户聚类和网页聚类的问题,实验表明该方法可行而且具有很好的扩展性。 展开更多
关键词 模糊 用户 页面聚类
下载PDF
基于相似传递性的Web日志聚类算法
12
作者 苏云辉 《福建电脑》 2010年第3期84-84,99,共2页
在Web日志挖掘中,存在两种类型的聚类:用户聚类和页面聚类。本文提出的Web用户群体和相关页面聚类算法,直接利用用户对页面的访问频率,如实体现用户的访问行为,具有较高的准确性,能够确定合理的聚类结果数目,其子类间的相对位置能反映... 在Web日志挖掘中,存在两种类型的聚类:用户聚类和页面聚类。本文提出的Web用户群体和相关页面聚类算法,直接利用用户对页面的访问频率,如实体现用户的访问行为,具有较高的准确性,能够确定合理的聚类结果数目,其子类间的相对位置能反映出元素间相似程度的高低,还解决了聚类中普遍存在的子类间元素重复问题。 展开更多
关键词 WEB日志 用户 页面聚类 相似传递性
下载PDF
一种新的基于Web日志的挖掘用户浏览偏爱路径的方法 被引量:4
13
作者 任永功 付玉 +1 位作者 张亮 吕君义 《计算机科学》 CSCD 北大核心 2008年第10期192-196,共5页
提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进... 提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。最后,利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。实验证明此方法是合理有效的,能够得到更准确的偏爱路径。 展开更多
关键词 浏览兴趣度 路径选择偏爱度 WEB日志 矩阵 页面聚类
下载PDF
Web挖掘技术在电子商务中的应用研究 被引量:23
14
作者 刘培刚 《情报学报》 CSSCI 北大核心 2002年第6期680-685,共6页
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从... 本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。 展开更多
关键词 电子商务 WEB 挖掘 日志 页面聚类 客户群体
下载PDF
基于WEB日志挖掘的网站个性化服务研究 被引量:4
15
作者 姜美玉 卢利平 宜建军 《图书馆学刊》 2006年第5期137-138,共2页
论述了基于Web日志挖掘的网站个性化服务,提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展,即站点不但要针对用户共同感兴趣的信息服务,... 论述了基于Web日志挖掘的网站个性化服务,提出了利用Web日志挖掘的个性化服务中频繁访问路径的挖掘及用户聚类和页面聚类。利用这些算法推动Web站点从“站点为中心”向“用户为中心”的发展,即站点不但要针对用户共同感兴趣的信息服务,更要有针对每个用户的个性化服务。 展开更多
关键词 WEB日志挖掘 频繁访问路径 用户 页面聚类 个性化服务
下载PDF
基于混合型的Web实时推荐模型研究 被引量:3
16
作者 刘敏娴 马强 《计算机工程与设计》 CSCD 北大核心 2011年第10期3518-3521,共4页
针对以往个性化网站实时推荐系统存在很难预测用户未来浏览页面的不足,提出了一个混合型的实时推荐模型。该模型将动态模糊聚类技术和改进的关联规则相结合,既挖掘用户与页面的相似度权值形成知识库,又考虑用户的访问事务集增量构造访... 针对以往个性化网站实时推荐系统存在很难预测用户未来浏览页面的不足,提出了一个混合型的实时推荐模型。该模型将动态模糊聚类技术和改进的关联规则相结合,既挖掘用户与页面的相似度权值形成知识库,又考虑用户的访问事务集增量构造访问模式树,通过修剪其相关分枝,快速生成候选推荐集,由推荐引擎附加在请求页面的底部,在不干扰用户的访问同时,又将用户感兴趣的内容推荐给用户。实验结果表明,该方法能有效地提高推荐的精确率和覆盖率以及综合评价指标。 展开更多
关键词 实时推荐 模糊 用户 页面聚类 相似度
下载PDF
一种改进的用户浏览偏爱路径挖掘方法 被引量:1
17
作者 任永功 付玉 张亮 《计算机工程》 CAS CSCD 北大核心 2009年第8期47-49,共3页
提出一种基于"三矩阵"模型的偏爱浏览路径的挖掘方法。在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。在会话矩阵上采用2个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,... 提出一种基于"三矩阵"模型的偏爱浏览路径的挖掘方法。在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。在会话矩阵上采用2个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。并利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。实验证明,该方法是合理有效的,能够得到更精准的用户偏爱浏览路径。 展开更多
关键词 WEB日志 浏览兴趣度 页面聚类算法
下载PDF
医院网站日志挖掘数据预处理的研究 被引量:1
18
作者 蒙华 苏静 +1 位作者 李立峰 翟玉兰 《重庆理工大学学报(自然科学)》 CAS 北大核心 2019年第8期144-148,共5页
数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算... 数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算法输入的相似度矩阵。重点研究了医院网站日志的用户识别以及相似度矩阵的页面聚类标准化方法。实验结果表明:该方法极大降低了初始日志数据冗余度和维度,提高了预处理结果准确性,增强了数据挖掘算法输入的信息含量。 展开更多
关键词 医院网站日志挖掘 数据预处理 用户识别 页面聚类 相似度矩阵
下载PDF
数据挖掘技术在电子商务中的应用研究 被引量:1
19
作者 刘培刚 《管理信息系统》 CSSCI 2002年第2期52-54,共3页
本文基于国内外最新研究成果对电子商务中应用的web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给出了基于web日志的客户群体聚类算法及web页面聚类算法。利用这些web挖掘技术可有效挖掘用户个性特征,从而... 本文基于国内外最新研究成果对电子商务中应用的web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题,给出了基于web日志的客户群体聚类算法及web页面聚类算法。利用这些web挖掘技术可有效挖掘用户个性特征,从而指导电子商务网站资源的组织和分配。 展开更多
关键词 电子商务 WEB日志 网站设计 web页面聚类算法 客户群体算法 互维网 数据挖掘技术
下载PDF
基于兴趣文档集合游历便利性的站点结构优化模型
20
作者 林文龙 刘业政 +1 位作者 余智学 姜元春 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第21期5858-5862,共5页
基于特定信息需求的网站用户游历其兴趣文档集合的便利性,建立了一种站点结构优化的数学模型,通过页组支持度与页组拓扑平均距离量化评估与挖掘站点中访问效率较低的内容文档集合为结构优化的兴趣页组,据此提出能综合评价站点访问效率... 基于特定信息需求的网站用户游历其兴趣文档集合的便利性,建立了一种站点结构优化的数学模型,通过页组支持度与页组拓扑平均距离量化评估与挖掘站点中访问效率较低的内容文档集合为结构优化的兴趣页组,据此提出能综合评价站点访问效率的指标——WEB拓扑兴趣度,并通过分析新增超链接的影响因素设计了相应的站点结构优化方法,优化算法中采用遗传算法寻找最优组合的新增超链接组。实验结果表明:优化后的站点结构能有效改善信息搜索与获取行为的效率低下问题。 展开更多
关键词 WEB使用挖掘 页面聚类 自适应站点 遗传算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部