-
题名Web搜索引擎日志挖掘研究框架
被引量:4
- 1
-
-
作者
王继民
李雷明子
孟涛
-
机构
北京大学信息管理系
北京大学信息科学技术学院
-
出处
《数字图书馆论坛》
2011年第8期25-31,共7页
-
基金
本研究得到国家社会科学基金(10BTQ050)、教育部人文社会科学基金(09YJA870002)和核高基项目(2011ZX01042-001-001)的资助.
-
文摘
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。
-
关键词
搜索引擎
用户日志
web使用挖掘
用户搜索行为
-
Keywords
search engine, user log, web usage mining, user search behaviors
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
-
-
题名电子商务中Web挖掘技术的应用探讨
被引量:12
- 2
-
-
作者
但微
才书训
-
机构
东北大学软件学院
东北大学秦皇岛分校
-
出处
《计算机技术与发展》
2006年第1期207-209,216,共4页
-
文摘
随着电子商务技术的深入发展,商家在与用户交互活动中的信息也迅速膨胀,网上的海量信息为Web挖掘提供了一个广阔的应用领域,使用Web挖掘技术能够发现电子商务过程中的潜在模式。文中针对几种不同特点的电子商务Web挖掘系统,包括智能搜索引擎系统、网站用户访问分析系统、个性化推荐系统等都进行了探讨。
-
关键词
web挖掘
智能搜索引擎
网站用户访问分析
个性化推荐
-
Keywords
web mining
intelligent search engine
web usage analysis
personalized recommendation
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
F713.36
[经济管理—产业经济]
-
-
题名高校图书馆搜索引擎中Web使用记录挖掘研究
被引量:2
- 3
-
-
作者
赵静
-
机构
上海外国语大学贤达经济人文学院管理学院
-
出处
《现代电子技术》
2013年第2期1-5,共5页
-
基金
上海高校青年教师培养资助计划(xdc11001)
-
文摘
针对高校的信息资源检索的命中率低问题提出了运用Web使用记录挖掘的高校图书馆搜索引擎。通过采用Web使用记录挖掘技术和Clementine对高校图书馆网站的Web访问日志记录进行挖掘。在Web使用记录挖掘流程中,提出一个基于用户IP、登陆时间、网站的拓扑图、引用网页和Agent来识别出单个用户的新算法,获得有效提高识别用户的实验结果。最后用路径分析来挖掘模式,优化网站结构,从而提高高校图书馆搜索引擎的命中率。
-
关键词
web使用记录挖掘
搜索引擎
路径分析
高校图书馆
用户识别
-
Keywords
web usage mining
search engine
path analysis
university library
user identification
-
分类号
TN911.34
[电子电信—通信与信息系统]
-
-
题名智能搜索引擎中用户兴趣模型分析与研究
被引量:32
- 4
-
-
作者
蒋萍
崔志明
-
机构
苏州大学智能信息处理及应用研究所
-
出处
《微电子学与计算机》
CSCD
北大核心
2004年第11期24-26,共3页
-
基金
江苏省自然科学基金项目(BK2002039)
-
文摘
用户兴趣模型是智能搜索引擎系统中的重要组成部分。本文提出一种新的方法,以动态询问的方式建立初始用户兴趣模型,通过分析、学习用户浏览行为历史,动态更新用户兴趣模型,有效地解决了用户兴趣的自适应变化。
-
关键词
智能搜索引擎
用户兴趣模型
页面访问挖掘
-
Keywords
intelligent search engine, user interest profile, web usage mining
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名有序概念格与WWW用户访问模式的增量挖掘
被引量:2
- 5
-
-
作者
金阳
左万利
-
机构
吉林大学计算机科学与技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2003年第5期675-683,共9页
-
基金
国家自然科学基金 (69673 0 15 )
吉林省科技发展计划项目基金 (2 0 0 0 0 111)
-
文摘
访问模式是用户沿URL超链寻找和浏览网页规律的总结 ,发现用户访问模式对于帮助用户快速到达目标页面 ,进而实现搜索引擎的个性化导航具有重要意义 目前虽有一些挖掘用户访问模式的工作 ,但尚未发现能够处理增量数据的系统化挖掘算法 用户访问模式挖掘可由如下 3个步骤完成 :①由日志库提取最大向前关联路径 ,②由最大向前关联路径发现频繁关联路径序列 ,③由频繁关联路径序列得到最大频繁关联路径序列 ,其中②是问题的核心 为得到系统化算法 ,对概念格模型加以顺序约束 ,提出了有序概念格 ,并将其用于Web访问模式的增量发掘 给出了增量式高效挖掘算法 ,并与相关工作进行了比较 。
-
关键词
搜索引擎
web挖掘
web应用挖掘
用户访问模式
有序概念格
-
Keywords
search engine
web mining
web usage mining
user traversal pattern
ordered concept lattice
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名对信息检索系统应用技术的数学表示模型的分析
- 6
-
-
作者
胡国忠
-
机构
华南理工大学计算机科学与工程学院
-
出处
《长沙航空职业技术学院学报》
2005年第4期46-47,45,共3页
-
文摘
页面表示、用户兴趣模型、页面链接排序是信息检索系统中的关键技术,分析相应的数学模型,并例举在一个智能搜索引擎中的应用,通过动态的更新用户兴趣模型和由此而引起的WEB页面更新,有效地适应用户兴趣的变化。
-
关键词
页面表示
用户兴趣模型
页面链接
智能搜索引擎
-
Keywords
web page describe
user interest profile
web page link
intelligent search engine
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-