-
题名基于深度学习挖掘用户搜索主题研究
- 1
-
-
作者
宋毅
-
机构
哈尔滨华德学院数据科学与人工智能学院
-
出处
《计算机技术与发展》
2021年第1期43-47,共5页
-
基金
国家自然科学基金(61672185)
黑龙江省自然基金(F2015046)
黑龙江省教育科学规划重点课题(GJB1320081)
-
文摘
主要研究了基于深度学习技术挖掘用户搜索主题相关的感兴趣内容。通过深度挖掘算法分析用户搜索记录、查询历史以及用户感兴趣的相关文档视为用户搜索主题数据的来源,进而挖掘兴趣主题。挖掘模型主要采用向量空间模型,将用户搜索主题模型表示成用户搜索主题向量形式。形成主题和用户兴趣关系网,用户搜索主题向量的构造过程:选择一组用户查询词,并对它们进行深度挖掘分类,最后用它们构造用户搜索主题特征向量,进而分析用户兴趣点。结合用户随着时间的变化,以及过程中有不用的搜索词,以及无关的搜索噪声词去掉,调整兴趣度,用户搜索主题需要具有更新学习机制,动态跟踪了用户兴趣变化趋势。该用户搜索主题研究过程克服了数据稀疏、类别偏差、扩展性差等缺点。实验结果表明,该模型识别用户搜索主题准确率良好。
-
关键词
深度学习
用户搜索主题
用户模型
挖掘兴趣
个性化搜索
-
Keywords
deep learning
user search topic
user model
mining interest
personalized search
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主题相关与用户历史的网页排序算法
被引量:2
- 2
-
-
作者
林婷薇
莫路锋
薛晨杰
-
机构
浙江农林大学信息工程学院
-
出处
《计算机工程与设计》
北大核心
2019年第8期2265-2269,2277,共6页
-
文摘
基于链接结构的PageRank排序算法,存在平均分配权值、主题漂移、忽视用户兴趣等问题。针对这些问题,结合搜索词与网页关键词以及用户搜索历史与网页关键词之间的相似度,提出基于主题相关度与用户历史的PageRank改进算法THPR。通过查询词与网页关键词的相关性分析解决网页的相关程度,通过对用户历史搜索记录的分析,在算法中增加用户兴趣度,使PR值分配更为合理。仿真结果表明,THPR算法与PageRank算法相比,查准率与用户搜索满意度有明显提升。
-
关键词
排序算法
主题相关度
用户历史搜索
相似度
用户兴趣
-
Keywords
PageRank
topic relevant
user search history
similarity
user interest
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名个性化Web信息检索排序算法优化研究
被引量:4
- 3
-
-
作者
李琳
胡燕
刘东飞
-
机构
武汉理工大学计算机科学与技术学院
-
出处
《武汉理工大学学报》
CAS
CSCD
北大核心
2010年第16期177-180,共4页
-
文摘
介绍了如何自动学习用户的喜好和偏好,建立用户模型,然后利用用户模型来优化检索结果的排序。提出了一个基于主题目录的用户模型以及相应的个性化检索排序算法。结果表明,所提出的优化算法能有效地提高Google Di-rectory Search的准确度。
-
关键词
个性化检索
排序算法
用户模型
主题目录
-
Keywords
personalized search
rank algorithm
user profile
topic directory
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-