-
题名查询日志中查询意图的自动识别
被引量:1
- 1
-
-
作者
李煜
吕学强
李卓
徐丽萍
-
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
北京市城市系统工程研究中心
-
出处
《计算机应用与软件》
CSCD
2015年第11期27-31,共5页
-
基金
国家自然科学基金项目(61271304)
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519)
-
文摘
针对用户对搜索引擎查询结果满意度不高的问题,提出一种基于用户行为分析的查询意图识别方法来提高搜索引擎查询质量。将查询意图识别视为一个分类问题,分析搜狗查询日志发现:信息事务类查询串点击的不同页面数较多,分布呈现多极值性;导航类查询串点击的不同页面数较少,分布呈现单极值性;导航类查询结果中,子页面噪声对查询分类结果产生严重干扰。根据以上特点,提出"不同页面点击数"、"点击分布值"和"异源页面点击数"三个特征,并结合前人研究,利用C4.5算法训练分类器,进行查询意图识别。实验结果中查询分类的整体正确率达到90%,与Baseline相比,提高了8.5%。结果表明,该方法对识别用户查询意图是有效的。
-
关键词
查询意图识别
查询日志
用户行为分析C4.5算法
-
Keywords
Query intention
Query log
Users behaviour analysis
CA. 5 algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于用户查询意图的搜索排序算法
被引量:1
- 2
-
-
作者
张美珍
王治莹
-
机构
天津理工大学计算机与通信工程学院
天津理工大学管理学院
-
出处
《天津理工大学学报》
2012年第3期46-51,共6页
-
文摘
目前互联网技术的研究热点是智能化的、个性化的服务,而传统的Web搜索排序算法和已有的个性化排序已经不能满足政府、企业等用户的信息查询需要.本文将研究核心定位到充分理解用户查询偏好上,提出了基于用户偏好的PageRank算法.文中利用用户互反馈技术修正查询关键词,利用语义相关性技术分析用户查询意图,理解用户偏好.改进的算法完善了搜索查询的可靠性依据,能够较好地挖掘用户的偏好主题,贴近用户的查询目的,提高搜索查询效率和用户满意度.
-
关键词
PAGERANK
用户偏好
查询词修正
查询意图识别
-
Keywords
PageRank
user preferences
query correction
query intent identification
-
分类号
TP393.027
[自动化与计算机技术—计算机应用技术]
-
-
题名面向社会媒体的消费意图识别:任务、挑战与机遇
被引量:1
- 3
-
-
作者
付博
刘挺
-
机构
哈尔滨工业大学社会计算与信息检索研究中心
-
出处
《智能计算机与应用》
2015年第4期1-4,8,共5页
-
基金
国家自然科学基金(61133012)
国家重点基础研究发展计划(973)(2014CB340503)
国家青年科学基金(61202277)
-
文摘
社会媒体是一个基于用户关系的信息分享、传播以及获取平台,并实现即时分享。在社会媒体上产生了大量的用户发布的,对于诸如产品购买、喜好等有价值的消费需求信息。这些关于产品需求的信息表达了人们的各种消费意愿和消费需求。例如,"请推荐一款2 000块钱左右的诺基亚手机"即为用户的一种消费需求。类似这样的信息为公司或企业提供了有价值的信息。本文以此介绍了面向社会媒体的消费意图识别这一任务的诞生背景、要解决的主要问题、面临的主要挑战、相关工作以及未来的研究方向。
-
关键词
消费意图识别
查询商业意图识别
消费意图模板
社会媒体
-
Keywords
Consumption Intent Recognition
Query Commercial Intent Recognition
Consumption Intent Pattern
Social Media
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于采莓模型启示的探索式与查找式意图自动识别研究
- 4
-
-
作者
刘杰
桂思思
张晓娟
-
机构
西南大学计算机与信息科学学院
-
出处
《数据分析与知识发现》
EI
2024年第4期152-166,共15页
-
基金
基金资助:*国家社会科学基金青年项目(19CTQ023)。
-
文摘
【目的】通过选取新分类特征,提高探索式与查找式意图自动识别的准确度。【方法】在AOL查询日志中,选取1805个查询并对其进行人工标注;在采莓模型的启示下,分别从查询性质、搜索过程与信息来源三个层面提出分类特征;进一步比较所提出特征在朴素贝叶斯、SVM、决策树、随机森林与神经网络5种分类模型中的分类效果;最后分析不同特征集合以及每个特征的分类效果。【结果】三种分类特征均能对探索式与查找式意图进行有效区分,其中查询性质相关特征的识别效果最佳;在5种分类模型中,采用神经网络算法的分类模型性能最佳(Accuracy=0.8172,Precision=0.8494,Recall=0.7747,F1=0.8103)。【局限】未在多个数据集中验证新提出的分类特征的性能;未充分挖掘用户搜索行为以此形成更多有效的分类特征;由于人工标注存在高耗时、高人力成本等问题,使得最终应用于探索式/查找式意图识别的数据集有限。【结论】基于采莓模型启示提出的特征能对探索式与查找式意图进行有效区分。
-
关键词
查询意图识别
探索式意图
查找式意图
采莓模型
-
Keywords
Query Intent Recognition
Exploratory Intent
Lookup Intent
BerryPicking Model
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
G354
[文化科学—情报学]
-