期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
查询词相似度加权的邻近性检索方法 被引量:2
1
作者 乔亚男 刘跃虎 齐勇 《模式识别与人工智能》 CSCD 北大核心 2013年第2期189-194,共6页
传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成"平行概念效应",影响邻近性检索方法的性能.文中提出一种查询词相似度加权的邻近性检索方法.该方法根据查询词之间的语义相似度对查询词邻... 传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成"平行概念效应",影响邻近性检索方法的性能.文中提出一种查询词相似度加权的邻近性检索方法.该方法根据查询词之间的语义相似度对查询词邻近性统计量加权,可进一步推断用户的实际信息需求,挖掘查询中蕴含的更深层次的信息.实验结果表明,在短查询较多的应用环境下,文中方法可较显著提升传统邻近性检索模型的性能,有效规避查询词邻近性的平行概念效应. 展开更多
关键词 信息检索 语义相似度 查询词邻近性(QTP) 信息需求
下载PDF
基于查询词邻近度的专家搜索算法 被引量:1
2
作者 杨柳 张文生 《计算机工程》 CAS CSCD 北大核心 2011年第6期7-8,11,共3页
提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验... 提出一种基于查询词邻近度的专家搜索算法。根据查询词在窗口中的共现关系构建概率语言模型的查询词邻近度,利用经典概率模型作为背景平滑,通过对多个查询词在文档中的距离关系建模,结合候选人与查询词之间的距离对候选专家排序。实验结果表明,在该算法中引入查询词邻近度可以提高搜索准确率,应用候选人与查询词2种邻近度可以取得更好的专家搜索效果。 展开更多
关键词 专家搜索 查询词邻近度 概率语言模型
下载PDF
时间敏感查询词补全关键技术研究综述
3
作者 田萱 张骁 +1 位作者 孟祥光 陈志泊 《电子学报》 EI CAS CSCD 北大核心 2015年第6期1160-1168,共9页
搜索引擎的查询词补全技术给搜索用户提供了较好的用户体验.针对用户检索需求随时间变化而不同这一问题,时间敏感查询词自动补全成为研究热点.时间敏感查询词补全在生成查询词补全候选列表时拟合多种时间因素,呈现出与传统查询词补全不... 搜索引擎的查询词补全技术给搜索用户提供了较好的用户体验.针对用户检索需求随时间变化而不同这一问题,时间敏感查询词自动补全成为研究热点.时间敏感查询词补全在生成查询词补全候选列表时拟合多种时间因素,呈现出与传统查询词补全不同的特点.本文首先介绍了时间敏感查询词补全的定义和分类,然后从查询词时间敏感类型判断、补全候选词权值计算、候选词排序计算三个步骤分析了关键技术,最后对技术评价方法和技术未来发展难点与热点进行了总结和展望. 展开更多
关键词 时间敏感 查询词补全 信息检索 候选权值计算
下载PDF
具有孤立项过滤的信息检索查询词的分析方法
4
作者 乔亚男 齐勇 侯迪 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第8期6-10,63,共6页
针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度较高的查询词对之间具有强可替代性这一事实,从查询词及其实例中分解出查询内的孤立项和文档内的孤立... 针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度较高的查询词对之间具有强可替代性这一事实,从查询词及其实例中分解出查询内的孤立项和文档内的孤立项,在分析查询词临近性之前预先进行孤立项过滤,使之不参与QTP统计量的计算,由此减小了过分强调临近性对查准率的影响.实验结果表明,对于词汇相似度差异比较显著的查询,进行孤立项过滤的查询词临近性分析方法的平均检索精确度比传统分析方法提高14%. 展开更多
关键词 信息检索 查询词临近性 孤立项 汇相似度
下载PDF
基于查询词相关性传播的专家检索方法 被引量:2
5
作者 郑义平 王勇 +1 位作者 李佳 王瑛 《计算机工程与设计》 CSCD 北大核心 2014年第6期2165-2169,共5页
针对专家检索存在性能低等问题,提出一种基于查询词相关性传播的专家检索方法,不仅考虑与专家相关的文档内容,还考虑了专家在文档中的共现关系。将用户输入的查询切分成多个查询词,使用经典的专家语言模型计算专家关于查询词的初始得分... 针对专家检索存在性能低等问题,提出一种基于查询词相关性传播的专家检索方法,不仅考虑与专家相关的文档内容,还考虑了专家在文档中的共现关系。将用户输入的查询切分成多个查询词,使用经典的专家语言模型计算专家关于查询词的初始得分,根据专家的共现关系构建带权有向图,采用相关性传播模型对初始得分进行提升,计算得到专家关于查询的最终得分。实验结果表明,该方法对专家检索性能有很好的提升。 展开更多
关键词 专家检索 查询词 专家语言模型 共现关系 相关性传播
下载PDF
一种融入用户点击模型Word2Vec查询词聚类 被引量:4
6
作者 杨河彬 贺樑 杨静 《小型微型计算机系统》 CSCD 北大核心 2016年第4期676-681,共6页
用户查询聚类能够帮助搜索引擎了解当前热点、用户兴趣及需求,在搜索引擎性能优化及定向广告投放等起到了非常重要的作用.基于用户查询词长度非常短的特点,提出基于Word2Vec的词向量的用户查询词表示方法.并在Word2Vec的基础上提出CT-Wo... 用户查询聚类能够帮助搜索引擎了解当前热点、用户兴趣及需求,在搜索引擎性能优化及定向广告投放等起到了非常重要的作用.基于用户查询词长度非常短的特点,提出基于Word2Vec的词向量的用户查询词表示方法.并在Word2Vec的基础上提出CT-Word2Vec神经网络语言模型.CT-Word2Vec模型不仅利用词汇的上下文信息将词转化成向量,而且还将用户的搜索点击行为融入词向量的学习过程当中.聚类实验结果表明,基于Word2Vec的词向量的查询词表示方法相对于传统的词袋法在熵、纯度衡量指标上有20%到30%的提高.基于CT-Word2Vec的词向量表示方法与Word2Vec相比有2%到4%的提升. 展开更多
关键词 查询词 聚类 Word2Vec 点击模型 CT-Word2Vec
下载PDF
基于网络知识库与通用搜索引擎的查询词扩展方法 被引量:1
7
作者 毛琪 黄永峰 《计算机应用》 CSCD 北大核心 2012年第A02期5-9,共5页
对查询词进行扩展是为了进一步理解用户的搜索意图,使得搜索引擎返回更加准确的信息。已有的方法主要研究如何寻找与查询词相似的词,然而相似的户的词并一定能真正反映用意图。从网络知识库中抽取查询词的待扩展词,并利用通用搜索引擎... 对查询词进行扩展是为了进一步理解用户的搜索意图,使得搜索引擎返回更加准确的信息。已有的方法主要研究如何寻找与查询词相似的词,然而相似的户的词并一定能真正反映用意图。从网络知识库中抽取查询词的待扩展词,并利用通用搜索引擎对待扩展词进行排序,这样的查询词扩展方法充分利用了网络群体智慧,使得扩展词更加贴近用户的搜索期望。通过进行实验对比发现,该方法有较好的结果。 展开更多
关键词 查询词扩展 网络知识库 搜索引擎 信息检索
下载PDF
基于查询词扩展的文本检索算法研究 被引量:1
8
作者 王海云 刘金岭 《计算机与数字工程》 2011年第6期15-17,35,共4页
针对文本检索中所使用的查询词可能与文本词语不匹配而影响检索效果这一问题,提出了一种基于上下文的查询词扩展的方法,该方法根据查询词出现的上下文信息进行扩展词选择,同时考虑到查询扩展词与整个查询语句以及查询词的位置关系。实... 针对文本检索中所使用的查询词可能与文本词语不匹配而影响检索效果这一问题,提出了一种基于上下文的查询词扩展的方法,该方法根据查询词出现的上下文信息进行扩展词选择,同时考虑到查询扩展词与整个查询语句以及查询词的位置关系。实验结果表明,该方法大大提高了平均查准率。 展开更多
关键词 查询词 查询扩展 文本检索 上下文 共现
下载PDF
基于查询词扩展的中文垃圾短信检索 被引量:6
9
作者 刘金岭 《计算机工程》 CAS CSCD 北大核心 2011年第8期52-54,共3页
在垃圾短信检索中所使用的关键词与短信文本集中的词不匹配,从而影响检索效果。为此,提出一种基于上下文查询词扩展的检索方法,该方法根据关键词出现的上下文信息进行查询词扩展选择,同时考虑查询扩展词与整个查询语句及查询词的位置关... 在垃圾短信检索中所使用的关键词与短信文本集中的词不匹配,从而影响检索效果。为此,提出一种基于上下文查询词扩展的检索方法,该方法根据关键词出现的上下文信息进行查询词扩展选择,同时考虑查询扩展词与整个查询语句及查询词的位置关系。选取3 000条短信文本进行实验,结果表明该方法能提高平均查准率。 展开更多
关键词 垃圾短信 关键 查询扩展 检索
下载PDF
基于电子政务平台查询关键词共现多维可视化聚类分析研究 被引量:6
10
作者 夏立新 程秀峰 桂思思 《情报学报》 CSSCI 北大核心 2012年第4期352-361,共10页
针对某政府网站某一时间段的服务器日志中抽取出的搜索引擎查询信息,提出了一系列规则来遴选出有代表性的核心查询词,并分别针对每个核心查询词进行共现与可视化聚类分析,创建基于共现频率的相似矩阵,采用非计量MDS算法导出三维可视化... 针对某政府网站某一时间段的服务器日志中抽取出的搜索引擎查询信息,提出了一系列规则来遴选出有代表性的核心查询词,并分别针对每个核心查询词进行共现与可视化聚类分析,创建基于共现频率的相似矩阵,采用非计量MDS算法导出三维可视化聚类图,并且采用基于瓦兹算法(Wards method)的层次聚类法验证了MDS算法三维可视化聚类结果的正确性、有效性与优越性.同时,我们针对日志的特点开发了适合本研究的一系列分析工具,从而能够帮助我们对同类网站、不同结构的日志信息进行挖掘、提取、选择和加工,并利用统计分析工具对加工结果进行可视化聚类分析和比较研究.实验结果表明,本分析方法充分发挥了MDS分析方法与各种向量空间聚类计算优点,能更好地观察对象间的聚类样式、形状以及距离,能够为构建基于主题图的政府电子政务平台优化研究提供理论方法和实证依据. 展开更多
关键词 电子政务门户 搜索引擎 查询词 聚类 MDS 相似度矩阵
下载PDF
基于音素混淆模型的集外词查询项扩展方法 被引量:1
11
作者 陆梨花 张连海 《信息工程大学学报》 2014年第4期459-465,共7页
为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weighted finite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题。首先由G2P(graphe... 为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weighted finite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题。首先由G2P(grapheme-to-phoneme)模型生成查询项的发音序列,然后利用音素混淆模型将发音序列扩展成N-best发音,以补偿识别错误造成Lattice建立的索引与查询项发音序列之间音素表示差异带来的影响,从而有效降低漏警率。实验结果表明,加入音素混淆模型之后,系统集外词检索性能有明显提升。 展开更多
关键词 集外查询项扩展 音素混淆模型 加权有限状态转换器 语音查询项检索
下载PDF
个性化的社会标签查询扩展技术研究 被引量:8
12
作者 张志强 孟庆海 谢晓芹 《计算机科学与探索》 CSCD 2010年第9期812-829,共18页
随着互联网上的信息日益增长,个性化的搜索需求越来越迫切,由于用户兴趣的不同和行为的差异,如何为不同的用户提供不同的检索结果成为一个具有挑战性的问题。首先对现有搜索引擎的个性化信息检索和查询扩展技术进行了分类总结,分析了它... 随着互联网上的信息日益增长,个性化的搜索需求越来越迫切,由于用户兴趣的不同和行为的差异,如何为不同的用户提供不同的检索结果成为一个具有挑战性的问题。首先对现有搜索引擎的个性化信息检索和查询扩展技术进行了分类总结,分析了它们各自的优缺点。然后提出了基于社会化标签的个性化查询词扩展方法。这些方法通过从用户所收藏的社会化标签或标签所对应的网页中提取出和用户查询词相关的词,来对用户的初始查询进行扩展。最后利用Delicious网站上的用户数据,对比研究了这几种个性化查询扩展算法。通过与Google进行对比分析实验,结果表明所提出的社会化标签的个性化查询词扩展方法能够较好地满足用户的个性化需求,检索结果比Google的检索结果更接近用户需求。 展开更多
关键词 个性化搜索 查询词扩展 社会化标签
下载PDF
基于权重编辑距离的XML查询 被引量:1
13
作者 李元韬 曹志宇 李敬文 《兰州交通大学学报》 CAS 2010年第3期108-111,共4页
针对XML文本文档信息查询中查询准确率不高的情况,本文提出一种基于权重树间编辑距离的XML查询方案,通过计算关键词内容权重和树间编辑距离结构权重,可以找到最能代表用户查询意图的相关文档.实验结果表明,与传统的查询方法相比,改进后... 针对XML文本文档信息查询中查询准确率不高的情况,本文提出一种基于权重树间编辑距离的XML查询方案,通过计算关键词内容权重和树间编辑距离结构权重,可以找到最能代表用户查询意图的相关文档.实验结果表明,与传统的查询方法相比,改进后查询有比较高的准确率,具有良好的效果. 展开更多
关键词 XML信息查询 查询词权重 树间编辑距离
下载PDF
一种个性化查询扩展方法 被引量:3
14
作者 于春雷 朱征宇 +1 位作者 何杰 董曙佳 《计算机工程与应用》 CSCD 2012年第2期119-123,129,共6页
针对当前主流web搜索引擎存在信息检索个性化效果差和信息检索的精确率低等缺点,通过对已有方法的技术改进,介绍了一种基于用户历史兴趣网页和历史查询词相结合的个性化查询扩展方法。当用户在搜索引擎上输入查询词时,能根据学习到的当... 针对当前主流web搜索引擎存在信息检索个性化效果差和信息检索的精确率低等缺点,通过对已有方法的技术改进,介绍了一种基于用户历史兴趣网页和历史查询词相结合的个性化查询扩展方法。当用户在搜索引擎上输入查询词时,能根据学习到的当前用户兴趣模型动态判定用户潜在兴趣和计算词间相关度,并将恰当的扩展查询词组提交给搜索引擎,从而实现不同用户输入同一查询词能返回不同检索结果的目的。实验验证了算法的有效性,检索精确率也比原方法有明显提高。 展开更多
关键词 历史兴趣网页 历史查询词 个性化查询扩展 间相关度 搜索引擎
下载PDF
基于用户查询意图的搜索排序算法 被引量:1
15
作者 张美珍 王治莹 《天津理工大学学报》 2012年第3期46-51,共6页
目前互联网技术的研究热点是智能化的、个性化的服务,而传统的Web搜索排序算法和已有的个性化排序已经不能满足政府、企业等用户的信息查询需要.本文将研究核心定位到充分理解用户查询偏好上,提出了基于用户偏好的PageRank算法.文中利... 目前互联网技术的研究热点是智能化的、个性化的服务,而传统的Web搜索排序算法和已有的个性化排序已经不能满足政府、企业等用户的信息查询需要.本文将研究核心定位到充分理解用户查询偏好上,提出了基于用户偏好的PageRank算法.文中利用用户互反馈技术修正查询关键词,利用语义相关性技术分析用户查询意图,理解用户偏好.改进的算法完善了搜索查询的可靠性依据,能够较好地挖掘用户的偏好主题,贴近用户的查询目的,提高搜索查询效率和用户满意度. 展开更多
关键词 PAGERANK 用户偏好 查询词修正 查询意图识别
下载PDF
结合文档处理与查询处理技术的Web服务搜索方法
16
作者 赵文玉 周栋 +1 位作者 曹步清 刘建勋 《计算机集成制造系统》 EI CSCD 北大核心 2018年第7期1830-1837,共8页
为了提高Web服务搜索结果的准确性和改善用户的查询体验,使用文档处理技术与查询处理技术一直是Web服务搜索研究中的热点课题。为此,本文提出一种结合两种技术的Web服务搜索方法。考虑文档与文档之间的关系,通过正则化框架,融合第一轮... 为了提高Web服务搜索结果的准确性和改善用户的查询体验,使用文档处理技术与查询处理技术一直是Web服务搜索研究中的热点课题。为此,本文提出一种结合两种技术的Web服务搜索方法。考虑文档与文档之间的关系,通过正则化框架,融合第一轮检索结果分数,实现搜索结果列表中文档重排序;基于排名靠前文档构建扩展词集合,从构建扩展词集合中选取候选扩展词进行查询词扩展。在NTCIR数据集上的实验结果表明,该方法能够有效提高Web服务搜索中排名顶端结果的准确率。 展开更多
关键词 Web服务搜索 文档处理技术 查询词处理技术 正则化框架 扩展集合
下载PDF
基于查询意图的长尾查询推荐 被引量:7
17
作者 白露 郭嘉丰 +1 位作者 曹雷 程学旗 《计算机学报》 EI CSCD 北大核心 2013年第3期636-642,共7页
查询推荐是一种提升用户搜索效率的重要工具.传统的查询推荐方法关注频度较高的查询,但对于那些频度较低的长尾查询,由于其信息的稀疏性而难以产生好的推荐效果.另外,传统的方法由于没有考虑查询意图对推荐结果的影响,故对长尾查询的推... 查询推荐是一种提升用户搜索效率的重要工具.传统的查询推荐方法关注频度较高的查询,但对于那些频度较低的长尾查询,由于其信息的稀疏性而难以产生好的推荐效果.另外,传统的方法由于没有考虑查询意图对推荐结果的影响,故对长尾查询的推荐会受到查询中噪声单词的影响.该文提出了一种新的关于词项查询图(term-query graph)概率混合模型,该模型能够准确地发掘出用户的查询意图.另外,文中还提出了一种融合查询意图的查询推荐方法,该方法可以将新查询中单词的推荐结果按查询意图自然地融合起来,从而避免了噪声单词对推荐结果的影响.实验结果表明,通过考虑查询意图,可以显著提高长尾查询推荐的相关性. 展开更多
关键词 查询推荐 长尾查询 概率混合模型 查询意图 查询
下载PDF
语音关键词识别系统的模型训练及性能评价 被引量:3
18
作者 李娜 葛万成 《信息通信》 2020年第3期8-10,共3页
随着AI的发展,智能家居、语音助手等成为了语音识别的重要应用。文章在kaldi中以智能家居为背景,搭建了完整的语音关键词识别系统,分析了基于GMM-HMM模型下的单音素训练、三音素训练以及线性区分分析(LDA)、最大似然线性变换(MLLT)和说... 随着AI的发展,智能家居、语音助手等成为了语音识别的重要应用。文章在kaldi中以智能家居为背景,搭建了完整的语音关键词识别系统,分析了基于GMM-HMM模型下的单音素训练、三音素训练以及线性区分分析(LDA)、最大似然线性变换(MLLT)和说话人适应(SAT)等技术对关键词识别系统的影响,并用F4DE分析了不同训练算法下的关键词识别的性能的差异。仿真表明三音素下结合SAT+MLLT+LDA技术的关键词识别效果较好,TWV可以达到0.9549。最后给出了针对不同应用需求环境下的关键词最佳阈值选取算法,通过这个最佳门限值可以最小化误警率和虚警率,从而使得TWV的值最小,以满足不同语音关键词识别应用场景下的需求。 展开更多
关键词 语音识别 kaldi 声学模型 查询词权重代价 最佳阈值
下载PDF
支持空间数据移动查询的索引研究
19
作者 张素智 赵亚楠 杨芮 《湖北民族学院学报(自然科学版)》 CAS 2017年第4期423-428,共6页
随着智能移动设备的普及,空间数据也随之呈现出几何级增长,结合空间对象位置和关键字的查询越来越受到人们的关注.然而,在之前的大量研究中多是假设空间词为不变的,但是在实际生活中,空间对象的位置有许多是移动的,这就可能导致查询结... 随着智能移动设备的普及,空间数据也随之呈现出几何级增长,结合空间对象位置和关键字的查询越来越受到人们的关注.然而,在之前的大量研究中多是假设空间词为不变的,但是在实际生活中,空间对象的位置有许多是移动的,这就可能导致查询结果不符合实际需求.针对上述状况,提出一种支持移动空间关键词查询方法.经实验验证,该方法具备一定的实用性,且查询效率有较大的提高. 展开更多
关键词 空间数据 移动空间查询 APR-tree 空间关键
下载PDF
基于文本扩展模型的网络视频聚类方法 被引量:2
20
作者 刘璐 贾彩燕 《智能系统学报》 CSCD 北大核心 2017年第6期799-805,共7页
随着视频分享网站的兴起和快速发展,互联网上的视频数量呈爆炸式增长,对视频的组织及分类成为视频有效使用的基础。视频聚类技术由于只需要考虑视频数据内在的簇结构、不需要人工干预,越来越受到人们的青睐。现有的视频聚类方法有基于... 随着视频分享网站的兴起和快速发展,互联网上的视频数量呈爆炸式增长,对视频的组织及分类成为视频有效使用的基础。视频聚类技术由于只需要考虑视频数据内在的簇结构、不需要人工干预,越来越受到人们的青睐。现有的视频聚类方法有基于视频关键帧视觉相似性的方法、基于视频标题文本聚类的方法、文本和视觉多模态融合的方法。基于视频标题文本聚类的视频聚类方法由于其简便性与高效性而被企业界广泛使用,但视频标题由于其短文本的语义稀疏特性,聚类效果欠佳。为此,本文面向社会媒体视频,提出了一种社会媒体平台上视频相关多源文本融合的视频聚类方法,以克服由于视频标题的短文本带来的语义稀疏问题。不同文本聚类算法上的实验结果证明了多源文本数据融合方法的有效性。 展开更多
关键词 网络视频聚类 共点击视频 相关查询词 文本聚类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部