-
题名基于查询词扩展的中文垃圾短信检索
被引量:6
- 1
-
-
作者
刘金岭
-
机构
淮阴工学院计算机工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第8期52-54,共3页
-
文摘
在垃圾短信检索中所使用的关键词与短信文本集中的词不匹配,从而影响检索效果。为此,提出一种基于上下文查询词扩展的检索方法,该方法根据关键词出现的上下文信息进行查询词扩展选择,同时考虑查询扩展词与整个查询语句及查询词的位置关系。选取3 000条短信文本进行实验,结果表明该方法能提高平均查准率。
-
关键词
垃圾短信
关键词
查询扩展词
检索
-
Keywords
junk SMS
key words
query words expansion
retrieval
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于查询词扩展的文本检索算法研究
被引量:1
- 2
-
-
作者
王海云
刘金岭
-
机构
江南大学物联网工程学院
淮阴工学院计算机工程学院
-
出处
《计算机与数字工程》
2011年第6期15-17,35,共4页
-
基金
淮安科技计划项目(编号:HAG09061)
淮阴工学院重点基金项目(编号:HGA0907)资助
-
文摘
针对文本检索中所使用的查询词可能与文本词语不匹配而影响检索效果这一问题,提出了一种基于上下文的查询词扩展的方法,该方法根据查询词出现的上下文信息进行扩展词选择,同时考虑到查询扩展词与整个查询语句以及查询词的位置关系。实验结果表明,该方法大大提高了平均查准率。
-
关键词
查询词
查询扩展词
文本检索
上下文
词共现
-
Keywords
search term
query expansion
text retrieval
context
word co-occurrence
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于网络知识库与通用搜索引擎的查询词扩展方法
被引量:1
- 3
-
-
作者
毛琪
黄永峰
-
机构
清华大学电子工程系
-
出处
《计算机应用》
CSCD
北大核心
2012年第A02期5-9,共5页
-
基金
国家863计划项目(2012AA011004)
清华大学自主科研项目(20111081023)
-
文摘
对查询词进行扩展是为了进一步理解用户的搜索意图,使得搜索引擎返回更加准确的信息。已有的方法主要研究如何寻找与查询词相似的词,然而相似的户的词并一定能真正反映用意图。从网络知识库中抽取查询词的待扩展词,并利用通用搜索引擎对待扩展词进行排序,这样的查询词扩展方法充分利用了网络群体智慧,使得扩展词更加贴近用户的搜索期望。通过进行实验对比发现,该方法有较好的结果。
-
关键词
查询词扩展
网络知识库
搜索引擎
信息检索
-
Keywords
query expansion
Web knowledge base
search engine
information retrieval
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于音素混淆模型的集外词查询项扩展方法
被引量:1
- 4
-
-
作者
陆梨花
张连海
-
机构
信息工程大学
-
出处
《信息工程大学学报》
2014年第4期459-465,共7页
-
基金
国家自然科学基金资助项目(61175017)
-
文摘
为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weighted finite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题。首先由G2P(grapheme-to-phoneme)模型生成查询项的发音序列,然后利用音素混淆模型将发音序列扩展成N-best发音,以补偿识别错误造成Lattice建立的索引与查询项发音序列之间音素表示差异带来的影响,从而有效降低漏警率。实验结果表明,加入音素混淆模型之后,系统集外词检索性能有明显提升。
-
关键词
集外词查询项扩展
音素混淆模型
加权有限状态转换器
语音查询项检索
-
Keywords
query expansion for out-of-vocabulary
grapheme-to-phoneme
phonetic confusion mod-el
weighted finite-state transducer
spoken term detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名个性化的社会标签查询扩展技术研究
被引量:8
- 5
-
-
作者
张志强
孟庆海
谢晓芹
-
机构
哈尔滨工程大学计算机科学与技术学院
-
出处
《计算机科学与探索》
CSCD
2010年第9期812-829,共18页
-
基金
国家自然科学基金No.60803037
60803036
+2 种基金
国家高技术研究发展计划(863)No.2009AA01Z143
中央高校基本科研业务费专项资金No.HEUCFZ1010
HEUCF100602~~
-
文摘
随着互联网上的信息日益增长,个性化的搜索需求越来越迫切,由于用户兴趣的不同和行为的差异,如何为不同的用户提供不同的检索结果成为一个具有挑战性的问题。首先对现有搜索引擎的个性化信息检索和查询扩展技术进行了分类总结,分析了它们各自的优缺点。然后提出了基于社会化标签的个性化查询词扩展方法。这些方法通过从用户所收藏的社会化标签或标签所对应的网页中提取出和用户查询词相关的词,来对用户的初始查询进行扩展。最后利用Delicious网站上的用户数据,对比研究了这几种个性化查询扩展算法。通过与Google进行对比分析实验,结果表明所提出的社会化标签的个性化查询词扩展方法能够较好地满足用户的个性化需求,检索结果比Google的检索结果更接近用户需求。
-
关键词
个性化搜索
查询词扩展
社会化标签
-
Keywords
personalized search
query expansion
social tag
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名交互式智能文本分析引擎研究
- 6
-
-
作者
吴尚洋
姜微
陈洒然
杨冬梅
-
机构
不详
-
出处
《电信技术研究》
2020年第2期41-47,共7页
-
文摘
搜索技术与文本分类技术结合能够提升数据分析人员搜集和分析资料的效率,但存在搜索不准确,以及分类缺少标注数据等技术难点。本文介绍一种交互式素材智能筛选方法,集成查询词自动扩展、PU分类学习、语义相似归并等技术,实验结果表明可提升文本查询和分析效率。
-
关键词
查询词扩展
PU学习
语义相似归并
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-