-
题名基于词项扩展的XML信息检索反馈技术
被引量:2
- 1
-
-
作者
温馨
陈群
娄颖
-
机构
西北工业大学计算机学院
河南科技大学电信工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第20期36-38,共3页
-
基金
国家"863"计划基金资助重点项目(2009AA1Z134)
国家自然科学基金资助项目(60803043
60720106001)
-
文摘
为提高XML信息检索的查询准确率,提出一种基于词项扩展的XML信息检索反馈技术。利用词项所在节点的语义权重、词项与查询词间的相邻频度、共现程度,评估词项权重并排序,取权重较大的词项对初始检索词进行扩展,给出各因子的计算方法。在Wikipedia2009数据集上的实验结果表明,扩展后的查询准确率较高。
-
关键词
XML信息检索
词项扩展
反馈
语义权重
相邻频度
-
Keywords
XML information retrieval
term expansion
feedback
semantic weights
adjacency frequency
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于音素混淆模型的集外词查询项扩展方法
被引量:1
- 2
-
-
作者
陆梨花
张连海
-
机构
信息工程大学
-
出处
《信息工程大学学报》
2014年第4期459-465,共7页
-
基金
国家自然科学基金资助项目(61175017)
-
文摘
为了提高语音查询项检索系统中集外词检索的性能,在加权有限状态转换器(weighted finite-state transducer,WFST)框架下提出了一种基于音素混淆模型的集外词查询项扩展技术,将查询项扩展成多发音序列来解决集外词问题。首先由G2P(grapheme-to-phoneme)模型生成查询项的发音序列,然后利用音素混淆模型将发音序列扩展成N-best发音,以补偿识别错误造成Lattice建立的索引与查询项发音序列之间音素表示差异带来的影响,从而有效降低漏警率。实验结果表明,加入音素混淆模型之后,系统集外词检索性能有明显提升。
-
关键词
集外词查询项扩展
音素混淆模型
加权有限状态转换器
语音查询项检索
-
Keywords
query expansion for out-of-vocabulary
grapheme-to-phoneme
phonetic confusion mod-el
weighted finite-state transducer
spoken term detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-