期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
归并奇异值分解:一种快速更新隐含语义索引的方法
1
作者 黄明 林家骏 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第3期397-403,共7页
隐含语义索引(LSI)是一种解决信息检索中二义性问题和大规模文档分类的文档索引方法。为了提高LSI效率,应对大数据场景下文档量爆发式增长的问题,提出了一种通过归并奇异值分解来实现LSI快速更新的方法。该方法利用p-边宽单边对角矩阵... 隐含语义索引(LSI)是一种解决信息检索中二义性问题和大规模文档分类的文档索引方法。为了提高LSI效率,应对大数据场景下文档量爆发式增长的问题,提出了一种通过归并奇异值分解来实现LSI快速更新的方法。该方法利用p-边宽单边对角矩阵和箭头矩阵分解技术来加快中间矩阵的奇异值分解过程,并通过将新增文档矩阵的薄奇异值分解(PSVD)归并进主文档矩阵的PSVD以避免重复计算,加快LSI更新速度。通过数学证明论证了该方法的有效性,并讨论了该算法扩展到词条更新场景中的情形。在多个测试数据集上的实验验证了该方法可以在保证检索准确率的前提下有效提高LSI的更新效率。 展开更多
关键词 信息检索 隐含语义索引 奇异值分解 文档聚类 QR分解 箭头型矩阵
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部