期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
稠密向量实体检索模型的二值化提速压缩 被引量:1
1
作者 王苑铮 范意兴 +2 位作者 陈薇 张儒清 郭嘉丰 《模式识别与人工智能》 EI CSCD 北大核心 2023年第1期60-69,共10页
在实体检索任务中,为了从大规模实体库中高效筛选与查询相关的候选实体,可使用稠密向量检索模型.然而在现有的稠密向量检索模型中,由于实体向量维度较高,导致实时计算效率较低、存储空间较大.文中通过实验发现这些实体向量存在大量的冗... 在实体检索任务中,为了从大规模实体库中高效筛选与查询相关的候选实体,可使用稠密向量检索模型.然而在现有的稠密向量检索模型中,由于实体向量维度较高,导致实时计算效率较低、存储空间较大.文中通过实验发现这些实体向量存在大量的冗余信息:一方面,绝大多数实体向量分布在互不相同的象限里;另一方面,语义相近的实体所在的象限也更近.因此,文中提出二值化的实体检索方法,用于压缩实体向量,加速相似度计算.具体而言,方法利用符号函数(sign),二值化压缩高维稠密的浮点向量,并通过汉明距离加快检索.从理论上分析文中方法保证检索性能的原因.通过定性、定量的分析实验验证理论的正确性,并给出基于随机升维旋转的二值检索性能改善方法. 展开更多
关键词 实体检索 嵌入式表示 稠密向量检索 近似近邻检索 乘积量化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部