期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于自编码器语义哈希的大规模文本预处理 被引量:3
1
作者 张忠林 杨朴舟 《计算机仿真》 北大核心 2019年第3期225-229,260,共6页
展示了一种从大规模文本中学习文本索引的深层图形模型,深层图形模型采用自编码器作为基础结构。该图模型最终输出的值具有较强的解释性,并且比潜在语义索引更好地表示每个文档。当最深层使用少数二进制变量输出时(例如32位),图形模型... 展示了一种从大规模文本中学习文本索引的深层图形模型,深层图形模型采用自编码器作为基础结构。该图模型最终输出的值具有较强的解释性,并且比潜在语义索引更好地表示每个文档。当最深层使用少数二进制变量输出时(例如32位),图形模型将文档通过语义散列的方式映射到存储器对应的地址上,使得语义上相似的文档位于附近的地址处。然后可以通过访问所有仅相差几位的地址来找到类似于查询文本的文本。通过查询文件地址的方式,基于近似匹配方式的散列编码的效率比局部敏感散列快得多,通过使用语义哈希来过滤采用TF-IDF表示的文本,将实现更高的准确性。 展开更多
关键词 自编码器 语义哈希 潜在语义索引 文本索引
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部