为了提高跨境民族文化文本检索的精度,提出一种方法——融入文档词权重的跨境民族文化文本检索方法(Cross-Border Ethnic Cultural Text Retrieval Method Incorporating Document word Weight,CETR)。该方法在输入端对查询词和文档词通...为了提高跨境民族文化文本检索的精度,提出一种方法——融入文档词权重的跨境民族文化文本检索方法(Cross-Border Ethnic Cultural Text Retrieval Method Incorporating Document word Weight,CETR)。该方法在输入端对查询词和文档词通过Bi-LSTM进行初步特征提取,在形成交互矩阵时融入文档词权重,利用CNN提取交互矩阵上的特征,得到基本的关联信号。通过Max-pooling提取最强的关联信号,并投影到多层感知器神经网络中,最终获得查询与文档的匹配得分。实验结果表明,对比精度最高的通用模型,CETR模型NDCG@10提高了约9.7%,P@1提高了约8.9%,MAP提高了约9.8%。由此说明该模型在面向跨境民族文化领域的检索任务上效果更好。展开更多
文摘为了提高跨境民族文化文本检索的精度,提出一种方法——融入文档词权重的跨境民族文化文本检索方法(Cross-Border Ethnic Cultural Text Retrieval Method Incorporating Document word Weight,CETR)。该方法在输入端对查询词和文档词通过Bi-LSTM进行初步特征提取,在形成交互矩阵时融入文档词权重,利用CNN提取交互矩阵上的特征,得到基本的关联信号。通过Max-pooling提取最强的关联信号,并投影到多层感知器神经网络中,最终获得查询与文档的匹配得分。实验结果表明,对比精度最高的通用模型,CETR模型NDCG@10提高了约9.7%,P@1提高了约8.9%,MAP提高了约9.8%。由此说明该模型在面向跨境民族文化领域的检索任务上效果更好。