知识图谱嵌入的目标是为知识图谱中的实体和关系生成低维连续的特征向量,以便计算机能够通过数学运算来挖掘知识的潜在语义,并将其应用于三元组补全、实体分类和实体解析等下游任务。翻译模型(Trans)是一种简单而有效的知识图谱嵌入方法...知识图谱嵌入的目标是为知识图谱中的实体和关系生成低维连续的特征向量,以便计算机能够通过数学运算来挖掘知识的潜在语义,并将其应用于三元组补全、实体分类和实体解析等下游任务。翻译模型(Trans)是一种简单而有效的知识图谱嵌入方法,其采用负采样的方法来提高知识图谱嵌入的准确性。然而,传统的负采样方法采用随机负采样,容易生成低质量的负三元组,从而导致实体和关系的嵌入向量训练不准确。针对这个问题,该文提出基于Canopy和K-means方法的相似实体负样本生成器(Negative Sampling of Similar Entities,NSSE),用于生成高质量的负样本。实验结果表明,使用NSSE的翻译模型相比原有模型在嵌入向量生成方面取得更好的效果。展开更多
文摘知识图谱嵌入的目标是为知识图谱中的实体和关系生成低维连续的特征向量,以便计算机能够通过数学运算来挖掘知识的潜在语义,并将其应用于三元组补全、实体分类和实体解析等下游任务。翻译模型(Trans)是一种简单而有效的知识图谱嵌入方法,其采用负采样的方法来提高知识图谱嵌入的准确性。然而,传统的负采样方法采用随机负采样,容易生成低质量的负三元组,从而导致实体和关系的嵌入向量训练不准确。针对这个问题,该文提出基于Canopy和K-means方法的相似实体负样本生成器(Negative Sampling of Similar Entities,NSSE),用于生成高质量的负样本。实验结果表明,使用NSSE的翻译模型相比原有模型在嵌入向量生成方面取得更好的效果。