摘要
开放的知识库缺少本体信息,进一步影响服务下游应用的能力,需对实体进行规范化。传统相似性度量方法及现有机器学习/深度学习方法泛化能力有待提升。提出结合核函数与神经网络的规范化表示框架,引入外源辅助信息,与实体嵌入拼接,增强细粒度的维度互动以改善语义识别能力,将相似性得分用于实体聚类。在行业数据集和开放知识图数据集上验证框架的实体规范化能力,并进一步开展链路预测任务,与基准模型比较以验证性能。
基金
福建省教育科学“十三五”规划2020年度课题(项目编号:FJJKCG20-402)
福建省中青年教师科技类教育科研项目(项目编号:JAT210619)。