基于对水利知识特点的分析,提出了水利综合知识体系的描述方法,包括水利知识的定义、组成与关联;构建了水利知识图谱的构建框架和关键技术体系,以水利行业结构化业务数据的实体关系转换为基础,采用双向长短期记忆神经网络(Bi-directiona...基于对水利知识特点的分析,提出了水利综合知识体系的描述方法,包括水利知识的定义、组成与关联;构建了水利知识图谱的构建框架和关键技术体系,以水利行业结构化业务数据的实体关系转换为基础,采用双向长短期记忆神经网络(Bi-directional Long Shot-Term Memory Neural Network,BiLSTM)与条件随机场(Conditional Random Fields,CRF)方法识别半结构化、非结构化学科知识文本以及互联网数据中的水利实体,使用模式匹配和共现网络分析方法抽取各实体间关系,对涉水对象及其属性进行补充,基于风险最小化的最小风险映射模型(Risk Minimization based Ontology Mapping,RiMOM)进行了多源异构水利实体的融合,实现了涉水对象与水利学科知识的融合与关联,形成水利综合知识的建模和表达。在图谱构建过程中,累计抽取水利实体136万个,构建实体关系300余万条,抽取的水利实体对象的标注准确率在80%以上。基于该图谱可实现水利知识的跨域查询与检索,学科图谱与水网图谱间关系查询,挖掘不同水利实体间的隐含关系,提高水利知识检索的效率和知识挖掘发现的能力。展开更多
文摘基于对水利知识特点的分析,提出了水利综合知识体系的描述方法,包括水利知识的定义、组成与关联;构建了水利知识图谱的构建框架和关键技术体系,以水利行业结构化业务数据的实体关系转换为基础,采用双向长短期记忆神经网络(Bi-directional Long Shot-Term Memory Neural Network,BiLSTM)与条件随机场(Conditional Random Fields,CRF)方法识别半结构化、非结构化学科知识文本以及互联网数据中的水利实体,使用模式匹配和共现网络分析方法抽取各实体间关系,对涉水对象及其属性进行补充,基于风险最小化的最小风险映射模型(Risk Minimization based Ontology Mapping,RiMOM)进行了多源异构水利实体的融合,实现了涉水对象与水利学科知识的融合与关联,形成水利综合知识的建模和表达。在图谱构建过程中,累计抽取水利实体136万个,构建实体关系300余万条,抽取的水利实体对象的标注准确率在80%以上。基于该图谱可实现水利知识的跨域查询与检索,学科图谱与水网图谱间关系查询,挖掘不同水利实体间的隐含关系,提高水利知识检索的效率和知识挖掘发现的能力。