故障运维是当前工业生产领域的一个重要研究主题。基于故障知识图谱的故障预测、故障诊断、智能问答等研究都已经得到了较大的发展和应用,然而,高质量的故障知识图谱是这些方法开展的基础。考虑到传统的知识图谱构建技术需要对原始数据...故障运维是当前工业生产领域的一个重要研究主题。基于故障知识图谱的故障预测、故障诊断、智能问答等研究都已经得到了较大的发展和应用,然而,高质量的故障知识图谱是这些方法开展的基础。考虑到传统的知识图谱构建技术需要对原始数据进行数据预处理、实体识别、关系抽取以及实体对齐,为了提高知识图谱构建效率,本文的工作聚焦于利用大语言模型(Large Language Model,LLM)对故障运维数据进行无监督知识抽取,设计并实现一种基于大模型的大型故障知识图谱的自动构建方法。该方法主要包含2个部分:1)2种面向故障知识图谱构建的zero-shot Prompt,这些Prompt能够引导大语言模型对故障知识图谱进行概念层的生成和元素层的知识抽取,以RDF语法进行表征和输出;2)一种基于大语言模型的知识图谱构建方法,该方法可以通过zero-shot Prompt引导大语言模型对故障运维数据进行知识抽取,并以迭代的形式完成大型故障知识图谱的构建。实验结果表明本文提出的方法具有一定的科学性和有效性。展开更多
中文医学知识图谱(Chinese medical knowledge graph,CMeKG)是对专业医学知识的结构化描述,构建中文医学知识图谱是各类智慧医疗应用的迫切需要。通过收集多来源医疗文本,详细分析语料的结构特征,结合医学知识的语义特点,制定了医学命...中文医学知识图谱(Chinese medical knowledge graph,CMeKG)是对专业医学知识的结构化描述,构建中文医学知识图谱是各类智慧医疗应用的迫切需要。通过收集多来源医疗文本,详细分析语料的结构特征,结合医学知识的语义特点,制定了医学命名实体和实体关系的标注体系和规范;并开发了标注工具,在医学专家的指导下,选取106种高发疾病进行人工标注,命名实体一致率达到了87.3%,实体关系一致率达到了82.9%。在人工标注的基础上,进行实体及关系自动抽取,构建出的中文医学知识图谱CMeKG1.0版共包括6310种疾病、19853种药物(西药、中成药、中草药)、1237种诊疗技术及设备,关联到的医学实体达20余万,概念关系实例及属性三元组达100余万。所构建的中文医学知识图谱为医疗问答系统和智能辅助诊疗等领域奠定了专业知识基础。展开更多
文摘故障运维是当前工业生产领域的一个重要研究主题。基于故障知识图谱的故障预测、故障诊断、智能问答等研究都已经得到了较大的发展和应用,然而,高质量的故障知识图谱是这些方法开展的基础。考虑到传统的知识图谱构建技术需要对原始数据进行数据预处理、实体识别、关系抽取以及实体对齐,为了提高知识图谱构建效率,本文的工作聚焦于利用大语言模型(Large Language Model,LLM)对故障运维数据进行无监督知识抽取,设计并实现一种基于大模型的大型故障知识图谱的自动构建方法。该方法主要包含2个部分:1)2种面向故障知识图谱构建的zero-shot Prompt,这些Prompt能够引导大语言模型对故障知识图谱进行概念层的生成和元素层的知识抽取,以RDF语法进行表征和输出;2)一种基于大语言模型的知识图谱构建方法,该方法可以通过zero-shot Prompt引导大语言模型对故障运维数据进行知识抽取,并以迭代的形式完成大型故障知识图谱的构建。实验结果表明本文提出的方法具有一定的科学性和有效性。
文摘中文医学知识图谱(Chinese medical knowledge graph,CMeKG)是对专业医学知识的结构化描述,构建中文医学知识图谱是各类智慧医疗应用的迫切需要。通过收集多来源医疗文本,详细分析语料的结构特征,结合医学知识的语义特点,制定了医学命名实体和实体关系的标注体系和规范;并开发了标注工具,在医学专家的指导下,选取106种高发疾病进行人工标注,命名实体一致率达到了87.3%,实体关系一致率达到了82.9%。在人工标注的基础上,进行实体及关系自动抽取,构建出的中文医学知识图谱CMeKG1.0版共包括6310种疾病、19853种药物(西药、中成药、中草药)、1237种诊疗技术及设备,关联到的医学实体达20余万,概念关系实例及属性三元组达100余万。所构建的中文医学知识图谱为医疗问答系统和智能辅助诊疗等领域奠定了专业知识基础。