-
题名基于多源数据的疾病知识图谱构建研究
- 1
-
-
作者
孙丝雨
侯跃芳
丁敬达
梅佳月
孙佳
-
机构
上海大学文化遗产与信息管理学院
中国医科大学健康管理学院
-
出处
《情报工程》
2024年第4期3-13,共11页
-
基金
辽宁省教育厅科学研究经费项目(人文社科类基础研究项目)“基于多源数据网络链接预测的知识发现模型构建”(JCRW2020005)。
-
文摘
[目的/意义]基于PubMed、OMIM等医学数据库中的多源数据设计疾病知识图谱构建方案,为疾病的生物学实验研究及诊断治疗提供参考和依据。[方法/过程]首先利用语义分析工具SemRep抽取SPO三元组,通过实体对齐、关系映射等数据处理方法进行知识融合,然后利用Neo4j图数据库实现知识存储及可视化展示,以多囊卵巢综合征为例进行实证检验和分析,最终获得61589个SPO三元组、34697个实体和27种语义关系并归纳总结7种语义模式。[局限]数据处理时,涉及人工审查,但由于数据量较大,审查过程中可能存在些许误差。[结果/结论]本研究改进现有的知识融合方法,验证了该疾病知识图谱构建方案的可行性。为后续基于疾病知识图谱进行医学领域知识发现探索奠定基础。
-
关键词
疾病知识图谱
SPO三元组
知识融合
语义分析
-
Keywords
Disease Knowledge Graph
Subject-Predication-Object
Knowledge Fusion
Semantic Analysis
-
分类号
G302
[文化科学]
G35
[文化科学—情报学]
-