-
题名大数据环境下的矿产知识库构建:以钨矿为例
被引量:7
- 1
-
-
作者
常力恒
朱月琴
汪新庆
张旋
刘雨江
吴硕
-
机构
中国地质大学(武汉)资源学院
自然资源部地质信息技术重点实验室
中国地质调查局发展研究中心
中国科学院大学
北京语言大学出版社
-
出处
《中国矿业》
北大核心
2018年第9期93-96,108,共5页
-
基金
国土资源部公益性行业科研专项项目资助(编号:201511079)
自然资源部地质信息技术重点实验室开放课题资助(编号:2017020058)
-
文摘
地质文献资料包含了矿床成因、地质过程、矿产预测等多方面信息,从结构化和非结构化数据中抽取总结矿床特征,构建知识库对于研究和分析成矿规律,进行知识计算具有重要意义。因此,本文总结了钨矿知识库的要素模型,基于潜力评价数据和文献资料构建了钨矿知识库。以钨矿知识库为数据源,基于python的字符串模糊匹配算法实现了数据分类和相似度计算。结果表明该算法可以很好的识别和区分不同预测类型。
-
关键词
大数据
知识库
数据分类
字符串模糊匹配
-
Keywords
big data
knowledge base
data classification
string fuzzy matching
-
分类号
P628
[天文地球—地质矿产勘探]
-
-
题名基于R软件和数据库的生物信息学分析设计
被引量:6
- 2
-
-
作者
张婕
李梦婷
-
机构
徐州医科大学生命科学学院
-
出处
《现代信息科技》
2020年第4期76-79,共4页
-
基金
江苏省大学生创新创业训练计划一般项目(201910313070Y)
基础医学国家级实验教学示范中心(徐州医科大学)资助项目。
-
文摘
选取NCBI基因表达谱数据库中访问号为GSE41439的基因芯片数据集为分析对象,首先利用R软件筛选差异表达基因并绘制成聚类热图,然后将差异基因上传至DAVID数据库进行GO功能与KEGG通路富集分析,接着利用STRING数据库构建蛋白质互作网络,并利用Cytoscape软件进行可视化,以直观地观察蛋白与蛋白之间的相互关系。由蛋白互作网络筛选出4个关键基因:PIK3R1、GNAS、GNAL、GNG4,可对其进行更深入的讨论。此方法适用于多种基因芯片的研究,具有很好的可推广性,将其运用于疾病相关的基因芯片,可为医学诊断与精准治疗提供一定的帮助。
-
关键词
生物信息学
R软件
DAVID数据库
string数据库
Cytoscape
-
Keywords
bioinformatics
R-studio
DAVID data base
string data base
Cytoscape
-
分类号
R319
[医药卫生—基础医学]
-