-
题名基于LDA模型和语义网络的线上文本挖掘方法
被引量:2
- 1
-
-
作者
张思松
陈文
-
机构
铜陵学院数学与计算机学院
-
出处
《安庆师范大学学报(自然科学版)》
2022年第2期41-45,共5页
-
基金
安徽省高校自然科学研究重点项目(KJ2020A0698)
安徽省高等学校省级质量工程项目(2020szsfkc0895)
铜陵学院校级科研项目(2020tlxyZD01)。
-
文摘
传统线上文本挖掘方法在克服相似性干扰时,需要加入大量约束条件,降低了挖掘准确率。为此,本文提出基于LDA模型和语义网络的线上文本挖掘方法。采用滤波处理法对线上文本信息进行滤波处理,获得线上文本的抗干扰向量,提取线上文本信息的频谱特征。利用语义网络构建线上文本的语义网络挖掘模型,计算线上文本挖掘信息的相似度。基于LDA模型对获取的线上文本阈值进行分类,得到线上文本挖掘权值,将挖掘到的关系词带入到概念属性内,实现线上文本的挖掘。实验结果表明,基于LDA模型和语义网络的线上文本挖掘方法不仅可以提高挖掘精度,还具有更强的收敛性。
-
关键词
LDA模型
语义网络
线上文本
挖掘方法
频率特征
挖掘模型
-
Keywords
LDA model
semantic network
online text
mining method
frequency characteristics
mining model
-
分类号
TP145
[自动化与计算机技术—控制理论与控制工程]
-
-
题名共词分析及网络分析法探测乳腺癌转移相关基因
被引量:2
- 2
-
-
作者
程晶晶
侯跃芳
-
机构
浙江大学医学院附属妇产科医院图书馆
中国医科大学医学信息学院
-
出处
《中华医学图书情报杂志》
CAS
2016年第3期35-39,共5页
-
文摘
目的:探测乳腺癌转移相关的基因,为乳腺癌转移的早期诊断和个性治疗提供参考。方法:检索Pub Med数据库获取文献,利用Meta Map进行概念匹配,下载匹配结果,并导入到数据分析软件,得到乳腺癌转移相关基因和基因-基因矩阵;使用Ucinet6建立乳腺癌转移相关基因的相互作用网络,分析网络的相关指标。结果:tp53、thra、erbb2、esr1、cdh1、egfr、nr4a1、cd69等是乳腺癌转移核心基因。结论:基于共词分析法能获得乳腺癌转移相关基因,但cd69对于乳腺癌转移的具体过程尚不明确,需要进一步验证。
-
关键词
共词分析
网络分析
乳腺癌转移
基因
UCINET
可视化
-
Keywords
Co-word analysis
Network analysis
Breast cancer metastasis
Gene
Ucinet
Visualization
AND Neoplasm Metastasis [Mesh ] AND humans [mesh]"为检索策略( 1966 年 1 月 1 日-2015 年 7 月 31 日)
在 Pub Med 共检索到 375 篇乳腺癌转移相关基因文献
以 MEDLINE 格式进行保存
作为挖掘样 本。 将 MEDLINE 格 式 文 本 上 传 到 在 线 Meta Map
选择 UMLS 涵盖的所有词表及所有语义类型
进行概念匹配
得到所保存文献题名和摘要的 UMLS 概念匹配结果。
-
分类号
R737.9
[医药卫生—肿瘤]
G252.8
[文化科学—图书馆学]
-