-
题名基于批数据过采样的中医临床记录四诊描述抽取方法
- 1
-
-
作者
王亚强
李凯伦
舒红平
蒋永光
-
机构
成都信息工程大学软件工程学院
成都信息工程大学数据科学与工程研究所
成都信息工程大学软件自动生成与智能服务四川省重点实验室
成都中医药大学基础医学院
-
出处
《中文信息学报》
CSCD
北大核心
2024年第2期121-131,共11页
-
基金
成都信息工程大学科技创新能力提升计划青年创新(领军)项目(KYQN202209)。
-
文摘
中医临床记录四诊描述抽取对中医临床辨证论治的提质增效具有重要的应用价值,然而该任务尚有待探索,类别分布不均衡是该任务面临的关键挑战之一。该文围绕中医临床记录四诊描述抽取任务展开研究,首先构建了中医临床四诊描述抽取语料库;然后基于无标注的中医临床记录微调通用预训练语言模型实现该模型的领域适应;最后利用小规模标注数据,采用批数据过采样算法,完成中医临床记录四诊描述抽取模型的训练。实验结果表明,该文提出的抽取方法的总体性能均优于对比方法,并且与对比方法的最优结果相比,该文方法将少见类别的抽取性能F1值平均提升了2.13%。
-
关键词
中医临床记录
四诊描述抽取
类别分布不均衡
批数据过采样
-
Keywords
clinical records of traditional Chinese medicine
four diagnostic description extraction
imbalanced class distribution
batch data oversampling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名最大熵在中医智能辨证的研究及其应用
被引量:6
- 2
-
-
作者
叶培
-
机构
成都信息工程学院软件工程系
-
出处
《计算机时代》
2015年第3期50-52,55,共4页
-
基金
国家自然科学基金青年基金(61202250)
-
文摘
分析了中医临床记录中症状与症候类别之间的关系,将机器学习中的最大熵原理应用于中医辨症中,建立相应的分类模型,从而观察类别预测的正确性,为中医智能诊断提供初筛和决策支持。同时,将基于最大熵的分类器和基于朴素贝叶斯的分类器进行比较,结果显示,基于最大熵的分类效果胜过朴素贝叶斯分类。这表明将最大熵原理以及算法应用在中医诊断是可行的。
-
关键词
中医临床记录
最大熵
TCM
中医辨证
-
Keywords
the doctor of traditional Chinese medicine clinical record
maximum entropy
TCM
syndrome differentiation
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-