期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于语义筛选的ALBERT-TextCNN中医文本多标签分类研究 被引量:2
1
作者 刘勇 杜建强 +3 位作者 罗计根 李清 于梦波 郑奇民 《现代信息科技》 2023年第19期123-128,共6页
针对中医领域中的大量未标注文本,以及传统多标签分类模型提取的文本语义信息不够完整等问题,提出一种用于中医文本的多标签分类模型语义筛选ALBERT-TextCNN。首先进行特定领域任务自训练,将哮喘领域内属于多标签分类任务但未标注文本输... 针对中医领域中的大量未标注文本,以及传统多标签分类模型提取的文本语义信息不够完整等问题,提出一种用于中医文本的多标签分类模型语义筛选ALBERT-TextCNN。首先进行特定领域任务自训练,将哮喘领域内属于多标签分类任务但未标注文本输入ALBERT进行预训练任务;其次ALBERT多层的Transform对已标注数据分别进行动态向量化表示,基于语义筛选选取最佳编码层生成的高效文本向量;最后引入TextCNN建立多标签分类器,提取文本向量不同层次的语义信息特征。在中医数据集上验证方法的有效性,实验结果表明,该模型的多标签分类精度有所提高,更适用于中医文本的分类预测。 展开更多
关键词 多标签分类 中医文本 语义筛选 ALBERT textCNN
下载PDF
基于大语言预训练模型的中医个性化处方推荐研究
2
作者 王欣宇 杨涛 胡孔法 《中华中医药学刊》 CAS 北大核心 2024年第4期15-18,I0006,共5页
目的针对中医个性化处方推荐问题,研究自动化处方推荐任务,为中医临床辅助决策提供参考。方法基于大语言预训练文本生成模型设计一种中医个性化处方推荐算法。将中医处方推荐任务转化为端到端(seq2seq)的文本生成任务,即将临床症状描述... 目的针对中医个性化处方推荐问题,研究自动化处方推荐任务,为中医临床辅助决策提供参考。方法基于大语言预训练文本生成模型设计一种中医个性化处方推荐算法。将中医处方推荐任务转化为端到端(seq2seq)的文本生成任务,即将临床症状描述文本通过模型转化为处方文本,以实现处方推荐任务的需求,并利用基于大语言预训练的BART(Bidirectional and Auto-Regressive Transformers)模型的预训练参数来提升模型对通用语义信息的理解,通过对训练集处方内中药排序提升模型的处方推荐性能。结果实验证明通过大语言预训练模型以及端到端的文本生成架构可有效提升模型的生成性能,同时对处方内中药依次排序可以获取更高准确率,并且通过中药的排列获取更多值得参考的有价值信息。中医个性化处方推荐模型在处方排序后分别在前5、10、15味生成的处方分别取得了58.60、53.79和49.67的准确率。结论中医个性化处方推荐模型取得了更优的处方推荐效果,表明其可为中医临床治疗疾病进行参考,达到辅助临床决策支持的效果。 展开更多
关键词 处方推荐 大语言模型 中医 文本生成
下载PDF
基于深度学习的《脉经》中医术语命名实体识别研究
3
作者 宋熹玥 冯鑫雅 +1 位作者 胡为 刘伟 《中医药信息》 2024年第7期1-6,共6页
目的:基于深度学习方法,对《脉经》中的术语命名实体识别进行研究。方法:针对中医典籍《脉经》涵盖了大量专业术语、知识体系复杂且分词困难等问题,采用迁移学习与BERT相结合的方法,对《脉经》数据集进行预处理,并与BERT-CRF、BiLSTM-CR... 目的:基于深度学习方法,对《脉经》中的术语命名实体识别进行研究。方法:针对中医典籍《脉经》涵盖了大量专业术语、知识体系复杂且分词困难等问题,采用迁移学习与BERT相结合的方法,对《脉经》数据集进行预处理,并与BERT-CRF、BiLSTM-CRF、BERT-BiLSTM-CRF模型进行对比。结果:本实验构建的BERT-BiLSTM-CRF-部首特征模型命名实体识别的F1值为84.77%,相较于BERT-CRF、BiLSTM-CRF、BERT-BiLSTM-CRF模型,该模型在词向量的构建过程中,充分考虑了中医领域的专业性和特殊性,不仅针对上下文语境进行了学习,还针对实体词的部首特征进行了学习,效果最优。结论:利用BERT-BiLSTM-CRF-部首特征模型能够有效实现中医古籍术语命名实体类别识别,有效提高了中医古籍的实体识别准确率,为后续知识图谱构建奠定技术基础,亦为临床诊断提供高质量数据支持。 展开更多
关键词 深度学习 迁移学习 命名实体识别 中医文本 BERT
下载PDF
基于异构图表示的中医电子病历分类方法
4
作者 王楷天 叶青 程春雷 《计算机应用》 CSCD 北大核心 2024年第2期411-417,共7页
中医(TCM)电子病历由于结构复杂多样与诊疗术语不规范的特点导致数据挖掘难度大、利用率低、难以抽取到有效信息。针对上述问题,提出基于LERT(Linguistically-motivated bidirectional Encoder Representation from Transformer)预训练... 中医(TCM)电子病历由于结构复杂多样与诊疗术语不规范的特点导致数据挖掘难度大、利用率低、难以抽取到有效信息。针对上述问题,提出基于LERT(Linguistically-motivated bidirectional Encoder Representation from Transformer)预训练模型与图卷积网络(GCN)并用异构图表示的中医电子病历分类模型TCM-GCN,用于改善中医电子病历特征有效表征的提取与分类。首先,利用LERT层词嵌入的方式将病历转换为句向量融入异构图中,以补全图结构缺失的病历整体语义特征;随后,为了缓解中医电子病历结构特点对特征提取产生的负面影响,异构图将关键词加入节点,使用BM25与点间互信息(PMI)算法构建图中“病历-关键词”“关键词-关键词”的边以表达病历的特征;最后,TCM-GCN依靠LERT-BM25-PMI构建的异构图对病历之间的特征关系进行聚合与抽取,完成病历分类的任务。在中医电子病历数据集上的实验结果表明,相较于次优的LERT,TCM-GCN加权平均后的准确率、召回率、F1值分别提升了2.24%、2.38%、2.32%,验证了算法在捕捉病历间隐含特征与中医电子病历分类工作上的有效性。 展开更多
关键词 异构图 图卷积网络 预训练模型 文本分类 自然语言处理 中医电子病历
下载PDF
基于TCM的KIII模型及其应用研究
5
作者 陈南国 张锦 《微计算机信息》 2012年第2期151-152,55,共3页
KⅢ模型在模式识别中表现出良好的性能,但它只能对样本给出与否的预测。TCM是基于算法随机性理论提出的一种分类算法,不仅可以判断出分类类别,同时还可以对每个预测结果给出可靠性的度量。本文把直推式信任机器(TransductiveConfidence ... KⅢ模型在模式识别中表现出良好的性能,但它只能对样本给出与否的预测。TCM是基于算法随机性理论提出的一种分类算法,不仅可以判断出分类类别,同时还可以对每个预测结果给出可靠性的度量。本文把直推式信任机器(TransductiveConfidence Machine,TCM)跟KⅢ模型结合,TCM-KⅢ可以有KⅢ模型的预测能力,还可以给出可靠性度量,丰富了输出信息。文本分类一直是一个活跃的课题,所以本文把TCM-KⅢ应用在分本分类中,实验表明TCM-KⅢ和单一的KⅢ模型预测的准确率相近,但给出了可靠性度量,可以进行有效的风险控制。 展开更多
关键词 信任机器 文本分类 可信度
下载PDF
政策工具视角下2001-2022年中医药国际化政策文本量化分析 被引量:3
6
作者 张天仪 李经博 +2 位作者 张昕玥 张惜音 宋欣阳 《中国中医药信息杂志》 CAS CSCD 2023年第11期38-45,共8页
目的归纳2001-2022年国家层面中医药国际化政策特点,为推动完善政策顶层设计提供建议。方法检索国家组织机构网站及北大法宝2001年1月1日-2022年6月30日发布的中医药国际化政策。采用罗斯韦尔政策工具理论进行政策分类,采用Likert 5级... 目的归纳2001-2022年国家层面中医药国际化政策特点,为推动完善政策顶层设计提供建议。方法检索国家组织机构网站及北大法宝2001年1月1日-2022年6月30日发布的中医药国际化政策。采用罗斯韦尔政策工具理论进行政策分类,采用Likert 5级计分法建立政策力度与政策详细程度指标,构建政策效力量化模型,提取相关政策数据录入Excel2019,采用SPSS27.0对纳入数据进行统计并绘制图表,归纳政策特点。结果纳入191份政策。政策发布时间有政策探索、政策鼓励、政策提速三阶段。政策范围中“通用型政策”占比最高(105份,54.97%),“专用型政策”占比最低(24份,12.57%)。政策发布数量最多的组织机构为国家中医药管理局(80份,42.11%),关注层级最高的组织机构为国务院及国务院办公厅(43份,22.51%)。三类政策工具中,供给型政策最多(45.48%),需求型(31.45%)和环境型(23.08%)政策较少。平均政策力度、政策详细程度得分分别为(1.51±0.70)分、(2.20±1.02)分,政策平均效力为3.28±1.95。结论中医药国际化政策逐步完善,但存在政策连贯性专指性不足、多元协同弱、政策效力不足、政策工具结构不均等问题,应重视中医药国际化政策引导的系统工程。 展开更多
关键词 中医药 国际化 政策工具 文本计量
下载PDF
基于局部注意力Seq2Seq的中医文本多标签分类研究
7
作者 刘勇 杜建强 +3 位作者 罗计根 李清 于梦波 郑奇民 《现代信息科技》 2023年第17期96-101,共6页
针对传统多标签分类模型未充分考虑文本中临近标签之间存在的复杂关联性问题,提出一种基于局部注意力Seq2Seq的中医文本多标签分类模型。首先利用ALBERT模型提取文本的动态语义向量;然后多层Bi-LSTM构成的编码层用于提取文本间的语义关... 针对传统多标签分类模型未充分考虑文本中临近标签之间存在的复杂关联性问题,提出一种基于局部注意力Seq2Seq的中医文本多标签分类模型。首先利用ALBERT模型提取文本的动态语义向量;然后多层Bi-LSTM构成的编码层用于提取文本间的语义关系;最后解码层中使用多层LSTM的局部注意力,突出文本序列中临近标签之间的相互影响力,以预测多标签序列。在中医数据集上验证方法的有效性,实验结果表明,所提出的算法能够有效捕获标签之间的相关性,适用于中医文本的分类预测。 展开更多
关键词 多标签分类 中医文本 局部注意力 ALBERT Bi-LSTM LSTM
下载PDF
基于文本和专家意见的系统综述方法在中医经验类证据整合评价中的应用 被引量:3
8
作者 张乐 吴雪 +2 位作者 景城阳 李苗苗 廖星 《北京中医药》 2023年第5期491-496,共6页
介绍并解读澳大利亚循证方法学组织(Joanna Briggs Institute,JBI)研发的基于文本和专家意见的系统综述(the systematic review of text and opinion,Sr TO)流程,分别对纳入标准、检索策略、真实性/严格性评价、文本信息提取、文本信息... 介绍并解读澳大利亚循证方法学组织(Joanna Briggs Institute,JBI)研发的基于文本和专家意见的系统综述(the systematic review of text and opinion,Sr TO)流程,分别对纳入标准、检索策略、真实性/严格性评价、文本信息提取、文本信息综合5项内容观点进行概括总结,并在其中适时融入中医经验类证据。形成围绕“PICO纳入标准”“检索策略”“资料提取表”“质量评估清单”“信息综合与评级”5项流程的Sr TO,并对中医学领域中医学经验类证据(古籍、医案医话、专家经验等)的系统综述提出了意见和建议。在中医药领域推广应用Sr TO方法,具有较好的方法学研究价值,为中医药领域医案医话相关研究的证据整合提供思路与方向。对中医经验类证据评价和分析路径的标准化和规范化处理,有利于提高此类证据利用度,进而用于解答特定情境下的临床问题。 展开更多
关键词 文本和专家意见 系统综述法 中医学 医案医话 专家经验
下载PDF
中医药教学名师特质研究:一项基于教学事迹的内容分析
9
作者 王红伟 杨静 《成都中医药大学学报(教育科学版)》 2023年第4期1-5,24,共6页
二十大报告提出“促进中医药传承创新发展”,中医药教学名师是促进教学学术传承的纽带桥梁。以全国首届60位中医药教学名师为研究对象,运用Nvivo12对其教学事迹文本进行分析后发现:六位一体融入教学是中医药教学名师的特质模型,其中品... 二十大报告提出“促进中医药传承创新发展”,中医药教学名师是促进教学学术传承的纽带桥梁。以全国首届60位中医药教学名师为研究对象,运用Nvivo12对其教学事迹文本进行分析后发现:六位一体融入教学是中医药教学名师的特质模型,其中品德高尚是先决特质,坚守教学一线是重心特质,坚持临床带教是关键特质,立德育人融入教学是根本特质,传承育人融入教学是传承特质,学术研究融入教学是求真特质。基于研究结果,提出中医药教学名师要多重角色排列组合与协同发展,增强以教为乐的内驱动力,锤炼独特的教学风格,构筑医教研循环创新体系,博采众长与甘为人梯等建议。 展开更多
关键词 中医药教学名师 教学事迹文本 特质
下载PDF
翻译伦理的本质探析———以澳门地区中医医疗机构的双语公示语为例
10
作者 吴伟华 《锦州医科大学学报(社会科学版)》 2023年第1期104-107,共4页
目前的翻译伦理理论以切斯特曼提出的五种模式最具代表性,但这些模式间既各自为政又交叉重叠甚至互相矛盾,其根源是各模式之间的关系没有以翻译伦理的本质为纲进行辨析。翻译伦理各模式之间的内在联系和本质共性是“忠”,翻译伦理的核... 目前的翻译伦理理论以切斯特曼提出的五种模式最具代表性,但这些模式间既各自为政又交叉重叠甚至互相矛盾,其根源是各模式之间的关系没有以翻译伦理的本质为纲进行辨析。翻译伦理各模式之间的内在联系和本质共性是“忠”,翻译伦理的核心要求就是选择要忠于的对象。以此为据分析澳门地区中医医疗机构的双语公示语,发现无论是保留还是转换文本类型,从翻译伦理的本质而言都是在选择译文要忠于的对象。 展开更多
关键词 翻译伦理 文本类型 公示语 澳门地区中医医疗机构
下载PDF
文本类型理论指导下的中医外宣资料英译 被引量:10
11
作者 罗海燕 邓海静 《中国中医基础医学杂志》 CSCD 北大核心 2017年第4期567-569,共3页
中医外宣资料的英译是中医文化对外传播的重要组成部分。中医作为自然科学和社会科学的融合体,其外宣资料以信息型文本为主体,兼顾表情型文本和感染型文本,不同的文本实现不同的功能。故基于赖斯的文本类型理论,探讨不同文本类型的中医... 中医外宣资料的英译是中医文化对外传播的重要组成部分。中医作为自然科学和社会科学的融合体,其外宣资料以信息型文本为主体,兼顾表情型文本和感染型文本,不同的文本实现不同的功能。故基于赖斯的文本类型理论,探讨不同文本类型的中医外宣资料在英译时应采用的翻译策略。信息功能文本的英译应注意内容的表达、言简意赅,同时保留信息的时代性和历史性,而对于感染功能文本则需采用编译等翻译手段以诱导所期望的反应。 展开更多
关键词 中医外宣 中医翻译 文本类型理论
下载PDF
关于中医经典等级考试的几点思考 被引量:8
12
作者 曲道炜 郭晓东 张丽艳 《辽宁中医药大学学报》 CAS 2010年第4期262-263,共2页
以中医经典课程教学为基础,结合已经设立的伤寒论等级考试,提出开展中医经典等级考试的必要性和需要解决的几个问题。
关键词 中医经典 等级考试 原文记诵
下载PDF
文本挖掘在中医药文献分析中的应用 被引量:9
13
作者 杨进 罗漫 张启蕊 《广东药学院学报》 CAS 2010年第2期216-220,共5页
文本挖掘能从海量的中医药文献中发现知识以促进中医临床研究和中药研发。本文总结现有研究指出文本分类和信息抽取是中医药文献知识发现的关键技术,指出中医药文本分类、非关联知识发现和中医药文献信息抽取为三个主要研究方向,并论述... 文本挖掘能从海量的中医药文献中发现知识以促进中医临床研究和中药研发。本文总结现有研究指出文本分类和信息抽取是中医药文献知识发现的关键技术,指出中医药文本分类、非关联知识发现和中医药文献信息抽取为三个主要研究方向,并论述了三个研究领域中需解决的关键问题和研究方向,最后展望文本挖掘在中医药学科的应用前景,指出非关联文献知识将成为中西医结合研究的热点。 展开更多
关键词 文本挖掘 中医药文献 文本分类 信息抽取 非相关文献知识发现
下载PDF
湿疹证候分类及中药用药规律分析 被引量:31
14
作者 姜春燕 谭勇 +6 位作者 赵宁 蔡锋 杨静 张广中 李元文 姜淼 吕爱平 《中华中医药学刊》 CAS 2013年第11期2397-2399,共3页
目的:利用文本挖掘探索中医辨治湿疹的证候分类及中药用药规律。方法:采集中医辨治湿疹的相关文献,建立Access数据库,运用SQL对数据进行处理,挖掘中医辨治湿疹的证候分类及用药规律。结果:湿热证、风热证、血瘀证、湿毒证、脾虚湿蕴证... 目的:利用文本挖掘探索中医辨治湿疹的证候分类及中药用药规律。方法:采集中医辨治湿疹的相关文献,建立Access数据库,运用SQL对数据进行处理,挖掘中医辨治湿疹的证候分类及用药规律。结果:湿热证、风热证、血瘀证、湿毒证、脾虚湿蕴证是依次排在前5的湿疹证型;湿热证是最常与其他证型相兼的证型;苦参、黄芩、茯苓、土茯苓、白鲜皮、大青叶、龙胆草、连翘、牡丹皮、金银花是依次排在前10治疗湿疹的中草药;苦参、茯苓、土茯苓是最常与其他中草药配伍使用的中草药。结论:文本挖掘获得的中医辨治湿疹的证候分类及用药规律符合临床实际,为湿疹中医辨治的规范标准化提供了客观依据。 展开更多
关键词 湿疹 证候分类 中医用药规律 文本挖掘
下载PDF
中医典籍译介与中医药文化国际传播模式新探 被引量:6
15
作者 王银泉 徐鹏浩 《外国语文研究》 2020年第3期86-94,共9页
中医典籍凝聚着中医药文化的精髓,对其进行译介有助于推动中医药文化国际传播。过往研究对中医典籍译介的分析大多是从译介的主体、内容、途径、受众、效果5个方面展开。本研究一方面对中医典籍译介要素进行了补充,并尝试构建新的译介模... 中医典籍凝聚着中医药文化的精髓,对其进行译介有助于推动中医药文化国际传播。过往研究对中医典籍译介的分析大多是从译介的主体、内容、途径、受众、效果5个方面展开。本研究一方面对中医典籍译介要素进行了补充,并尝试构建新的译介模式,另一方面对新时代中医药文化国际传播的本元与路径进行了探讨,旨在促进中医药文化助推构建人类健康命运共同体。 展开更多
关键词 中医典籍 译介模式 中医药文化 国际传播
下载PDF
基于诺德功能翻译理论的中医药“非遗”翻译研究 被引量:3
16
作者 于淼 《长春师范大学学报》 2016年第11期112-115,共4页
随着中国国际影响力的不断提升,越来越多的学者与国际友人开始关注中国的传统文化。非物质文化遗产是中国千年文化的沉淀,是民族智慧的结晶,是以非物质形式存在的传统文化的表现形式。中医药非物质文化遗产是我国传统文化的杰出代表,在... 随着中国国际影响力的不断提升,越来越多的学者与国际友人开始关注中国的传统文化。非物质文化遗产是中国千年文化的沉淀,是民族智慧的结晶,是以非物质形式存在的传统文化的表现形式。中医药非物质文化遗产是我国传统文化的杰出代表,在国际享有盛名,中医药非物质文化遗产翻译是传播祖国传统文化的重要途径。本文从诺德功能翻译理论角度,讨论如何应用以翻译为导向的语篇分析模型翻译中医药非物质文化遗产,以促进中外文化交流和中国文化推广。 展开更多
关键词 功能翻译理论 中医药 语篇分析模型
下载PDF
文本挖掘探讨青风藤用药规律研究 被引量:9
17
作者 李雨彦 郑光 刘良 《世界中医药》 CAS 2015年第6期823-827,共5页
目的:基于文本挖掘技术探讨青风藤用药规律。方法:在CBM数据库中检索、下载所有涉及青风藤的文献,通过清洗、降噪及关键词频统计的数据分层算法,挖掘青风藤治疗疾病的规律,症状、证型的分布规律,中药配伍、中成药、西药、汤剂、针灸联... 目的:基于文本挖掘技术探讨青风藤用药规律。方法:在CBM数据库中检索、下载所有涉及青风藤的文献,通过清洗、降噪及关键词频统计的数据分层算法,挖掘青风藤治疗疾病的规律,症状、证型的分布规律,中药配伍、中成药、西药、汤剂、针灸联用规律,并进行规律的可视化展示。结果:青风藤主要治疗以疼痛、肿胀、强直、畸形为主的病证,中医病证要素涉及风、寒、湿、热、痰、瘀、虚。疾病以现代医学的类风湿关节炎为主,涉及多种风湿类疾病以及慢性肾炎、肝炎、心律失常等。中药应用方面,青风藤多与祛风除湿类、养血活血类、通络类、温经类及补肾类中药合用。此外,青风藤多与雷公藤多苷、活络丸等调节免疫、通络药物联用。结论:数据挖掘技术可以系统、全面、准确总结青风藤的用药规律,为拓展该药的临床应用及深入研究提供文献学依据。 展开更多
关键词 文本挖掘 青风藤 中药 中成药 西药
下载PDF
基于文本挖掘技术探索中医治疗胆结石药证对应规律研究 被引量:16
18
作者 李立 蔡峰 +2 位作者 梁非 郑光 吕爱平 《辽宁中医杂志》 CAS 2013年第4期664-666,共3页
目的:采用文本挖掘方法,探索中医药治疗胆结石药证对应规律。方法:在CBM数据库中收集中医药治疗胆结石文献数据,采用基于敏感关键词频数统计的数据分层算法,挖掘胆结石的证候及治疗胆结石的中药。结合人工降噪及数据清洗后,通过一维频... 目的:采用文本挖掘方法,探索中医药治疗胆结石药证对应规律。方法:在CBM数据库中收集中医药治疗胆结石文献数据,采用基于敏感关键词频数统计的数据分层算法,挖掘胆结石的证候及治疗胆结石的中药。结合人工降噪及数据清洗后,通过一维频次表及二维的网络图分析中医药治疗胆结石药证规律。结果:胆结石肝胆湿热、肝郁气滞为最主要证候,肝郁脾虚及气滞血瘀为常见证型。柴胡、大黄、金钱草、茵陈、鸡内金为治疗胆结石的核心药物,且与其他药物联用的频数也最高。定向挖掘结果显示治疗胆结石肝胆湿热证的药物与胆结石常用药物基本一致。结论:利用文本挖掘技术,可以从海量的文献中发现治疗胆结石的中医证、药的规律,为中医药规范化及中药组方研究,提供有益的方法学探索和参考。 展开更多
关键词 文本挖掘 数据分层算法 胆结石 证候 中药
下载PDF
文本挖掘探索抑郁症“证-症-方-药”相应规律 被引量:7
19
作者 展俊平 张彤 +7 位作者 郑光 吕诚 蔡峰 杨静 何晓鹃 梁非 吕爱平 姜淼 《中国中医基础医学杂志》 CAS CSCD 北大核心 2012年第12期1331-1333,共3页
目的:探索抑郁症证药相应规律。方法:采用基于敏感关键词频数统计的数据分层算法,挖掘抑郁症的证候、症状、汤药及中药的规律。结果:抑郁症虚实夹杂,脏腑以肝为主,涉及心、脾、肾;证侯以肝气郁结和肝郁脾虚为主;核心症状为失眠、情绪低... 目的:探索抑郁症证药相应规律。方法:采用基于敏感关键词频数统计的数据分层算法,挖掘抑郁症的证候、症状、汤药及中药的规律。结果:抑郁症虚实夹杂,脏腑以肝为主,涉及心、脾、肾;证侯以肝气郁结和肝郁脾虚为主;核心症状为失眠、情绪低落等精神障碍;汤药和中药的使用均以疏肝解郁、健脾养心安神为主。结论:文本挖掘技术、结合文献回溯和人工阅读降噪,能够比较客观地总结中医"证-症-方-药"的规律。 展开更多
关键词 文本挖掘 数据分层算法 抑郁症 证候 汤药 中药
下载PDF
中医方剂数据库文本挖掘数据预处理的尝试 被引量:6
20
作者 吴磊 李舒 《中国中医药图书情报杂志》 2015年第3期8-11,共4页
目的针对中医方剂数据挖掘需要提出一套以数据清洗为主的数据预处理方法,使数据规范、准确和有序,利于后续处理。方法通过检索技术,在方剂数据库中获取文本数据源,将非规范化的数据通过辅助词群行处理、正则表达式替换、异名处理等步骤... 目的针对中医方剂数据挖掘需要提出一套以数据清洗为主的数据预处理方法,使数据规范、准确和有序,利于后续处理。方法通过检索技术,在方剂数据库中获取文本数据源,将非规范化的数据通过辅助词群行处理、正则表达式替换、异名处理等步骤进行清洗,改进数据质量。结果在中国方剂数据库共检索到1758条记录,在方剂现代应用数据库共检索到91条记录。源文本数据经预处理后共得到有效记录6913味药,可成功导入相关信息挖掘系统进行方剂名称和中药名词的信息抽取。结论本方法适用于基于中医方剂数据库的文本挖掘和知识发现,可成功对源文本数据实施清洗,得到标准统一、无噪声的数据,实现所需方药信息的有效抽取,可为中医方剂文本型数据信息分析与挖掘研究提供有益的借鉴。 展开更多
关键词 中医方剂 方剂数据库 文本挖掘 数据预处理 数据清洗
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部