-
题名中医诊断古文的词性标注与特征重组
被引量:11
- 1
-
-
作者
王国龙
杜建强
郝竹林
程春雷
蔡良俊
张鑫
-
机构
江西中医药大学计算机学院
江西中医药大学临床医学院
-
出处
《计算机工程与设计》
北大核心
2015年第3期835-840,F0003,共7页
-
基金
国家973重点基础研究发展计划基金项目(2010CB530602)
国家自然科学基金项目(61363042)
+1 种基金
江西中医药大学校级研究生创新专项基金项目(JZYC12C04)
江西省研究生创新基金项目(YC2013-S226)
-
文摘
中医诊断古文存在大量单音词,使用通用切词技术处理,结果是单个的分词结果,不能构成一个完整的诊断词汇。对此,设计一个基于键值对模型的中医诊断词性标记集,提出基于词汇联系的隐马尔可夫模型(HMM),进行词性标注,结合词法分析,采用移进归约算法进行特征重组,生成中医诊断词汇。实验结果表明,改进的HMM的词性标注准确率在训练集和测试集中分别提高了2.58%和1.02%,特征重组结果是完整独立的诊断词汇,方便中医人员进行诊断分析,适合构成向量空间模型的特征。
-
关键词
中医诊断古文
键值对模型
隐马尔可夫模型
词性标注
特征重组
-
Keywords
ancient prose of TCM diagnosis
key-value pairs model
hidden Markov model
part-of-speech tagging
feature recombination
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-