期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于SentencePiece的中医学分词模型建模研究
被引量:
1
1
作者
刘双巧
周璐
+7 位作者
李彩艳
袁慧敏
张异卓
李昱达
刘锦钢
郑丰杰
孙燕
李宇航
《世界中医药》
CAS
2021年第6期981-985,990,共6页
目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。...
目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。结果:中医学分词模型在测试集中的Kappa系数为0.79(一致性程度很高),准确率为0.84,宏观精确率为0.84,宏观召回率为0.83,宏观f1得分为0.83。结论:所构建的分词模型对于中医学专业术语有着较好的切分效果,表明该方法可运用于中医学领域的分词模型的构建,可为进一步地研究中医学分词提供方法学参考。
展开更多
关键词
分词
中文分词
分词模型
无监督学习
无监督分词
sentencepiece
下载PDF
职称材料
题名
基于SentencePiece的中医学分词模型建模研究
被引量:
1
1
作者
刘双巧
周璐
李彩艳
袁慧敏
张异卓
李昱达
刘锦钢
郑丰杰
孙燕
李宇航
机构
北京中医药大学中医学院
出处
《世界中医药》
CAS
2021年第6期981-985,990,共6页
基金
国家重点研发计划项目(2017YFC1700303,2017YFC1700300)。
文摘
目的:探索构建适用于中医学领域的分词模型。方法:采用基于SentencePiece的无监督学习分词方法,提出利用出版教材、名家著作及中医临床病历这3种不同类型的文献构建中医学分词模型;选择中医临床病历、名医医案作为测试集进行模型测试。结果:中医学分词模型在测试集中的Kappa系数为0.79(一致性程度很高),准确率为0.84,宏观精确率为0.84,宏观召回率为0.83,宏观f1得分为0.83。结论:所构建的分词模型对于中医学专业术语有着较好的切分效果,表明该方法可运用于中医学领域的分词模型的构建,可为进一步地研究中医学分词提供方法学参考。
关键词
分词
中文分词
分词模型
无监督学习
无监督分词
sentencepiece
Keywords
Word segmentation
Chinese word segmentation
Word segmentation model
Unsupervised learning
Unsupervised word segmentation
Sentence piece
分类号
R2-03 [医药卫生—中医学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于SentencePiece的中医学分词模型建模研究
刘双巧
周璐
李彩艳
袁慧敏
张异卓
李昱达
刘锦钢
郑丰杰
孙燕
李宇航
《世界中医药》
CAS
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部