期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于字词联合训练的Bi-LSTM中文电子病历命名实体识别
被引量:
6
1
作者
万里
罗曜儒
+1 位作者
李智
綦小蓉
《中国数字医学》
2019年第2期54-56,共3页
为了实现对中文电子病历中实体的自动化识别与信息抽取,提出了一种基于字词联合训练的双向长短时记忆网络(Bi-LSTM)命名实体识别新算法。根据中文语言特性,在传统词向量中融入字向量的语义信息并将其作为神经网络的输入。实验过程中训...
为了实现对中文电子病历中实体的自动化识别与信息抽取,提出了一种基于字词联合训练的双向长短时记忆网络(Bi-LSTM)命名实体识别新算法。根据中文语言特性,在传统词向量中融入字向量的语义信息并将其作为神经网络的输入。实验过程中训练集、验证集与测试集随机按电子病历数量的3:1:2的概率生成。通过对比论文提出的语言模型与其他模型,实验结果显示基于字词联合训练的Bi-LSTM能达到最高准确率98.28%与最低复杂度1.169。该结果证明提出的模型能有效识别中文电子病历中如疾病、症状等相关实体,为自动化处理医学文本数据提供现实基础。
展开更多
关键词
命名实体识别
字词联合训练
Bi-LSTM
下载PDF
职称材料
基于字词联合的变体词规范化研究
被引量:
1
2
作者
施振辉
沙灜
+3 位作者
梁棋
李锐
邱泳钦
王斌
《计算机系统应用》
2017年第10期29-35,共7页
社交网络中的文本具有随意性和非正规性等特点,一种常见现象是社交网络文本中存在大量变体词.人们往往为了避免审查、表达情感等将原来的词用变体词替代,原来的词成为目标词.本文研究变体词的规范化任务,即找到变体词所对应的初始目标词...
社交网络中的文本具有随意性和非正规性等特点,一种常见现象是社交网络文本中存在大量变体词.人们往往为了避免审查、表达情感等将原来的词用变体词替代,原来的词成为目标词.本文研究变体词的规范化任务,即找到变体词所对应的初始目标词.本文利用变体词所在文本的时间和语义,结合变体词词性,提出了一种时间和语义结合的方法获取候选目标词,然后提出基于字词联合的词向量方法对候选目标词排序.我们的方法不需要额外的标注数据,实验结果表明,相比于当前最好的方法在准确性上具有一定的提升,针对与目标词存在相同的字的变体词其性能更好.
展开更多
关键词
变体词
变体词规范化
社交网络
词向量
字词联合训练
下载PDF
职称材料
题名
基于字词联合训练的Bi-LSTM中文电子病历命名实体识别
被引量:
6
1
作者
万里
罗曜儒
李智
綦小蓉
机构
四川大学华西第二医院出身缺陷与相关妇儿疾病教育部重点实验室
四川大学电子信息学院
出处
《中国数字医学》
2019年第2期54-56,共3页
基金
四川省卫生厅基金(编号:2016HH0070)~~
文摘
为了实现对中文电子病历中实体的自动化识别与信息抽取,提出了一种基于字词联合训练的双向长短时记忆网络(Bi-LSTM)命名实体识别新算法。根据中文语言特性,在传统词向量中融入字向量的语义信息并将其作为神经网络的输入。实验过程中训练集、验证集与测试集随机按电子病历数量的3:1:2的概率生成。通过对比论文提出的语言模型与其他模型,实验结果显示基于字词联合训练的Bi-LSTM能达到最高准确率98.28%与最低复杂度1.169。该结果证明提出的模型能有效识别中文电子病历中如疾病、症状等相关实体,为自动化处理医学文本数据提供现实基础。
关键词
命名实体识别
字词联合训练
Bi-LSTM
Keywords
naming entity recognition
joint training of Chinese characters and words
Bi-LSTM
分类号
R197.32 [医药卫生—卫生事业管理]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于字词联合的变体词规范化研究
被引量:
1
2
作者
施振辉
沙灜
梁棋
李锐
邱泳钦
王斌
机构
中国科学院信息工程研究所
中国科学院大学
出处
《计算机系统应用》
2017年第10期29-35,共7页
基金
国家重点研发计划(2016YFB0801003)
青年科学基金项目(61402466)
文摘
社交网络中的文本具有随意性和非正规性等特点,一种常见现象是社交网络文本中存在大量变体词.人们往往为了避免审查、表达情感等将原来的词用变体词替代,原来的词成为目标词.本文研究变体词的规范化任务,即找到变体词所对应的初始目标词.本文利用变体词所在文本的时间和语义,结合变体词词性,提出了一种时间和语义结合的方法获取候选目标词,然后提出基于字词联合的词向量方法对候选目标词排序.我们的方法不需要额外的标注数据,实验结果表明,相比于当前最好的方法在准确性上具有一定的提升,针对与目标词存在相同的字的变体词其性能更好.
关键词
变体词
变体词规范化
社交网络
词向量
字词联合训练
Keywords
morph
morph normalization
social network
word embedding
joint character-word training
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于字词联合训练的Bi-LSTM中文电子病历命名实体识别
万里
罗曜儒
李智
綦小蓉
《中国数字医学》
2019
6
下载PDF
职称材料
2
基于字词联合的变体词规范化研究
施振辉
沙灜
梁棋
李锐
邱泳钦
王斌
《计算机系统应用》
2017
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部