期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
基于多头注意力机制字词联合的中文命名实体识别
1
作者 王进 王猛旗 +2 位作者 张昕跃 孙开伟 朴昌浩 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第1期77-84,共8页
针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低... 针对现有基于字词联合的中文命名实体识别方法会引入冗余词汇干扰、模型网络结构复杂、难以迁移的问题,提出一种基于多头注意力机制字词联合的中文命名实体识别算法.算法采用多头注意力机制融合词汇边界信息,并通过分类融合BIE词集降低冗余词汇干扰.建立了多头注意力字词联合模型,包含字词匹配、多头注意力、融合等模块.与现有中文命名实体识别方法相比,本算法避免了设计复杂的序列模型,方便与现有基于字的中文命名实体识别模型结合.采用召回率、精确率以及F 1值作为评价指标,通过消融试验验证模型各个部分的效果.结果表明,本算法在MSRA和Weibo数据集上F 1值分别提升0.28、0.69,在Resume数据集上精确率提升0.07. 展开更多
关键词 中文命名实体识别 词汇冗余 词汇边界信息 字词联合 多头注意力机制 BIE词集
下载PDF
听到“牛黄”能想到“黄牛”吗?——口语识别中的语音位置编码机制
2
作者 韩海宾 李兴珊 《心理科学进展》 CSCD 北大核心 2024年第9期1488-1501,共14页
在众多语言中,都存在一系列词汇,经过语音位置转置后仍能有效成词,典型如中文中的“牛黄”与“黄牛”。阐明这类可转置词汇在语言理解过程中的编码方式,是一项至关重要的研究课题。在阅读领域,学者们已就词汇的位置编码机制展开了讨论,... 在众多语言中,都存在一系列词汇,经过语音位置转置后仍能有效成词,典型如中文中的“牛黄”与“黄牛”。阐明这类可转置词汇在语言理解过程中的编码方式,是一项至关重要的研究课题。在阅读领域,学者们已就词汇的位置编码机制展开了讨论,然而针对口语加工中语音位置编码的认知机制,至今仍存在序列−灵活编码之争:早期口语识别理论认为语音位置编码主要以序列编码方式为主,而近年来的研究则发现,音位、音节和句子等层面上存在以灵活编码为主的语音位置编码方式。未来研究应深入探索与口语识别中语音编码相关的认知机理、神经机制、语言获得以及人工智能等重要问题,由于汉字词在形音对应关系和语音加工单元等方面独具特殊性,后续研究应对汉字词的语音位置编码予以特别关注。 展开更多
关键词 口语识别 语音位置编码 汉字词
下载PDF
利用双向SOFM网络模拟汉字认知过程的研究
3
作者 艾轶博 穆志纯 陈静 《计算机应用》 CSCD 北大核心 2006年第12期2971-2973,2976,共4页
在汉字的认知过程中有“字优效应”和“字劣效应”,前者认为在汉字认知过程中整字信息优于部件或笔画信息,后者反之。以自组织特征映射算法为理论基础,提出了一种双向自组织特征映射(SOFM)网络,利用自组织网络实现根据汉字和部件多维表... 在汉字的认知过程中有“字优效应”和“字劣效应”,前者认为在汉字认知过程中整字信息优于部件或笔画信息,后者反之。以自组织特征映射算法为理论基础,提出了一种双向自组织特征映射(SOFM)网络,利用自组织网络实现根据汉字和部件多维表征的聚类,并建立两层网络之间的连接关系,通过双向测试,得到不同构型汉字所具有的字优效应和字劣效应,从新的角度实现了SOFM的应用。研究结果对于汉字教学方法有一定的参考价值。 展开更多
关键词 自组织特征映射 汉字认知 聚类 字优效应 字劣效应
下载PDF
小学低年级儿童元语言意识与阅读流畅性的关系:汉字识别和词汇知识的中介效应 被引量:2
4
作者 喻艳玲 谢瑞波 +3 位作者 伍新春 夏月 王振梁 阮世芳 《心理学报》 CSCD 北大核心 2023年第6期941-953,共13页
对149名小学一年级汉语儿童进行一年三次追踪,探讨其一年级的元语言意识对二年级阅读流畅性的预测作用,并考察汉字识别、词汇知识在其中的中介效应。在控制快速命名和一般认知能力后,研究发现:(1)一年级儿童的语音意识会直接预测二年级... 对149名小学一年级汉语儿童进行一年三次追踪,探讨其一年级的元语言意识对二年级阅读流畅性的预测作用,并考察汉字识别、词汇知识在其中的中介效应。在控制快速命名和一般认知能力后,研究发现:(1)一年级儿童的语音意识会直接预测二年级时的字词阅读流畅性。(2)一年级儿童的正字法意识不仅对后期的字词阅读流畅性及句子默读流畅性有直接促进作用,而且会通过汉字识别预测字词阅读流畅性及句子默读流畅性。(3)一年级儿童的语素意识不仅会直接预测二年级时的句子默读流畅性,还会通过汉字识别促进字词阅读流畅性,也会通过汉字识别、词汇知识的中介作用间接预测句子默读流畅性。研究表明,元语言意识不仅对阅读流畅性有直接预测作用,而且会通过汉字识别和词汇知识间接预测阅读流畅性。该研究结果为系统考察小学低年级汉语儿童元语言意识与阅读流畅性的关系提供了参考依据,为提升儿童阅读流畅性技能提供了理论指导。 展开更多
关键词 元语言意识 汉字识别 词汇知识 字词阅读流畅性 句子默读流畅性
下载PDF
词典信息分层调整的中文命名实体识别方法 被引量:2
5
作者 李宝昌 郭卫斌 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第2期276-283,共8页
在中文命名实体识别任务中,字信息融合词汇信息能丰富文本特征,但一个字可能对应多个候选词汇,容易产生词汇冲突,融合无关词汇信息会影响模型的识别效果,对此提出了词典信息分层调整的中文命名实体识别方法。首先将所有潜在词语按照词... 在中文命名实体识别任务中,字信息融合词汇信息能丰富文本特征,但一个字可能对应多个候选词汇,容易产生词汇冲突,融合无关词汇信息会影响模型的识别效果,对此提出了词典信息分层调整的中文命名实体识别方法。首先将所有潜在词语按照词语长度进行分层,通过高层词语反馈调整低层词语的权重来保留更有用的信息,以此缓解语义偏差问题和降低词汇冲突影响;然后将词汇信息拼接到字信息来增强文本特征表示。在Resume和Weibo数据集上的实验结果表明,本文方法与传统方法相比具有更优的效果。 展开更多
关键词 词典信息 分层调整 字词融合 特征增强 中文命名实体识别
下载PDF
Centro-parietal N200: An event-related potential component specific to Chinese visual word recognition 被引量:6
6
作者 ZHANG John X FANG Zhuo +3 位作者 DU YingChun KONG LingYue ZHANG Qin XING Qiang 《Chinese Science Bulletin》 SCIE EI CAS 2012年第13期1516-1532,共17页
Almost all written languages currently used in the world are alphabetic or phonologically-based scripts (e.g., English) whose word recognition involves discrimination of one-dimensional linear combinations of several ... Almost all written languages currently used in the world are alphabetic or phonologically-based scripts (e.g., English) whose word recognition involves discrimination of one-dimensional linear combinations of several dozens of letters or phonological units, except written Chinese whose vocabulary consists of a large number of block characters, the analysis of which relies on the extraction of 2-dimensional form information at multiple levels including radical, character, and multiple-character word. Whether the dramatic contrast between the 2 types of orthography leads to distinctive mental processes is a fundamental question in psycholinguistic research unanswered in the past three decades. Using event-related potentials and visual lexical decision tasks, we asked native Chinese speakers to discriminate between real Chinese words and pseudoor non-words and observed a widespread negative deflection with centro-parietal focus elicited 200 ms post-stimulus onset. This N200 response showed a clear and large amplitude enhancement upon word repetition and seems to be specific to Chinese as no similar effects had been reported in word recognition studies involving alphabetic scripts under similar experimental conditions. Further evidence showed that this N200 could not be attributed to non-linguistic sensori-perceptual processes, nor phonological or semantic processes, but likely reflects very early identification of the orthography of individual words involving extensive and higher-level visual analysis. Recently the first author proposed a meaning-spelling theory of written Chinese vocabulary proposing that the Chinese and alphabetic scripts are the only 2 possible logical types of mature human writing systems, and that the former is more thoroughly a visual language compared with the latter and thus shall emphasize more of visual processing. Reinforcing each other, the meaning-spelling theory and the discovery of the centro-parietal N200 reveal the uniqueness of Chinese both theoretically and empirically, and provide strong arguments for the intrinsic distinction between written Chinese and alphabetic scripts. 展开更多
关键词 事件相关电位 N200 视觉分析 早期识别 中国 词汇 英文字母 成分
原文传递
基于语料库的中文姓名识别方法研究 被引量:43
7
作者 郑家恒 李鑫 谭红叶 《中文信息学报》 CSCD 北大核心 2000年第1期7-12,共6页
本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率,研究了中文姓名识别的评价函数,动态地建立了姓名识别统计数据表和姓名阈值。提出了在不作分词处理的原始文本中进行中文姓名识别的方法。经开放测试,召回率为95 .23 ... 本文在大规模语料基础上提取和分析了中文姓氏和名字用字的使用频率,研究了中文姓名识别的评价函数,动态地建立了姓名识别统计数据表和姓名阈值。提出了在不作分词处理的原始文本中进行中文姓名识别的方法。经开放测试,召回率为95 .23 % ;精确率为87 .31 % 。 展开更多
关键词 中文 姓名识别 姓氏使用频率 自动分词
下载PDF
中文分词十年回顾 被引量:249
8
作者 黄昌宁 赵海 《中文信息学报》 CSCD 北大核心 2007年第3期8-19,共12页
过去的十年间,尤其是2003年国际中文分词评测活动Bakeoff开展以来,中文自动分词技术有了可喜的进步。其主要表现为:(1)通过“分词规范+词表+分词语料库”的方法,使中文词语在真实文本中得到了可计算的定义,这是实现计算机自动分词和可... 过去的十年间,尤其是2003年国际中文分词评测活动Bakeoff开展以来,中文自动分词技术有了可喜的进步。其主要表现为:(1)通过“分词规范+词表+分词语料库”的方法,使中文词语在真实文本中得到了可计算的定义,这是实现计算机自动分词和可比评测的基础;(2)实践证明,基于手工规则的分词系统在评测中不敌基于统计学习的分词系统;(3)在Bakeoff数据上的评估结果表明,未登录词造成的分词精度失落至少比分词歧义大5倍以上;(4)实验证明,能够大幅度提高未登录词识别性能的字标注统计学习方法优于以往的基于词(或词典)的方法,并使自动分词系统的精度达到了新高。 展开更多
关键词 计算机应用 中文信息处理 中文分词 词语定义 未登录词识别 字标注分词方法
下载PDF
一种中文文档的非受限无词典抽词方法 被引量:28
9
作者 金翔宇 孙正兴 张福炎 《中文信息学报》 CSCD 北大核心 2001年第6期33-39,共7页
本文提出了一种非受限无词典抽词模型 ,该模型通过自增长算法获取中文文档中的汉字结合模式 ,并引入支持度、置信度等概念来筛选词条。实验表明 :在无需词典支持和利用语料库学习的前提下 ,该算法能够快速、准确地抽取中文文档中的中、... 本文提出了一种非受限无词典抽词模型 ,该模型通过自增长算法获取中文文档中的汉字结合模式 ,并引入支持度、置信度等概念来筛选词条。实验表明 :在无需词典支持和利用语料库学习的前提下 ,该算法能够快速、准确地抽取中文文档中的中、高频词条。适于对词条频度敏感 ,而又对计算速度要求很高的中文信息处理应用 。 展开更多
关键词 中文信息处理 自动分词 非受限无词典抽词 汉字结构模式 中文文档 抽词速度
下载PDF
联机手写体汉字识别后处理技术的研究 被引量:5
10
作者 徐志明 王晓龙 +1 位作者 张凯 关毅 《计算机研究与发展》 EI CSCD 北大核心 1999年第5期608-612,共5页
文中提出了一种规则和统计相结合的计算语言模型应用于联机手写体汉字识别后处理的技术,把基于统计的大词表Markov语言模型与语言规则量化模型,通过词网格技术集成在一个语言解码器.这种后处理方法由3个阶段组成:词网格生成... 文中提出了一种规则和统计相结合的计算语言模型应用于联机手写体汉字识别后处理的技术,把基于统计的大词表Markov语言模型与语言规则量化模型,通过词网格技术集成在一个语言解码器.这种后处理方法由3个阶段组成:词网格生成、语言解码、基于Cache的自学习机制.语言解码器采用Viterbi搜索算法求解最优语句候选.该项技术已应用于HPC(手持机)手写电脑的联机汉字手写体识别系统中,汉字识别率为91.3%. 展开更多
关键词 联机手写体汉字 汉字识别 后处理 计算机
下载PDF
多用途汉语方言语音数据库的设计 被引量:7
11
作者 高原 顾明亮 +2 位作者 孙平 王侠 张长水 《计算机工程与应用》 CSCD 2012年第5期118-120,共3页
建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计... 建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计标准以及实施方案,有助于推动汉语语音库特别是方言语音库的建立。 展开更多
关键词 汉语方言数据库 说话人信息处理 方言特征词识别
下载PDF
汉字早期字形加工阶段的习得年龄效应 被引量:2
12
作者 陈宝国 尤文平 +1 位作者 张亚峰 刘文焕 《心理科学》 CSSCI CSCD 北大核心 2010年第3期726-728,共3页
两个实验考察汉字早期字形加工阶段的词汇习得的年龄效应。实验1采用模糊字辨认的方法,实验2采用视觉持续时间阈限测定的方法。结果表明:汉字早期字形加工阶段存在词汇习得的年龄效应,即汉字习得的年龄越早,字形加工的速度越快。研究结... 两个实验考察汉字早期字形加工阶段的词汇习得的年龄效应。实验1采用模糊字辨认的方法,实验2采用视觉持续时间阈限测定的方法。结果表明:汉字早期字形加工阶段存在词汇习得的年龄效应,即汉字习得的年龄越早,字形加工的速度越快。研究结果支持了网络可塑性假设对词汇习得年龄效应的解释。 展开更多
关键词 汉字 习得年龄 汉字识别
下载PDF
消除手写汉字的毛刺及毛刺粘连 被引量:4
13
作者 薛炳如 杨静宇 +1 位作者 娄震 胡钟山 《南京理工大学学报》 EI CAS CSCD 1999年第2期141-144,共4页
在手写汉字中,毛刺是常见的噪声之一,笔划间的毛刺还经常出现粘连现象,这些粘连严重影响了基于轮廓和骨架的特征提取,从而影响手写汉字的识别率。该文通过定义边缘端点、边缘歧点和边缘直角点,提出了一种迭代算法消除毛刺以及毛刺... 在手写汉字中,毛刺是常见的噪声之一,笔划间的毛刺还经常出现粘连现象,这些粘连严重影响了基于轮廓和骨架的特征提取,从而影响手写汉字的识别率。该文通过定义边缘端点、边缘歧点和边缘直角点,提出了一种迭代算法消除毛刺以及毛刺粘连。实验表明,该算法是稳定的。 展开更多
关键词 毛刺噪声 手写体汉字识别 消除法 毛刺粘连
下载PDF
3~6岁儿童汉字字形认知的发展 被引量:12
14
作者 赵静 李甦 《心理科学》 CSSCI CSCD 北大核心 2014年第2期357-362,共6页
以汉字、一般线条图、似字线条图和笔画组合为材料,采用字典判断任务考察3-6岁儿童汉字字形认知的发展特点。结果发现儿童辨别汉字与似字符号的能力随年龄增长显著提高。3岁儿童较难区分汉字与各类似字符号。4-5岁儿童对汉字笔画特征... 以汉字、一般线条图、似字线条图和笔画组合为材料,采用字典判断任务考察3-6岁儿童汉字字形认知的发展特点。结果发现儿童辨别汉字与似字符号的能力随年龄增长显著提高。3岁儿童较难区分汉字与各类似字符号。4-5岁儿童对汉字笔画特征有了一定意识。6岁儿童对汉字组合模式的认识显著提高。笔画意识出现较早且发展速度较快,组合模式意识出现较晚且发展速度较慢。5岁和6岁是汉字字形认知发展的重要时期。 展开更多
关键词 汉字 字形认知 笔画意识 组合模式意识 发展
下载PDF
汉语词汇加工心理过程的研究进展 被引量:8
15
作者 隋雪 马英雪 +2 位作者 李莹 纪雅婷 梁小童 《辽宁师范大学学报(社会科学版)》 2014年第3期360-364,共5页
语言是人类特有的高级心理机能,其基本材料是词。词汇是目前语言学研究最活跃、最富有成果的领域之一,词汇识别也是现代认知心理学和心理语言学研究的重要问题。在目前的研究中,汉语词汇的几种表征与加工机制仍然存在争议,并且汉语词汇... 语言是人类特有的高级心理机能,其基本材料是词。词汇是目前语言学研究最活跃、最富有成果的领域之一,词汇识别也是现代认知心理学和心理语言学研究的重要问题。在目前的研究中,汉语词汇的几种表征与加工机制仍然存在争议,并且汉语词汇的横向、纵向研究发展迅速。回顾以往研究我们发现,汉语词汇的研究主要集中在:汉语双字词使用频率的研究、汉语双字词语义作用的研究、汉语合成双字词的研究,以及汉语成语加工的研究。今后汉语词汇加工研究的重点是:寻找出汉语词汇通达的规律以及通达过程中的眼动机制和脑机制,建立汉语词汇识别的认知加工模型。 展开更多
关键词 汉语词汇 双字词 词汇识别 认知加工
下载PDF
汉语二语学习者汉字识别中的整体/成分加工倾向研究 被引量:5
16
作者 徐彩华 刘婷 刘燕君 《语言文字应用》 CSSCI 北大核心 2022年第1期56-69,共14页
整体与部分的关系是汉字认知心理研究中的重要问题。本研究采用完全复合实验范式,以汉语母语者的行为反应为基线(n=41),考察不同汉语水平二语学习者(n=98)汉字识别中的整体/成分加工倾向。结果发现:母语者和二语学习者的汉字识别都有整... 整体与部分的关系是汉字认知心理研究中的重要问题。本研究采用完全复合实验范式,以汉语母语者的行为反应为基线(n=41),考察不同汉语水平二语学习者(n=98)汉字识别中的整体/成分加工倾向。结果发现:母语者和二语学习者的汉字识别都有整体加工倾向,但入门之初学习者的汉字结构和频率反应模式与母语者完全不同,从初级阶段开始向母语者模式靠拢,到高级阶段与母语者基本类似;随着汉语水平提高,二语学习者的汉字识别会先后出现成分增强和整体增强两种现象。研究表明,在作为二语的汉字表征发展过程中,成分增强与整体增强不是非此即彼,而是在不同层面共同发展的。最后讨论了上述结果在汉字教学中的应用。 展开更多
关键词 汉字识别 二语学习者 合体字 汉字教学
下载PDF
英文和汉字记忆及再认加工脑区的初步研究 被引量:3
17
作者 翟洪昌 邓波平 《心理科学》 CSSCI CSCD 北大核心 2009年第5期1195-1198,共4页
目的通过英文词和汉字在记忆和再认测验中诱发的脑激活,探讨文字的主效应脑区和作业的主效脑区。探讨文字的差异区,作业的差异区和总激活区。方法使用经典的"学习-再认"实验模式,对8名大学生进行英文与汉字再认测验,MRI采集数... 目的通过英文词和汉字在记忆和再认测验中诱发的脑激活,探讨文字的主效应脑区和作业的主效脑区。探讨文字的差异区,作业的差异区和总激活区。方法使用经典的"学习-再认"实验模式,对8名大学生进行英文与汉字再认测验,MRI采集数据,AFNI软件进行预处理、多元回归及组分析。结果记忆与再认的主效应脑区有右豆状核、右小脑、左额上回(BA6)、左小脑、右扣带回(BA32)、右海马。学习减再认差异区:右中央前回(BA4)、右额上回。记忆、再认、汉字和英文共同激活了左额上回、左顶上小叶,再认比记忆额外激活了左岛叶和左额下回。汉字不同于英文激活左顶上小叶,英文额外激活左额下回。结论英文与汉字工作记忆是额叶和左顶上小叶为主,配以其他脑皮质及皮下中枢的神经网络系统协调作业的结果,其他辅助脑区的选配取决于作业任务设计和作业对象的选择及因素控制。 展开更多
关键词 英文 汉字 记忆 再认 FMRI
下载PDF
字标注汉语词法分析中上文和下文孰重孰轻 被引量:3
18
作者 于江德 王希杰 樊孝忠 《计算机科学》 CSCD 北大核心 2012年第11期201-203,236,共4页
汉语词法分析是中文信息处理的基础,现阶段汉语词法分析的主流技术是基于统计的方法,这类方法的本质都是把词法分析过程看作序列数据标注问题。上下文是统计方法中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基... 汉语词法分析是中文信息处理的基础,现阶段汉语词法分析的主流技术是基于统计的方法,这类方法的本质都是把词法分析过程看作序列数据标注问题。上下文是统计方法中获取语言知识和解决自然语言处理中多种实际应用问题必须依靠的资源和基础。汉语词法分析时需要从上下文获取相关的语言知识,但上文和下文是否同样重要呢?为克服仅凭主观经验给出猜测结果的不足,对基于字标注汉语词法分析的分词、词性标注、命名实体识别这3项子任务进行了深入研究,对比了上文和下文对各个任务性能的影响;在国际汉语语言处理评测Bakeoff多种语料上进行了封闭测试,采用分别表征上文和下文的特征模板集进行了对比实验。结果表明,在字标注框架下,下文对汉语词法分析性能的贡献比上文的贡献高出6个百分点以上。 展开更多
关键词 汉语词法分析 字标注 上下文 分词 词性标注 命名实体识别
下载PDF
整体字形对部件识别的影响 被引量:6
19
作者 沈模卫 潘善会 李忠平 《应用心理学》 CSSCI 1997年第1期47-51,共5页
该研究借用 Estes的部件再认范式 ,以真字假字和部件字三种刺激材料探索了合体汉字 (或假字 )整体字形对部件的影响 ,结果发现 :(1 )对左右结构型和上下结构型汉字中的部件识别存在字优效应 ;而假字中 ,这二种结构方式的部件识别存在着... 该研究借用 Estes的部件再认范式 ,以真字假字和部件字三种刺激材料探索了合体汉字 (或假字 )整体字形对部件的影响 ,结果发现 :(1 )对左右结构型和上下结构型汉字中的部件识别存在字优效应 ;而假字中 ,这二种结构方式的部件识别存在着假字劣效应。(2 )对左右结构型和上下结构型字刺激中的部件识别存在着部位效应。字形整体对左部件或上部件的影响大于右部件或下部件。 展开更多
关键词 汉字识别 字优效应 部位效应
下载PDF
基于字词联合训练的Bi-LSTM中文电子病历命名实体识别 被引量:6
20
作者 万里 罗曜儒 +1 位作者 李智 綦小蓉 《中国数字医学》 2019年第2期54-56,共3页
为了实现对中文电子病历中实体的自动化识别与信息抽取,提出了一种基于字词联合训练的双向长短时记忆网络(Bi-LSTM)命名实体识别新算法。根据中文语言特性,在传统词向量中融入字向量的语义信息并将其作为神经网络的输入。实验过程中训... 为了实现对中文电子病历中实体的自动化识别与信息抽取,提出了一种基于字词联合训练的双向长短时记忆网络(Bi-LSTM)命名实体识别新算法。根据中文语言特性,在传统词向量中融入字向量的语义信息并将其作为神经网络的输入。实验过程中训练集、验证集与测试集随机按电子病历数量的3:1:2的概率生成。通过对比论文提出的语言模型与其他模型,实验结果显示基于字词联合训练的Bi-LSTM能达到最高准确率98.28%与最低复杂度1.169。该结果证明提出的模型能有效识别中文电子病历中如疾病、症状等相关实体,为自动化处理医学文本数据提供现实基础。 展开更多
关键词 命名实体识别 字词联合训练 Bi-LSTM
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部