期刊文献+
共找到96篇文章
< 1 2 5 >
每页显示 20 50 100
基于LSTM和CRF的加工过程运行状态识别
1
作者 吴家奎 周焮钊 +2 位作者 李浩亮 陈文平 李雄伟 《机床与液压》 北大核心 2024年第21期162-167,共6页
针对加工过程中时序信号截取成本高和运行状态自动识别困难的问题,提出一种结合双向循环神经网络BiLSTM和条件随机场(CRF)的加工过程信号状态识别模型,适用于变参数加工场景。采用LSTM来捕捉时间序列数据的前后依赖性关系,并利用该网络... 针对加工过程中时序信号截取成本高和运行状态自动识别困难的问题,提出一种结合双向循环神经网络BiLSTM和条件随机场(CRF)的加工过程信号状态识别模型,适用于变参数加工场景。采用LSTM来捕捉时间序列数据的前后依赖性关系,并利用该网络对振动信号进行深层特征提取。在此基础上,为了进一步捕捉状态数据,将LSTM的输出特征输入至条件随机场(CRF)模型和多层感知机(MLP)中进行边界帧分类,进行预测并输出结果标签序列。最后以变参数下的铣削实验为例,验证了基于BiLSTM-CRF的信号状态识别模型在复杂变参数场景下的有效性。 展开更多
关键词 加工过程运行状态识别 时序信号 序列识别 lstm-crf
下载PDF
Bi⁃LSTM和CRF结合的藏文分词方法研究
2
作者 格桑加措 阿卜杜热西提·热合曼 +3 位作者 尼玛扎西 面加 肖桐 朱靖波 《中央民族大学学报(自然科学版)》 2024年第3期40-46,共7页
本研究旨在探索基于双向长短时记忆网络(Bi⁃LSTM)和条件随机场(CRF)的藏语分词方法。研究评估了Bi⁃LSTM和Bi⁃LSTM结合CRF模型在藏文分词任务中的性能,针对未登录音节词进行了模型优化。研究还将分词系统应用到CCMT2023藏汉机器翻译任务... 本研究旨在探索基于双向长短时记忆网络(Bi⁃LSTM)和条件随机场(CRF)的藏语分词方法。研究评估了Bi⁃LSTM和Bi⁃LSTM结合CRF模型在藏文分词任务中的性能,针对未登录音节词进行了模型优化。研究还将分词系统应用到CCMT2023藏汉机器翻译任务中,并进行了评估。实验结果表明,本文提出的分词系统在藏语分词任务中具有良好的性能,并且在藏汉机器翻译任务上有效提升了性能。 展开更多
关键词 藏语分词 lstm crf 未登录音节字
下载PDF
融合全局语义信息的BIG-LSTM-CRF模型 被引量:1
3
作者 胡俊英 王煜华 +1 位作者 金书意 张博 《纯粹数学与应用数学》 2024年第1期106-116,共11页
命名实体识别任务是针对输入的文本句子做序列标注的一类自然语言处理任务,其目的是抽取出文本句子中的主语实体和宾语实体.基于深度神经网络的提取方法获得了优异的性能,其中BI-LSTM-CRF是效果显著且具有代表性的模型之一.但该模型在... 命名实体识别任务是针对输入的文本句子做序列标注的一类自然语言处理任务,其目的是抽取出文本句子中的主语实体和宾语实体.基于深度神经网络的提取方法获得了优异的性能,其中BI-LSTM-CRF是效果显著且具有代表性的模型之一.但该模型在训练过程中忽略了全局语义信息对实体识别准确度的影响.本文通过引入全局语义信息来改进BI-LSTM-CRF模型用于命名实体识别任务的性能:先通过添加一层带有激活操作的全连接层来提取输入文本句子的高维语义信息;再通过一个全连接层将高维语义信息与每个字符进行深度融合,得到该句子融合了全局语义信息的向量表示,并将其用于后续的命名实体识别任务.通过将改进后的模型用于CLUENER2020数据集上,验证了添加全局语义信息融合模块可以提升模型命名实体识别的准确度. 展开更多
关键词 BI-lstm-crf 自然语言处理 命名实体识别 神经网络
下载PDF
基于BI-LSTM-CRF模型的中文分词法 被引量:21
4
作者 张子睿 刘云清 《长春理工大学学报(自然科学版)》 2017年第4期87-92,共6页
递归神经网络能够很好地处理序列标记问题,已被广泛应用到自然语言处理(NLP)任务中。提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短期记忆条件随机场(BI-LSTM-CRF)模型,不仅保留了LSTM能够利用上下文信息的特性,同时能够通过CR... 递归神经网络能够很好地处理序列标记问题,已被广泛应用到自然语言处理(NLP)任务中。提出了一种基于长短期记忆(LSTM)神经网络改进的双向长短期记忆条件随机场(BI-LSTM-CRF)模型,不仅保留了LSTM能够利用上下文信息的特性,同时能够通过CRF层考虑输出标签之间前后的依赖关系。利用该分词模型,通过加入预训练的字嵌入向量,以及使用不同词位标注集在Bakeoff2005数据集上进行的分词实验,结果表明:BI-LSTM-CRF模型比LSTM和双向LSTM模型具有更好的分词性能,同时具有很好地泛化能力;相比四词位,采用六词位标注集的神经网络模型能够取得更好的分词性能。 展开更多
关键词 中文分词 BI-lstm-crf 词位标注
下载PDF
基于BiLSTM-CRF的中文生物医学开放式概念关系抽取 被引量:4
5
作者 王序文 李姣 +1 位作者 吴英杰 李军莲 《中华医学图书情报杂志》 CAS 2018年第11期33-39,共7页
目的:利用深度学习方法自动抽取中文生物医学文本中的开放式概念关系,以增强生物医学文本理解及医学知识网络构建。方法:使用BiLSTM-CRF模型从中文生物医学文献数据中抽取以句子上下文短语描述的开放式概念关系,并与基于条件随机场(Cond... 目的:利用深度学习方法自动抽取中文生物医学文本中的开放式概念关系,以增强生物医学文本理解及医学知识网络构建。方法:使用BiLSTM-CRF模型从中文生物医学文献数据中抽取以句子上下文短语描述的开放式概念关系,并与基于条件随机场(Conditional Random Fields,CRF)和基于长短时记忆网络(Long Short-Term Memory,LSTM)的方法进行对比分析。结果:基于BiLSTM-CRF的中文生物医学开放式概念关系抽取方法取得F1值为0.5221,显著高于基于CRF模型的方法(F1值为0.2353)和基于LSTM模型的方法(F1值为0.3355)。结论:与单独使用CRF模型或LSTM模型的方法相比,基于BiLSTM-CRF的开放式概念关系抽取方法具有更好的鲁棒性和泛化性,对于生物医学文本理解、医学知识网络构建等研究具有借鉴意义。 展开更多
关键词 开放式关系抽取 生物医学概念识别 Bilstm-crf 条件随机场 长短时记忆网络
下载PDF
基于Bi-LSTM-CRF的商业领域命名实体识别 被引量:17
6
作者 丁晟春 方振 王楠 《现代情报》 CSSCI 2020年第3期103-110,共8页
[目的/意义]为解决目前网络公开平台的多源异构的企业数据的散乱、无序、碎片化问题,提出Bi-LSTM-CRF深度学习模型进行商业领域中的命名实体识别工作。[方法/过程]该方法包括对企业全称实体、企业简称实体与人名实体3类命名实体识别。[... [目的/意义]为解决目前网络公开平台的多源异构的企业数据的散乱、无序、碎片化问题,提出Bi-LSTM-CRF深度学习模型进行商业领域中的命名实体识别工作。[方法/过程]该方法包括对企业全称实体、企业简称实体与人名实体3类命名实体识别。[结果/结论]实验结果显示对企业全称实体、企业简称实体与人名实体3类命名实体识别的识别率平均F值为90.85%,验证了所提方法的有效性,证明了本研究有效地改善了商业领域中的命名实体识别效率。 展开更多
关键词 商业领域 命名实体识别 深度学习 Bi-lstm-crf
下载PDF
基于改进Bi-LSTM-CRF的农业问答系统研究 被引量:11
7
作者 白皓然 孙伟浩 +1 位作者 金宁 马皓冉 《中国农机化学报》 北大核心 2023年第2期99-105,共7页
针对农业领域问答系统面临的实体识别困难的问题,提出一种基于改进Bi-LSTM-CRF的实体识别方法。首先通过BERT预训练模型的预处理,生成基于上下文信息的词向量,然后将训练出的词向量输入Bi-LSTM-CRF做进一步的训练处理,最后,利用Python的... 针对农业领域问答系统面临的实体识别困难的问题,提出一种基于改进Bi-LSTM-CRF的实体识别方法。首先通过BERT预训练模型的预处理,生成基于上下文信息的词向量,然后将训练出的词向量输入Bi-LSTM-CRF做进一步的训练处理,最后,利用Python的Django框架设计农业领域的实体识别、实体查询、农知问答等子系统。经过试验对比,所提出的改进的Bi-LSTM-CRF在农业信息领域具有更好的实体识别能力,在农业信息语料库上的精确率、召回率和F1值分别为93.23%、91.08%和92.16%。实现农业领域实体识别和农业信息问答的知识图谱网站演示,对农业信息化的发展具有重要意义。 展开更多
关键词 智能问答系统 知识图谱 双向长短期记忆模型(Bi-lstm) 条件随机场(crf)
下载PDF
基于LSTM-CRF的军事动向文本实体识别方法 被引量:13
8
作者 高翔 张金登 +1 位作者 许潇 冯剑红 《指挥信息系统与技术》 2020年第6期91-95,共5页
军事动向文本包含了丰富的情报信息,因目前对非结构化格式数据进行分析处理仍以人工研判为主,故严重制约了情报分析的智能化水平,已成为信息系统情报分析的瓶颈。为了提升文本分析效率,提出使用条件随机场(CRF)与长短时记忆神经网络(LS... 军事动向文本包含了丰富的情报信息,因目前对非结构化格式数据进行分析处理仍以人工研判为主,故严重制约了情报分析的智能化水平,已成为信息系统情报分析的瓶颈。为了提升文本分析效率,提出使用条件随机场(CRF)与长短时记忆神经网络(LSTM)相结合的LSTM-CRF模型,通过加入预先训练的字嵌入向量及不同词位标注集,对军事动向文本进行实体识别。试验分析表明,LSTM-CRF模型简化了传统实体识别过程,实体识别准确度可达86%,具有工程实用性。 展开更多
关键词 长短时记忆神经网络 条件随机场 实体识别 军事动向文本
下载PDF
基于BiLSTM-CRF的中医文言文文献分词模型研究 被引量:15
9
作者 王莉军 周越 +1 位作者 桂婕 翟云 《计算机应用研究》 CSCD 北大核心 2020年第11期3359-3362,3367,共5页
由于中医文献内容繁杂数目庞大、专业术语词汇较多,且包含使用文言文、古人口语等多样的书写方式,使用通用领域的分词器进行分词的效果较差。为了解决这一问题,构建了基于BiLSTM-CRF的模型对中医领域的文献尤其是文言文文献进行分词,并... 由于中医文献内容繁杂数目庞大、专业术语词汇较多,且包含使用文言文、古人口语等多样的书写方式,使用通用领域的分词器进行分词的效果较差。为了解决这一问题,构建了基于BiLSTM-CRF的模型对中医领域的文献尤其是文言文文献进行分词,并在中医领域文献上对比了BiLSTM-CRF模型、BiLSTM模型及主流通用中文分词器jieba、Ansj的分词结果。结果表明基于Bi-LSTM-CRF模型的分词取得了更优秀的分类性能和鲁棒性。 展开更多
关键词 中医 分词 条件随机场 双向长短时记忆
下载PDF
基于Bi-LSTM-CRF模型的维吾尔语词干提取的研究 被引量:6
10
作者 古丽尼格尔·阿不都外力 吐尔根·依布拉音 +1 位作者 卡哈尔江·阿比的热西提 王路路 《中文信息学报》 CSCD 北大核心 2019年第8期60-66,共7页
词干提取是维吾尔语自然语言处理中的基础性研究,其提取质量直接影响其他任务的性能。但目前维吾尔语词干提取研究存在过度切分、不切分和歧义切分等问题,这些问题导致词干提取质量不高,对后续任务的性能影响较大。因此该文提出了基于Bi... 词干提取是维吾尔语自然语言处理中的基础性研究,其提取质量直接影响其他任务的性能。但目前维吾尔语词干提取研究存在过度切分、不切分和歧义切分等问题,这些问题导致词干提取质量不高,对后续任务的性能影响较大。因此该文提出了基于Bi-LSTM-CRF的维吾尔语词干提取模型,将字符作为最小切分单位,选取维吾尔语字符特征、音类特征以及语音特征为候选特征,结合模型进行实验。实验表明,该文提出的Bi-LSTM-CRF模型在维吾尔语词干提取任务上,F1值达到了88%,在融入手工提取的候选特征之后,F1值提高了1.8个点,有效提高了词干提取的准确性,缓解了上述问题带来的影响。 展开更多
关键词 维吾尔语 词干提取 Bi-lstm-crf
下载PDF
采用BI-LSTM-CRF模型的数值信息抽取 被引量:10
11
作者 王竣平 白宇 蔡东风 《计算机应用与软件》 北大核心 2019年第5期138-144,共7页
数值信息是文本中的一种重要信息,含有主体、属性、属性值等元素。然而当前数值信息抽取方法对比较关系的表示比较单一,对于含有多个数值的句子,其数值信息抽取的效果不佳。根据文本中数量关系表述特征,提出一种数值信息表示方法和数值... 数值信息是文本中的一种重要信息,含有主体、属性、属性值等元素。然而当前数值信息抽取方法对比较关系的表示比较单一,对于含有多个数值的句子,其数值信息抽取的效果不佳。根据文本中数量关系表述特征,提出一种数值信息表示方法和数值信息抽取框架。根据数值信息中各个元素的特点,利用BI-LSTM-CRF模型对数值信息元素进行识别;利用语言特征判断属性值和其他元素之间的语义关系。该方法对数值信息抽取的准确率、召回率和F值分别达到0.775、0.752和0.763,优于现有的抽取的方法。 展开更多
关键词 数值信息表示 语义关系 BI-lstm-crf模型
下载PDF
基于Gate机制与Bi-LSTM-CRF的汉语语义角色标注 被引量:4
12
作者 张苗苗 张玉洁 +2 位作者 刘明童 徐金安 陈钰枫 《计算机与现代化》 2018年第4期1-6,31,共7页
目前,语义角色标注大多基于双向长短时记忆网络(Bi-LSTM)。但是,由于词向量表示由上下文窗口中的词嵌入拼接得到,导致其依赖于左右词嵌入的联合作用。针对该问题,引入Gate机制对词向量表示进行调整。为了获取更深层次的语义信息,对Bi-L... 目前,语义角色标注大多基于双向长短时记忆网络(Bi-LSTM)。但是,由于词向量表示由上下文窗口中的词嵌入拼接得到,导致其依赖于左右词嵌入的联合作用。针对该问题,引入Gate机制对词向量表示进行调整。为了获取更深层次的语义信息,对Bi-LSTM的深度进行扩展。此外,引入标签转移概率矩阵进行约束,并且使用条件随机场(CRF)融合全局标签信息得出最优标注序列。实验结果表明,该方法使得汉语语义角色标注的F1值提高1.71%。 展开更多
关键词 汉语语义角色标注 Gate机制 Bi-lstm-crf 标签转移概率矩阵
下载PDF
融合Gate过滤机制与深度Bi-LSTM-CRF的汉语语义角色标注 被引量:4
13
作者 张苗苗 刘明童 +2 位作者 张玉洁 徐金安 陈钰枫 《情报工程》 2018年第2期45-53,共9页
语义角色标注的传统方法采用基于句法特征的统计机器学习方法。由于依存句法可以表示词语之间的语义关系,故在语义角色标注中取得了较好的性能;但该方法存在特征抽取过程繁琐,难以捕捉句子中长距离依赖等问题。随着深度学习的兴起,研究... 语义角色标注的传统方法采用基于句法特征的统计机器学习方法。由于依存句法可以表示词语之间的语义关系,故在语义角色标注中取得了较好的性能;但该方法存在特征抽取过程繁琐,难以捕捉句子中长距离依赖等问题。随着深度学习的兴起,研究者将基于双向长短时记忆(Bidirectional Long Short-Term Memory,Bi-LSTM)神经网络模型用于语义角色标注。该模型可以自动学习特征,并对词与词之间的远距离依赖关系进行有效建模。本文提出融合Bi-LSTM-CRF模型与依存句法特征的方法,并且引入Gate过滤机制对词向量表示进行调整,以达到利用句法特征提高语义角色标注精度的同时,规避特征工程的繁琐。CPB上的实验结果表明,利用本文所提方法的汉语语义角色标注的F1值达到79.53%,比前人的方法有了较为显著的提升。 展开更多
关键词 汉语语义角色标注 Gate过滤机制 Bi-lstm-crf 依存句法分析
下载PDF
基于BERT-Bi-LSTM-CRF模型的自主式交通系统参与主体识别方法 被引量:10
14
作者 唐进君 庹昊南 +1 位作者 刘佑 付强 《交通信息与安全》 CSCD 北大核心 2022年第5期80-90,共11页
自主式交通系统(ATS)的重要组成部分是参与主体,参与主体的信息通常依靠文本进行描述。为构建自主式交通知识图谱,需要从文本中准确地识别出大量参与主体。为此,研究了基于BERT-Bi-LSTM-CRF模型的实体识别方法,对自主式交通系统参与主... 自主式交通系统(ATS)的重要组成部分是参与主体,参与主体的信息通常依靠文本进行描述。为构建自主式交通知识图谱,需要从文本中准确地识别出大量参与主体。为此,研究了基于BERT-Bi-LSTM-CRF模型的实体识别方法,对自主式交通系统参与主体进行抽取。词嵌入模型BERT为预训练语言模型,用以捕获丰富的语义特征,将捕获的语义特征输入到双向长短时记忆神经网络(Bi-LSTM)模型中提取上下文双向序列信息,经条件随机场(CRF)处理得到最优序列预测结果。收集交通专业相关的原始语料,经过数据预处理与文本标注,形成了可用于自主式交通系统参与主体识别的语料库,基于此数据开展实体识别对比实验。结果证明:BERT模型显著提升了自主式交通系统参与主体识别任务的性能。相较于传统方法 CNN-LSTM或Bi-LSTM等,所提方法可以得到最佳综合识别效果,各实体的综合F1值为86.81%,表明通过BERT模型提取参与主体的语义特征,可以增强识别方法的泛化能力。“使用者”“运营者”“提供者”“规划者”“维护者”类实体的F1值分别为90.35%,92.31%,90.48%,93.33%,95.00%。验证了所提方法识别自主式交通系统参与主体的有效性。 展开更多
关键词 智能交通 命名实体识别 知识图谱 BERT-Bi-lstm-crf 知识建模
下载PDF
融合attention机制的BI-LSTM-CRF中文分词模型 被引量:8
15
作者 黄丹丹 郭玉翠 《软件》 2018年第10期260-266,共7页
中文的词语不同于英文单词,没有空格作为自然分界符,因此,为了使机器能够识别中文的词语需要进行分词操作。深度学习在中文分词任务上的研究与应用已经有了一些突破性成果,本文在已有工作的基础上,提出融合Bi-LSTM-CRF模型与attention... 中文的词语不同于英文单词,没有空格作为自然分界符,因此,为了使机器能够识别中文的词语需要进行分词操作。深度学习在中文分词任务上的研究与应用已经有了一些突破性成果,本文在已有工作的基础上,提出融合Bi-LSTM-CRF模型与attention机制的方法,并且引入去噪机制对字向量表示进行过滤,此外为改进单向LSTM对后文依赖性不足的缺点引入了贡献率?对BI-LSTM的输出权重矩阵进行调节,以提升分词效果。使用改进后的模型对一些公开数据集进行了实验。实验结果表明,改进的attention-BI-LSTM-CRF模型以及训练方法可以有效地解决中文自然语言处理中的分词、词性标注等问题,并较以前的模型有更优秀的性能。 展开更多
关键词 中文分词 BI-lstm crf attention机制 贡献因子 去噪机制 DROPOUT
下载PDF
基于CRF和BI-LSTM的命名实体识别方法 被引量:16
16
作者 柏兵 侯霞 石松 《北京信息科技大学学报(自然科学版)》 2018年第6期27-33,共7页
针对传统命名实体识别需要大量人工及规则信息的问题,提出一种基于条件随机场(conditional random field, CRF)和双向长短时记忆(bi-directional long short-term memory, BI-LSTM)神经网络的命名实体识别方法。其中,CRF模型在进行中文... 针对传统命名实体识别需要大量人工及规则信息的问题,提出一种基于条件随机场(conditional random field, CRF)和双向长短时记忆(bi-directional long short-term memory, BI-LSTM)神经网络的命名实体识别方法。其中,CRF模型在进行中文分词的时候考虑到了未登录词的问题,具备较好的学习能力;双向长短期神经网络能够很好地保留上下文信息的特性。通过使用北京大学标注的1998年人民日报语料库对所提方法进行实验,结果表明:Dropout参数对命名实体识别的效果存在积极影响;同时当Dropout参数取不变时,双向LSTM模型比单向LSTM模型(long short-term memory, LSTM)在中文命名实体识别任务中取得了更好的识别效果。 展开更多
关键词 命名实体识别 条件随机场 BI-lstm
下载PDF
基于Bi-LSTM-CRF算法的气象预警信息质控系统的实现 被引量:3
17
作者 张淑静 苗开超 +4 位作者 张亚力 杨彬 李腾 刘宜轩 汪翔 《计算机与现代化》 2019年第6期111-115,共5页
本文采用双向长短期记忆网络条件随机场(Bi-LSTM-CRF)算法,通过双向循环神经网络(Bi-LSTM)对已有的合法预警信息文本数据集和开放域中文分析公开数据集进行训练;采用CRF序列标注法有效地结合了预警前后的标签信息对分词进行序列标注;使... 本文采用双向长短期记忆网络条件随机场(Bi-LSTM-CRF)算法,通过双向循环神经网络(Bi-LSTM)对已有的合法预警信息文本数据集和开放域中文分析公开数据集进行训练;采用CRF序列标注法有效地结合了预警前后的标签信息对分词进行序列标注;使用该算法建立的气象预警信息质控系统已应用在安徽省突发事件预警信息发布系统,在实际应用的过程中充分证明基于神经网络的气象预警信息质控系统能直接有效地对新的预警信息中可能含有的敏感字(词)、错别字等进行智能监测,以帮助监测人员进行气象预警判断,从而可以对发布的气象预警信息起到质量把关的作用。 展开更多
关键词 Bi-lstm-crf 中文分词 气象预警 信息质控 智能检测
下载PDF
基于Bi-LSTM-CRF网络的语义槽识别 被引量:5
18
作者 徐梓翔 车万翔 刘挺 《智能计算机与应用》 2017年第6期91-94,共4页
自然语言理解任务的主要目标是运用自然语言处理的相关方法,对用户发出的语句进行解析,转化成结构化的语义表示。本文重点研究了基于语义槽抽取的自然语言理解方法。在基于语义槽抽取的自然语言理解任务中,任务的输入是用户的指令型语句... 自然语言理解任务的主要目标是运用自然语言处理的相关方法,对用户发出的语句进行解析,转化成结构化的语义表示。本文重点研究了基于语义槽抽取的自然语言理解方法。在基于语义槽抽取的自然语言理解任务中,任务的输入是用户的指令型语句,输出为指令的语义槽实体标注序列,如出发日期、出发地点等,故可将语义槽抽取任务看作类似于命名实体识别任务,以序列标注任务的方法解决。本文研究提出了基于Bi-LSTM-CRF模型的语义槽抽取方法,在英文语料ATIS上进行了实验。实验结果表明,基于Bi-LSTM-CRF网络的方法相比于传统机器学习的基准方法,结果得到了大幅度的提升。对于模型识别的结果,研究中采用F1值进行评价。 展开更多
关键词 语义槽抽取 自然语言理解 Bi-lstm-crf网络
下载PDF
基于LSTM-CRF的中医医案症状术语识别 被引量:33
19
作者 李明浩 刘忠 姚远哲 《计算机应用》 CSCD 北大核心 2018年第A02期42-46,共5页
目前中医文献和临床医案数字化、结构化程度较低,从文本中有效获取症状信息是医案结构化的首要任务之一。针对中医医案临床症状术语,提出了一种基于长短期记忆(LSTM)网络和条件随机场(CRF)的深度学习症状术语识别方法。首先,参考中医临... 目前中医文献和临床医案数字化、结构化程度较低,从文本中有效获取症状信息是医案结构化的首要任务之一。针对中医医案临床症状术语,提出了一种基于长短期记忆(LSTM)网络和条件随机场(CRF)的深度学习症状术语识别方法。首先,参考中医临床症状术语规范,根据常见症状的组成要素制定了额外的字符级别特征,结合预训练的字嵌入获得文本序列的向量表示;其次,通过双向长短期记忆网络建模症状术语字符分布特征与句内依赖,获得序列元素的概率分布矩阵;最后,通过条件随机场获得序列标注结果。在小规模训练集上的实验表明,该方法在中医临床症状术语识别任务上F1值最高达到了0. 78。同时,该方法与传统的使用条件随机场方法相比,能够有效地识别字符较多的长症状术语,与进行人工特征标注相比代价更小。 展开更多
关键词 命名实体识别 长短期记忆网络 条件随机场 中医医案 症状术语
下载PDF
基于多特征Bi-LSTM-CRF的影评人名识别研究 被引量:12
20
作者 禤镇宇 蒋盛益 +1 位作者 张礼明 包睿 《中文信息学报》 CSCD 北大核心 2019年第3期94-101,共8页
近年来电影行业蓬勃发展,相关的信息抽取和分析技术日益受到行业内的重视,其中对电影主创人物的分析尤为重要。而电影评论作为观影群体的主要反馈信息,具有重要的分析价值。如何从影评中自动抽取主创人名成为重要的基础工作。然而评论... 近年来电影行业蓬勃发展,相关的信息抽取和分析技术日益受到行业内的重视,其中对电影主创人物的分析尤为重要。而电影评论作为观影群体的主要反馈信息,具有重要的分析价值。如何从影评中自动抽取主创人名成为重要的基础工作。然而评论中观众对人物的称谓方式多样复杂,而且新电影的影评中往往存在大量人名未登录词,传统方法难以有效识别。针对影评的这些特点,该文提出一种基于多特征Bi-LSTM-CRF的影评人名识别方法。该方法通过利用外部人名语料和未标注影评提取字符级的特征,并采用Bi-LSTM-CRF模型进行人名字符序列标注。实验结果表明,该方法能够有效识别影评中的复杂称谓和人名未登录词,从而有效地抽取影评中的人名实体。 展开更多
关键词 影评 lstm crf 多特征 人名识别
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部