期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例
被引量:
9
1
作者
孙安
于英香
+1 位作者
罗永刚
王祺
《图书情报工作》
CSSCI
北大核心
2018年第11期103-111,共9页
[目的/意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法/过程]选取汉语词语的词性标注、关键词权值、...
[目的/意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法/过程]选取汉语词语的词性标注、关键词权值、依存句法分析三个特征,构筑字粒度序列标注模型的临床病历训练文本,语料来源CCKs2017:Task2。在不同特征组合方式下,采用条件随机场算法验证两种字粒度词语特征提取方案Method1与Method2。[结果/结论]在四种不同词语特征组合下,Method2相对于Method1在临床病历命名实体识别任务中性能均有所提升,四折交叉测试中F1值平均提升了0.23%。实验表明在中文分词技术日趋成熟的环境下,Method2相对Method1能够获得更好的词语特征表示,对中文字粒度序列标注模型的处理性能具有提升作用。
展开更多
关键词
命名实体识别
字粒度
特征提取
序列标注模型
条件随机场
临床病历
原文传递
融合知识的中文医疗实体识别模型
2
作者
刘龙航
赵铁军
《智能计算机与应用》
2021年第3期94-97,共4页
从医疗文本中抽取知识对构建医疗辅助诊断系统等应用具有重要意义。实体识别是其中的核心步骤。现有的实体识别模型大都是基于标注数据的深度学习模型,非常依赖高质量大规模的标注数据。为了充分利用已有的医疗领域词典和预训练语言模型...
从医疗文本中抽取知识对构建医疗辅助诊断系统等应用具有重要意义。实体识别是其中的核心步骤。现有的实体识别模型大都是基于标注数据的深度学习模型,非常依赖高质量大规模的标注数据。为了充分利用已有的医疗领域词典和预训练语言模型,本文提出了融合知识的中文医疗实体识别模型。一方面基于领域词典提取领域知识,另一方面,引入预训练语言模型BERT作为通用知识,然后将领域知识和通用知识融入到模型中。此外,本文引入了卷积神经网络来提高模型的上下文建模能力。本文在多个数据集上进行实验,实验结果表明,将知识融合到模型中能够有效提高中文医疗实体识别的效果。
展开更多
关键词
实体识别
序列标注模型
融合知识
下载PDF
职称材料
基于联合模型的中文嵌套命名实体识别
被引量:
8
3
作者
尹迪
周俊生
曲维光
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2014年第3期29-35,共7页
中文嵌套命名实体识别是自然语言处理中一个比较困难的问题.针对传统的序列化标注方法的不足,本文提出了一种新的基于联合模型的中文嵌套命名实体识别方法,该方法将嵌套命名实体识别看作是一种联合切分和标注任务.联合模型用一种改进的b...
中文嵌套命名实体识别是自然语言处理中一个比较困难的问题.针对传统的序列化标注方法的不足,本文提出了一种新的基于联合模型的中文嵌套命名实体识别方法,该方法将嵌套命名实体识别看作是一种联合切分和标注任务.联合模型用一种改进的beam search算法作为系统的解码算法,并采用一种在线学习算法平均感知器算法作为训练算法,获得了较快的收敛速度和较好的识别效果.实验结果表明基于联合模型的方法对嵌套命名实体识别取得了更好的效果.
展开更多
关键词
嵌套命名实体识别
序列
化
标注
模型
联合
模型
感知器算法
下载PDF
职称材料
基于领域情感词典特征表示的细粒度意见挖掘
被引量:
13
4
作者
郁圣卫
卢奇
陈文亮
《中文信息学报》
CSCD
北大核心
2019年第2期112-121,共10页
细粒度意见挖掘的主要目标是从观点文本中获取情感要素并判断情感倾向。现有方法大多基于序列标注模型,但很少利用情感词典资源。该文提出一种基于领域情感词典特征表示的细粒度意见挖掘方法,使用领域情感词典在观点文本上构建特征表示...
细粒度意见挖掘的主要目标是从观点文本中获取情感要素并判断情感倾向。现有方法大多基于序列标注模型,但很少利用情感词典资源。该文提出一种基于领域情感词典特征表示的细粒度意见挖掘方法,使用领域情感词典在观点文本上构建特征表示并将其加入序列标注模型的输入部分。首先构建一份新的电商领域情感词典,然后在电商评论文本真实数据上,分别为条件随机场(CRF)和双向长短期记忆-条件随机场(BiLSTM-CRF)这两种常用序列标注模型设计基于领域情感词典的特征表示。实验结果表明,基于电商领域情感词典的特征表示方法在两种模型上都取得了良好的效果,并且超过其他情感词典。
展开更多
关键词
细粒度意见挖掘
情感词典
特征表示
序列标注模型
下载PDF
职称材料
基于ERNIE-CRF-ESL安全隐患文本结构化解析
被引量:
2
5
作者
艾新波
郭彦君
+1 位作者
谢云昊
陈成
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2021年第5期107-113,共7页
安全隐患描述文本是通过自然语言描述进行记录的,具有主观随意性问题,现有的序列标注相关模型无法从中提取关键知识信息.根据安全隐患描述文本的特点,首先设计了一种适用于安全隐患描述文本的序列标注方法,提出了基于知识集成的增强表示...
安全隐患描述文本是通过自然语言描述进行记录的,具有主观随意性问题,现有的序列标注相关模型无法从中提取关键知识信息.根据安全隐患描述文本的特点,首先设计了一种适用于安全隐患描述文本的序列标注方法,提出了基于知识集成的增强表示(ERNIE)模型的进行词向量特征提取,在其基础上通过融合条件随机场(CRF)模块和信息提取(ESL)模块,构建了一种安全生产隐患描述文本结构化解析方法.在某超大城市的安全隐患描述文本上进行了实验,实验结果表明,所提模型在文本结构化解析任务的精确率达到了65.1%,可以从城市安全隐患非结构化数据中获取更多的知识信息,进而规范化安全隐患排查记录工作。
展开更多
关键词
安全隐患描述文本
结构化解析
序列标注模型
原文传递
题名
序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例
被引量:
9
1
作者
孙安
于英香
罗永刚
王祺
机构
上海大学图书情报档案系
河南科技大学图书馆
上海健康医学院医疗器械学院
华东理工大学计算机科学与技术系
出处
《图书情报工作》
CSSCI
北大核心
2018年第11期103-111,共9页
基金
国家社会科学基金一般项目“‘区域-国家’电子文件管理整合模型构建与实证研究”(项目编号:11BTQ039)研究成果之一
文摘
[目的/意义]针对中文语言表达特点,提出一种含分词标签的字粒度词语特征提取方法,有效提升了中文临床病历命名实体识别任务的F1值,同时该方法可以为其他中文序列标注模型所借鉴。[方法/过程]选取汉语词语的词性标注、关键词权值、依存句法分析三个特征,构筑字粒度序列标注模型的临床病历训练文本,语料来源CCKs2017:Task2。在不同特征组合方式下,采用条件随机场算法验证两种字粒度词语特征提取方案Method1与Method2。[结果/结论]在四种不同词语特征组合下,Method2相对于Method1在临床病历命名实体识别任务中性能均有所提升,四折交叉测试中F1值平均提升了0.23%。实验表明在中文分词技术日趋成熟的环境下,Method2相对Method1能够获得更好的词语特征表示,对中文字粒度序列标注模型的处理性能具有提升作用。
关键词
命名实体识别
字粒度
特征提取
序列标注模型
条件随机场
临床病历
Keywords
named entity recognition character granularity feature extraction sequential labeling model conditional random field clinical cases
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
融合知识的中文医疗实体识别模型
2
作者
刘龙航
赵铁军
机构
哈尔滨工业大学计算机科学与技术学院
出处
《智能计算机与应用》
2021年第3期94-97,共4页
文摘
从医疗文本中抽取知识对构建医疗辅助诊断系统等应用具有重要意义。实体识别是其中的核心步骤。现有的实体识别模型大都是基于标注数据的深度学习模型,非常依赖高质量大规模的标注数据。为了充分利用已有的医疗领域词典和预训练语言模型,本文提出了融合知识的中文医疗实体识别模型。一方面基于领域词典提取领域知识,另一方面,引入预训练语言模型BERT作为通用知识,然后将领域知识和通用知识融入到模型中。此外,本文引入了卷积神经网络来提高模型的上下文建模能力。本文在多个数据集上进行实验,实验结果表明,将知识融合到模型中能够有效提高中文医疗实体识别的效果。
关键词
实体识别
序列标注模型
融合知识
Keywords
entity recognition
sequence labeling model
knowledge fusion
分类号
R-05 [医药卫生]
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于联合模型的中文嵌套命名实体识别
被引量:
8
3
作者
尹迪
周俊生
曲维光
机构
南京师范大学计算机科学与技术学院
出处
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2014年第3期29-35,共7页
基金
国家自然科学基金(61272221
61472191)
江苏省社科基金(12YYA002)
文摘
中文嵌套命名实体识别是自然语言处理中一个比较困难的问题.针对传统的序列化标注方法的不足,本文提出了一种新的基于联合模型的中文嵌套命名实体识别方法,该方法将嵌套命名实体识别看作是一种联合切分和标注任务.联合模型用一种改进的beam search算法作为系统的解码算法,并采用一种在线学习算法平均感知器算法作为训练算法,获得了较快的收敛速度和较好的识别效果.实验结果表明基于联合模型的方法对嵌套命名实体识别取得了更好的效果.
关键词
嵌套命名实体识别
序列
化
标注
模型
联合
模型
感知器算法
Keywords
nested named entity recognition
sequence labeling models
joint models
perceptron algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于领域情感词典特征表示的细粒度意见挖掘
被引量:
13
4
作者
郁圣卫
卢奇
陈文亮
机构
苏州大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2019年第2期112-121,共10页
基金
国家自然科学基金(61572338
61876115)
江苏省高校自然科学研究重大项目(16KJA520001)
文摘
细粒度意见挖掘的主要目标是从观点文本中获取情感要素并判断情感倾向。现有方法大多基于序列标注模型,但很少利用情感词典资源。该文提出一种基于领域情感词典特征表示的细粒度意见挖掘方法,使用领域情感词典在观点文本上构建特征表示并将其加入序列标注模型的输入部分。首先构建一份新的电商领域情感词典,然后在电商评论文本真实数据上,分别为条件随机场(CRF)和双向长短期记忆-条件随机场(BiLSTM-CRF)这两种常用序列标注模型设计基于领域情感词典的特征表示。实验结果表明,基于电商领域情感词典的特征表示方法在两种模型上都取得了良好的效果,并且超过其他情感词典。
关键词
细粒度意见挖掘
情感词典
特征表示
序列标注模型
Keywords
fine-grained opinion mining
sentiment lexicon
feature representation
sequence labeling model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于ERNIE-CRF-ESL安全隐患文本结构化解析
被引量:
2
5
作者
艾新波
郭彦君
谢云昊
陈成
机构
北京邮电大学人工智能学院
北京邮电大学现代邮政学院
出处
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2021年第5期107-113,共7页
基金
国家自然科学基金项目(61702047)。
文摘
安全隐患描述文本是通过自然语言描述进行记录的,具有主观随意性问题,现有的序列标注相关模型无法从中提取关键知识信息.根据安全隐患描述文本的特点,首先设计了一种适用于安全隐患描述文本的序列标注方法,提出了基于知识集成的增强表示(ERNIE)模型的进行词向量特征提取,在其基础上通过融合条件随机场(CRF)模块和信息提取(ESL)模块,构建了一种安全生产隐患描述文本结构化解析方法.在某超大城市的安全隐患描述文本上进行了实验,实验结果表明,所提模型在文本结构化解析任务的精确率达到了65.1%,可以从城市安全隐患非结构化数据中获取更多的知识信息,进而规范化安全隐患排查记录工作。
关键词
安全隐患描述文本
结构化解析
序列标注模型
Keywords
safety hazard description text
structural analysis
sequence labeling model
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例
孙安
于英香
罗永刚
王祺
《图书情报工作》
CSSCI
北大核心
2018
9
原文传递
2
融合知识的中文医疗实体识别模型
刘龙航
赵铁军
《智能计算机与应用》
2021
0
下载PDF
职称材料
3
基于联合模型的中文嵌套命名实体识别
尹迪
周俊生
曲维光
《南京师大学报(自然科学版)》
CAS
CSCD
北大核心
2014
8
下载PDF
职称材料
4
基于领域情感词典特征表示的细粒度意见挖掘
郁圣卫
卢奇
陈文亮
《中文信息学报》
CSCD
北大核心
2019
13
下载PDF
职称材料
5
基于ERNIE-CRF-ESL安全隐患文本结构化解析
艾新波
郭彦君
谢云昊
陈成
《北京邮电大学学报》
EI
CAS
CSCD
北大核心
2021
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部