期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于自注意力机制与词汇增强的中文医学命名实体识别
1
作者
罗歆然
李天瑞
贾真
《计算机应用》
CSCD
北大核心
2024年第2期385-392,共8页
针对中文医学文本实体嵌套导致的单词边界识别困难问题以及现有栅格结构集成词汇特征所面临的语义信息损失严重的情况,提出一种用于中文医学命名实体识别(MNER)的自适应词汇信息增强模型。首先,利用双向长短期记忆(BiLSTM)网络编码字符...
针对中文医学文本实体嵌套导致的单词边界识别困难问题以及现有栅格结构集成词汇特征所面临的语义信息损失严重的情况,提出一种用于中文医学命名实体识别(MNER)的自适应词汇信息增强模型。首先,利用双向长短期记忆(BiLSTM)网络编码字符序列的上下文信息并捕捉较长距离的依赖关系;然后,对字符序列中每个字符的潜在单词信息进行字词对建模,采用自注意力机制实现不同单词之间的内部交互;最后,通过基于双线性注意力机制的词汇适配器将词汇信息集成到文本序列中的每个字符中,有效增强语义信息的同时充分利用单词丰富的边界信息,并抑制相关性低的单词。实验结果表明,所提模型与基于字符的基线模型相比,平均F1值分别提升了1.37~2.38个百分点,并在结合BERT后取得了最优的效果。
展开更多
关键词
医学命名实体识别
中文医学文本
词汇适配器
自注意力机制
双向长短期记忆网络
下载PDF
职称材料
基于局部注意力机制的中文短文本实体链接
被引量:
5
2
作者
张晟旗
王元龙
+3 位作者
李茹
王笑月
王晓晖
闫智超
《计算机工程》
CAS
CSCD
北大核心
2021年第11期77-83,92,共8页
实体链接是加强语义理解和连接知识信息与文本的有效方法,但目前多数模型对上下文语境的精准理解受限于文本长度,面向短文本的实体链接任务存在实体边界识别错误和实体语义理解错误的问题。针对中文短文本的实体链接任务,构建基于局部...
实体链接是加强语义理解和连接知识信息与文本的有效方法,但目前多数模型对上下文语境的精准理解受限于文本长度,面向短文本的实体链接任务存在实体边界识别错误和实体语义理解错误的问题。针对中文短文本的实体链接任务,构建基于局部注意力机制的实体链接模型。在实体消歧的过程中,通过对待消歧文本与实体的知识描述文本进行拼接,将短文本转换为长文本,同时引入局部注意力机制,缓解长距离依赖问题并强化局部的上下文信息。实验结果表明,相比于传统加入BIO标注方法的模型,该模型在CCKS2019和CCKS2020数据集上的F1值分别提升了4.41%和1.52%。
展开更多
关键词
实体链接
上下文
语义理解
中文短文本
局部注意力机制
下载PDF
职称材料
一种实体描述短文本相似度计算方法
被引量:
3
3
作者
秦添轶
林蝉
+1 位作者
宋博宇
关毅
《智能计算机与应用》
2015年第2期34-37,共4页
中文实体描述短文本具有词语稀疏、语义离散、用词随意等特点。本文分析《知网》义原网络和词语相似度的关系,提出了短文本间语义相似度部分和短文本分类部分相结合的实体描述短文本间相似度计算方法。语义相似度部分分析《知网》义原...
中文实体描述短文本具有词语稀疏、语义离散、用词随意等特点。本文分析《知网》义原网络和词语相似度的关系,提出了短文本间语义相似度部分和短文本分类部分相结合的实体描述短文本间相似度计算方法。语义相似度部分分析《知网》义原网络和词语间相似度的关系,在计算词语间相似度和短文本间相似度的过程中弱化了浅层《知网》义原影响并均衡了义原权重,使义原相似度计算结果更加合理。短文本分类部分将短文本分解为义原向量,根据特定领域短文本的义原分布情况进行短文本分类。两部分结合得到实体描述短文本间相似度。本文方法的有效性在百度知识图谱数据分析竞赛任务1的测试结果中得到了证明。
展开更多
关键词
实体描述短文本
文本分类
文本相似度
《知网》
下载PDF
职称材料
基于BiLSTM-CRF中文临床文本中受保护的健康信息识别
被引量:
10
4
作者
刘婧茹
宋阳
+3 位作者
贾睿
张翼鹏
罗勇
马敬东
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020年第10期124-133,共10页
【目的】为保护临床文本中的隐私信息,有效地从非结构化文本中识别受保护的健康信息(PHI),提出利用BiLSTM-CRF模型从临床记录中删除隐私信息的自动化方案。【方法】选择一家区域卫生信息平台电子健康档案中的出院小结作为实验数据,根据...
【目的】为保护临床文本中的隐私信息,有效地从非结构化文本中识别受保护的健康信息(PHI),提出利用BiLSTM-CRF模型从临床记录中删除隐私信息的自动化方案。【方法】选择一家区域卫生信息平台电子健康档案中的出院小结作为实验数据,根据《健康保险可携性与责任法案》(HIPAA)所规定的18项PHI结合实验数据特征确定7个PHI类别及其下包含的15个PHI类型。基于BiLSTM-CRF模型有效地从非结构化的临床记录中识别受保护的健康信息。【结果】对所有实体类别识别的准确率、召回率以及F值分别达98.66%、99.36%以及99.01%,并对识别错误的标签进行总结分析。【局限】结合语料特征对模型性能的优化有待完善,并且对于自动识别PHI后的临床文本质量未进行评估。【结论】BiLSTM-CRF模型在不需要特征工程的情况下实现了命名实体自动化识别,有利于促进临床信息共享与利用。
展开更多
关键词
中文临床文本
受保护的健康信息
长短期记忆网络
隐私信息
命名实体识别
原文传递
题名
基于自注意力机制与词汇增强的中文医学命名实体识别
1
作者
罗歆然
李天瑞
贾真
机构
西南交通大学计算机与人工智能学院
出处
《计算机应用》
CSCD
北大核心
2024年第2期385-392,共8页
基金
国家自然科学基金资助项目(62276218,62272398,62176221)。
文摘
针对中文医学文本实体嵌套导致的单词边界识别困难问题以及现有栅格结构集成词汇特征所面临的语义信息损失严重的情况,提出一种用于中文医学命名实体识别(MNER)的自适应词汇信息增强模型。首先,利用双向长短期记忆(BiLSTM)网络编码字符序列的上下文信息并捕捉较长距离的依赖关系;然后,对字符序列中每个字符的潜在单词信息进行字词对建模,采用自注意力机制实现不同单词之间的内部交互;最后,通过基于双线性注意力机制的词汇适配器将词汇信息集成到文本序列中的每个字符中,有效增强语义信息的同时充分利用单词丰富的边界信息,并抑制相关性低的单词。实验结果表明,所提模型与基于字符的基线模型相比,平均F1值分别提升了1.37~2.38个百分点,并在结合BERT后取得了最优的效果。
关键词
医学命名实体识别
中文医学文本
词汇适配器
自注意力机制
双向长短期记忆网络
Keywords
Medical Named Entity Recognition(MNER)
chinese
medical
text
lexicon adapter
self-attention mechanism
Bi-directional Long
short
-Term Memory(BiLSTM)network
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于局部注意力机制的中文短文本实体链接
被引量:
5
2
作者
张晟旗
王元龙
李茹
王笑月
王晓晖
闫智超
机构
山西大学计算机与信息技术学院
山西大学计算机智能与中文信息处理教育部重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第11期77-83,92,共8页
基金
国家自然科学基金“面向汉语篇章语义分析的框架推理技术研究”(61772324)
国家自然科学基金青年科学基金项目“基于事件的图文数据阅读理解关键技术研究”(61806117)。
文摘
实体链接是加强语义理解和连接知识信息与文本的有效方法,但目前多数模型对上下文语境的精准理解受限于文本长度,面向短文本的实体链接任务存在实体边界识别错误和实体语义理解错误的问题。针对中文短文本的实体链接任务,构建基于局部注意力机制的实体链接模型。在实体消歧的过程中,通过对待消歧文本与实体的知识描述文本进行拼接,将短文本转换为长文本,同时引入局部注意力机制,缓解长距离依赖问题并强化局部的上下文信息。实验结果表明,相比于传统加入BIO标注方法的模型,该模型在CCKS2019和CCKS2020数据集上的F1值分别提升了4.41%和1.52%。
关键词
实体链接
上下文
语义理解
中文短文本
局部注意力机制
Keywords
entity linking
con
text
semantic understanding
chinese
short
text
local attention mechanism
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种实体描述短文本相似度计算方法
被引量:
3
3
作者
秦添轶
林蝉
宋博宇
关毅
机构
哈尔滨工业大学计算机科学与技术学院
哈尔滨工业大学软件学院
出处
《智能计算机与应用》
2015年第2期34-37,共4页
基金
国家自然科学基金(60975077)
文摘
中文实体描述短文本具有词语稀疏、语义离散、用词随意等特点。本文分析《知网》义原网络和词语相似度的关系,提出了短文本间语义相似度部分和短文本分类部分相结合的实体描述短文本间相似度计算方法。语义相似度部分分析《知网》义原网络和词语间相似度的关系,在计算词语间相似度和短文本间相似度的过程中弱化了浅层《知网》义原影响并均衡了义原权重,使义原相似度计算结果更加合理。短文本分类部分将短文本分解为义原向量,根据特定领域短文本的义原分布情况进行短文本分类。两部分结合得到实体描述短文本间相似度。本文方法的有效性在百度知识图谱数据分析竞赛任务1的测试结果中得到了证明。
关键词
实体描述短文本
文本分类
文本相似度
《知网》
Keywords
short text description for chinese entities
text
Categorization
text
Similarity
Hownet
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于BiLSTM-CRF中文临床文本中受保护的健康信息识别
被引量:
10
4
作者
刘婧茹
宋阳
贾睿
张翼鹏
罗勇
马敬东
机构
华中科技大学同济医学院医药卫生管理学院
四川省电子病历工程技术研究中心
成都中医药大学公共卫生学院
四川九阵科技股份有限公司
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020年第10期124-133,共10页
基金
四川省科技计划项目重点研发基金项目“海量健康数据信息挖掘脱敏技术研究及应用”(项目编号:2018GZ0201)的研究成果之一。
文摘
【目的】为保护临床文本中的隐私信息,有效地从非结构化文本中识别受保护的健康信息(PHI),提出利用BiLSTM-CRF模型从临床记录中删除隐私信息的自动化方案。【方法】选择一家区域卫生信息平台电子健康档案中的出院小结作为实验数据,根据《健康保险可携性与责任法案》(HIPAA)所规定的18项PHI结合实验数据特征确定7个PHI类别及其下包含的15个PHI类型。基于BiLSTM-CRF模型有效地从非结构化的临床记录中识别受保护的健康信息。【结果】对所有实体类别识别的准确率、召回率以及F值分别达98.66%、99.36%以及99.01%,并对识别错误的标签进行总结分析。【局限】结合语料特征对模型性能的优化有待完善,并且对于自动识别PHI后的临床文本质量未进行评估。【结论】BiLSTM-CRF模型在不需要特征工程的情况下实现了命名实体自动化识别,有利于促进临床信息共享与利用。
关键词
中文临床文本
受保护的健康信息
长短期记忆网络
隐私信息
命名实体识别
Keywords
chinese
Clinical
text
Protected Health In
for
mation
Long
short
-Term Memory
Private In
for
mation
Named Entity Recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于自注意力机制与词汇增强的中文医学命名实体识别
罗歆然
李天瑞
贾真
《计算机应用》
CSCD
北大核心
2024
0
下载PDF
职称材料
2
基于局部注意力机制的中文短文本实体链接
张晟旗
王元龙
李茹
王笑月
王晓晖
闫智超
《计算机工程》
CAS
CSCD
北大核心
2021
5
下载PDF
职称材料
3
一种实体描述短文本相似度计算方法
秦添轶
林蝉
宋博宇
关毅
《智能计算机与应用》
2015
3
下载PDF
职称材料
4
基于BiLSTM-CRF中文临床文本中受保护的健康信息识别
刘婧茹
宋阳
贾睿
张翼鹏
罗勇
马敬东
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2020
10
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部