期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于注意力增强与特征融合的中文医学实体识别
1
作者
王晋涛
秦昂
+4 位作者
张元
陈一飞
王廷凤
谢承霖
邹刚
《计算机工程》
CAS
CSCD
北大核心
2024年第7期324-332,共9页
针对基于字符表示的中文医学领域命名实体识别模型嵌入形式单一、边界识别困难、语义信息利用不充分等问题,一种非常有效的方法是在Bret底层注入词汇特征,在利用词粒度语义信息的同时降低分词错误带来的影响,然而在注入词汇信息的同时...
针对基于字符表示的中文医学领域命名实体识别模型嵌入形式单一、边界识别困难、语义信息利用不充分等问题,一种非常有效的方法是在Bret底层注入词汇特征,在利用词粒度语义信息的同时降低分词错误带来的影响,然而在注入词汇信息的同时也会引入一些低相关性的词汇和噪声,导致基于注意力机制的Bret模型出现注意力分散的情况。此外仅依靠字、词粒度难以充分挖掘中文字符深层次的语义信息。对此,提出基于注意力增强与特征融合的中文医学实体识别模型,对字词注意力分数矩阵进行稀疏处理,使模型的注意力集中在相关度高的词汇,能够有效减少上下文中的噪声词汇干扰。同时,对汉字发音和笔画通过卷积神经网络(CNN)提取特征,经过迭代注意力特征融合模块进行融合,然后与Bret模型的输出特征进行拼接输入给Bi LSTM模型,进一步挖掘字符所包含的深层次语义信息。通过爬虫等方式搜集大量相关医学语料,训练医学领域词向量库,并在CCKS2017和CCKS2019数据集上进行验证,实验结果表明,该模型F1值分别达到94.90%、89.37%,效果优于当前主流的实体识别模型,具有更好的识别效果。
展开更多
关键词
实体识别
中文分
词
注意力稀疏
特征融合
医学
词向量库
下载PDF
职称材料
一种基于多分类语义分析和个性化的语义检索方法
被引量:
1
2
作者
马应龙
李鹏鹏
张敬旭
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014年第2期261-265,共5页
为了进一步提升语义检索的精度和改善用户体验,提出了一种基于多分类语义分析和个性化的语义检索方法.首先,利用改进的多分类语义分析方法实现目标文档的向量化,并建立词向量库;然后,利用支持向量机对文档进行分类,并结合文档类别生成...
为了进一步提升语义检索的精度和改善用户体验,提出了一种基于多分类语义分析和个性化的语义检索方法.首先,利用改进的多分类语义分析方法实现目标文档的向量化,并建立词向量库;然后,利用支持向量机对文档进行分类,并结合文档类别生成标签索引.在检索时,根据词向量库的引导,使用用户历史检索记录和个人信息优化检索结果.实验结果显示,基于该方法的系统的检索精度、平均DCG和nDCG指标值分别达到0.7,7.267和0.890,较基于Lucene方法和Yahoo Directory方法所得结果的均值分别高出31%,36%和19%.在时间复杂度上,每次检索的平均耗时为0.669 s,较Lucene方法仅增加了0.326 s.由此可见,该方法提高了检索的精度和综合相关度,且额外的时间消耗较少.
展开更多
关键词
语义检索
多分类语义分析
词向量库
个性化算法
MULTI-CLASSIFICATION
SEMANTIC
analysis
(MSA)
TERM
vector
database
(TVDB
)
下载PDF
职称材料
题名
基于注意力增强与特征融合的中文医学实体识别
1
作者
王晋涛
秦昂
张元
陈一飞
王廷凤
谢承霖
邹刚
机构
中北大学计算机科学与技术学院
湖南省肿瘤医院
湖南省中医药研究院附属医院
湖南中科助英智能科技研究院
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第7期324-332,共9页
基金
湖南省自然科学基金(2022JJ70022)。
文摘
针对基于字符表示的中文医学领域命名实体识别模型嵌入形式单一、边界识别困难、语义信息利用不充分等问题,一种非常有效的方法是在Bret底层注入词汇特征,在利用词粒度语义信息的同时降低分词错误带来的影响,然而在注入词汇信息的同时也会引入一些低相关性的词汇和噪声,导致基于注意力机制的Bret模型出现注意力分散的情况。此外仅依靠字、词粒度难以充分挖掘中文字符深层次的语义信息。对此,提出基于注意力增强与特征融合的中文医学实体识别模型,对字词注意力分数矩阵进行稀疏处理,使模型的注意力集中在相关度高的词汇,能够有效减少上下文中的噪声词汇干扰。同时,对汉字发音和笔画通过卷积神经网络(CNN)提取特征,经过迭代注意力特征融合模块进行融合,然后与Bret模型的输出特征进行拼接输入给Bi LSTM模型,进一步挖掘字符所包含的深层次语义信息。通过爬虫等方式搜集大量相关医学语料,训练医学领域词向量库,并在CCKS2017和CCKS2019数据集上进行验证,实验结果表明,该模型F1值分别达到94.90%、89.37%,效果优于当前主流的实体识别模型,具有更好的识别效果。
关键词
实体识别
中文分
词
注意力稀疏
特征融合
医学
词向量库
Keywords
entity recognition
Chinese word segmentation
sparse attention
feature fusion
medical word vector library
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种基于多分类语义分析和个性化的语义检索方法
被引量:
1
2
作者
马应龙
李鹏鹏
张敬旭
机构
华北电力大学控制与计算机工程学院
甘肃省电力公司
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014年第2期261-265,共5页
基金
国家自然科学基金资助项目(61001197
61372182)
国家电网公司科技资助项目(522722130292)
文摘
为了进一步提升语义检索的精度和改善用户体验,提出了一种基于多分类语义分析和个性化的语义检索方法.首先,利用改进的多分类语义分析方法实现目标文档的向量化,并建立词向量库;然后,利用支持向量机对文档进行分类,并结合文档类别生成标签索引.在检索时,根据词向量库的引导,使用用户历史检索记录和个人信息优化检索结果.实验结果显示,基于该方法的系统的检索精度、平均DCG和nDCG指标值分别达到0.7,7.267和0.890,较基于Lucene方法和Yahoo Directory方法所得结果的均值分别高出31%,36%和19%.在时间复杂度上,每次检索的平均耗时为0.669 s,较Lucene方法仅增加了0.326 s.由此可见,该方法提高了检索的精度和综合相关度,且额外的时间消耗较少.
关键词
语义检索
多分类语义分析
词向量库
个性化算法
MULTI-CLASSIFICATION
SEMANTIC
analysis
(MSA)
TERM
vector
database
(TVDB
)
Keywords
semantic search
personalization algorithm
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于注意力增强与特征融合的中文医学实体识别
王晋涛
秦昂
张元
陈一飞
王廷凤
谢承霖
邹刚
《计算机工程》
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
一种基于多分类语义分析和个性化的语义检索方法
马应龙
李鹏鹏
张敬旭
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2014
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部