期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向中文临床术语标准化的ESim-SimCSE融合算法
1
作者
曹天甲
程龙龙
+3 位作者
李世锋
曹琉
崔丙剑
倪广健
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2024年第7期751-758,共8页
临床术语的不规范性和多样性给临床数据的应用带来了困难和挑战,因此临床术语标准化工作成为一个重要的研究方向.传统机器学习标准化算法无法结合上下文捕获到隐藏的深层语义,随着计算机算力性能的大幅提升及神经网络被广泛应用于医疗...
临床术语的不规范性和多样性给临床数据的应用带来了困难和挑战,因此临床术语标准化工作成为一个重要的研究方向.传统机器学习标准化算法无法结合上下文捕获到隐藏的深层语义,随着计算机算力性能的大幅提升及神经网络被广泛应用于医疗信息处理领域,深度学习可以克服传统机器学习方法的缺点,被应用于临床术语标准化工作中.本文基于深度学习神经网络提出一种基于无监督与有监督学习融合的候选集生成方法,把候选集生成问题转换为文本相似度计算问题,运用对比学习,结合无监督学习场景ESimCSE-unsup模型和有监督学习场景SimCSE-sup模型,通过迁移学习将ESimCSE-unsup与SimCSE-sup融合形成ESim-SimCSE模型.选取SimCSEsup、SimCSE-unsup和ESimCSE-unsup 3种模型与ESim-SimCSE进行对比.实验结果显示,在CHIP-CDN2019数据集上相同召回范围下,ESim-SimCSE模型均优于其他模型,其中top k=20下,ESim-SimCSE模型计算F1得分为0.8891,比SimCSE-unsup提高了0.0459,比ESimCSE-unsup提高了0.0175,比SimCSE-sup提高了0.0107.
展开更多
关键词
临床术语标准化
候选集生成
ESim-SimCSE
SimCSE
ESimCSE
对比学习
下载PDF
职称材料
序列模式挖掘算法研究
被引量:
13
2
作者
夏明波
王晓川
+1 位作者
孙永强
金士尧
《计算机技术与发展》
2006年第4期4-6,10,共4页
数据挖掘领域一个活跃的研究分支就是序列模式的发现,即在序列数据库中找出所有的频繁子序列。目前的序列模式挖掘方法主要分为两类,一类是候选集生成-测试方法;另一类是模式扩展方法。先介绍序列模式挖掘中的基本概念,然后描述几个重...
数据挖掘领域一个活跃的研究分支就是序列模式的发现,即在序列数据库中找出所有的频繁子序列。目前的序列模式挖掘方法主要分为两类,一类是候选集生成-测试方法;另一类是模式扩展方法。先介绍序列模式挖掘中的基本概念,然后描述几个重要算法,最后给出性能分析。
展开更多
关键词
序列模式挖掘
候选集生成
-测试
模式扩展
算法分析
下载PDF
职称材料
发现频繁情节的改进算法
被引量:
1
3
作者
邓勇
施文康
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005年第3期405-408,共4页
在事件序列的数据挖掘中,一个重要的步骤就是发现频繁情节.一旦发现频繁情节就能导出描述该序列行为的情节规则.基于逐级(level-wise)搜索算法WINEPI,提出了一种发现频繁情节的改进算法.该算法通过一个新的引理,帮助进一步确定下一级中...
在事件序列的数据挖掘中,一个重要的步骤就是发现频繁情节.一旦发现频繁情节就能导出描述该序列行为的情节规则.基于逐级(level-wise)搜索算法WINEPI,提出了一种发现频繁情节的改进算法.该算法通过一个新的引理,帮助进一步确定下一级中感兴趣的情节组合,从而获得了较高质量的候选集,缩短了执行时间.对实际数据和仿真数据的实验结果表明,本算法是有效的.
展开更多
关键词
数据挖掘
频繁情节
事件序列
搜索空间
候选集生成
下载PDF
职称材料
基于混合神经网络模型的企业行业分类
被引量:
1
4
作者
陈钢
《电子设计工程》
2022年第24期64-69,共6页
针对人工行业分类效率低下、准确性不高等问题,提出一种基于混合神经网络的行业分类模型。该分类模型采用RoBERTa预训练语言模型对企业经营范围文本特征进行提取,构建基于GRU的候选集生成网络生成行业类别候选集,通过外部知识嵌入补充...
针对人工行业分类效率低下、准确性不高等问题,提出一种基于混合神经网络的行业分类模型。该分类模型采用RoBERTa预训练语言模型对企业经营范围文本特征进行提取,构建基于GRU的候选集生成网络生成行业类别候选集,通过外部知识嵌入补充额外信息,并将外部知识特征与经营范围特征进行融合,完成企业行业分类。通过在所构建的企业数据集上进行验证可知,其准确率达到83.78%,实验结果证明了该模型可以获得更加丰富的特征,相比其他方法取得了更好的行业分类效果。
展开更多
关键词
行业分类
混合神经网络
外部知识
候选集生成
跳层连接
下载PDF
职称材料
基于XLNet-BiGRU-Attention的行业分类方法
5
作者
陈钢
佘祥荣
陈健鹏
《计算机技术与发展》
2022年第7期39-45,共7页
企业所属行业对于国民经济统计、市场监督管理等领域具有重要作用。在现如今庞大的行业规模下,人工进行企业行业分类不但效率低下,而且可靠性不高。在行业划分规范中,企业所属行业由企业的经营范围描述而得。针对传统词向量加机器学习...
企业所属行业对于国民经济统计、市场监督管理等领域具有重要作用。在现如今庞大的行业规模下,人工进行企业行业分类不但效率低下,而且可靠性不高。在行业划分规范中,企业所属行业由企业的经营范围描述而得。针对传统词向量加机器学习的方法难以有效融合企业经营范围上下文语义信息等问题,提出了一种XLNet-BiGRU-Attention的行业分类方法。该方法首先通过XLNet网络从企业经营范围文本中获取具有上下文特征信息的语义表征向量,其次构建基于双向门限循环神经网络和注意力机制的候选集生成网络来进一步提取企业经营范围上下文相关特征,再次通过构建键值对嵌入网络来进一步挖掘企业其他标签对于行业分类的提升效果,最后将融合后的特征向量输入到分类器完成企业行业分类。相较于其他基线分类方法,该方法能够取得更好的行业分类效果。消融实验结果表明:该方法所构建的候选集生成网络和键值对嵌入网络能够提升行业分类的性能。
展开更多
关键词
行业分类
XLNet
双向GRU
注意力机制
候选集生成
键值对
下载PDF
职称材料
题名
面向中文临床术语标准化的ESim-SimCSE融合算法
1
作者
曹天甲
程龙龙
李世锋
曹琉
崔丙剑
倪广健
机构
天津大学医学工程与转化医学研究院
中电云脑(天津)科技有限公司
医学期刊知识挖掘与服务重点实验室
脑机交互与人机共融海河实验室
出处
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2024年第7期751-758,共8页
基金
国家重点研发计划资助项目(2022YFF1202400)
天津市自然科学基金资助项目(20JCZDJC00810).
文摘
临床术语的不规范性和多样性给临床数据的应用带来了困难和挑战,因此临床术语标准化工作成为一个重要的研究方向.传统机器学习标准化算法无法结合上下文捕获到隐藏的深层语义,随着计算机算力性能的大幅提升及神经网络被广泛应用于医疗信息处理领域,深度学习可以克服传统机器学习方法的缺点,被应用于临床术语标准化工作中.本文基于深度学习神经网络提出一种基于无监督与有监督学习融合的候选集生成方法,把候选集生成问题转换为文本相似度计算问题,运用对比学习,结合无监督学习场景ESimCSE-unsup模型和有监督学习场景SimCSE-sup模型,通过迁移学习将ESimCSE-unsup与SimCSE-sup融合形成ESim-SimCSE模型.选取SimCSEsup、SimCSE-unsup和ESimCSE-unsup 3种模型与ESim-SimCSE进行对比.实验结果显示,在CHIP-CDN2019数据集上相同召回范围下,ESim-SimCSE模型均优于其他模型,其中top k=20下,ESim-SimCSE模型计算F1得分为0.8891,比SimCSE-unsup提高了0.0459,比ESimCSE-unsup提高了0.0175,比SimCSE-sup提高了0.0107.
关键词
临床术语标准化
候选集生成
ESim-SimCSE
SimCSE
ESimCSE
对比学习
Keywords
clinical diagnosis normalization
candidate set generation
ESim-SimCSE
SimCSE
ESimCSE
contrastive learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
序列模式挖掘算法研究
被引量:
13
2
作者
夏明波
王晓川
孙永强
金士尧
机构
国防科学技术大学计算机学院并行与分布式国家重点实验室
国防科学技术大学计算机学院
出处
《计算机技术与发展》
2006年第4期4-6,10,共4页
文摘
数据挖掘领域一个活跃的研究分支就是序列模式的发现,即在序列数据库中找出所有的频繁子序列。目前的序列模式挖掘方法主要分为两类,一类是候选集生成-测试方法;另一类是模式扩展方法。先介绍序列模式挖掘中的基本概念,然后描述几个重要算法,最后给出性能分析。
关键词
序列模式挖掘
候选集生成
-测试
模式扩展
算法分析
Keywords
sequential pattern mining
candidate generation - and test
pattern - growth
algorithm analysis
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
发现频繁情节的改进算法
被引量:
1
3
作者
邓勇
施文康
机构
上海交通大学电子信息与电气工程学院
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005年第3期405-408,共4页
基金
国家自然科学基金资助项目(30400067)
上海市自然基金资助项目(03ZR14065)
文摘
在事件序列的数据挖掘中,一个重要的步骤就是发现频繁情节.一旦发现频繁情节就能导出描述该序列行为的情节规则.基于逐级(level-wise)搜索算法WINEPI,提出了一种发现频繁情节的改进算法.该算法通过一个新的引理,帮助进一步确定下一级中感兴趣的情节组合,从而获得了较高质量的候选集,缩短了执行时间.对实际数据和仿真数据的实验结果表明,本算法是有效的.
关键词
数据挖掘
频繁情节
事件序列
搜索空间
候选集生成
Keywords
data mining
frequent episodes
event sequence
search space
candidate generation
分类号
TP212.9 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于混合神经网络模型的企业行业分类
被引量:
1
4
作者
陈钢
机构
长三角信息智能创新研究院
出处
《电子设计工程》
2022年第24期64-69,共6页
基金
2021年安徽省重点研究与开发计划(202104a05020071)
2022年芜湖市科技计划重点研发项目(2022yf17)。
文摘
针对人工行业分类效率低下、准确性不高等问题,提出一种基于混合神经网络的行业分类模型。该分类模型采用RoBERTa预训练语言模型对企业经营范围文本特征进行提取,构建基于GRU的候选集生成网络生成行业类别候选集,通过外部知识嵌入补充额外信息,并将外部知识特征与经营范围特征进行融合,完成企业行业分类。通过在所构建的企业数据集上进行验证可知,其准确率达到83.78%,实验结果证明了该模型可以获得更加丰富的特征,相比其他方法取得了更好的行业分类效果。
关键词
行业分类
混合神经网络
外部知识
候选集生成
跳层连接
Keywords
industry classification
hybrid neural network
external knowledge
candidate set generation
shortcut connection
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于XLNet-BiGRU-Attention的行业分类方法
5
作者
陈钢
佘祥荣
陈健鹏
机构
长三角信息智能创新研究院
出处
《计算机技术与发展》
2022年第7期39-45,共7页
基金
2021年安徽省重点研究与开发计划(202104a05020071)
2020年芜湖市科技计划项目(2020yf41)。
文摘
企业所属行业对于国民经济统计、市场监督管理等领域具有重要作用。在现如今庞大的行业规模下,人工进行企业行业分类不但效率低下,而且可靠性不高。在行业划分规范中,企业所属行业由企业的经营范围描述而得。针对传统词向量加机器学习的方法难以有效融合企业经营范围上下文语义信息等问题,提出了一种XLNet-BiGRU-Attention的行业分类方法。该方法首先通过XLNet网络从企业经营范围文本中获取具有上下文特征信息的语义表征向量,其次构建基于双向门限循环神经网络和注意力机制的候选集生成网络来进一步提取企业经营范围上下文相关特征,再次通过构建键值对嵌入网络来进一步挖掘企业其他标签对于行业分类的提升效果,最后将融合后的特征向量输入到分类器完成企业行业分类。相较于其他基线分类方法,该方法能够取得更好的行业分类效果。消融实验结果表明:该方法所构建的候选集生成网络和键值对嵌入网络能够提升行业分类的性能。
关键词
行业分类
XLNet
双向GRU
注意力机制
候选集生成
键值对
Keywords
industry classification
XLNet
bidirectional gating recurrent unit
attention mechanism
candidate set generation
key-value pair
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向中文临床术语标准化的ESim-SimCSE融合算法
曹天甲
程龙龙
李世锋
曹琉
崔丙剑
倪广健
《天津大学学报(自然科学与工程技术版)》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
序列模式挖掘算法研究
夏明波
王晓川
孙永强
金士尧
《计算机技术与发展》
2006
13
下载PDF
职称材料
3
发现频繁情节的改进算法
邓勇
施文康
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2005
1
下载PDF
职称材料
4
基于混合神经网络模型的企业行业分类
陈钢
《电子设计工程》
2022
1
下载PDF
职称材料
5
基于XLNet-BiGRU-Attention的行业分类方法
陈钢
佘祥荣
陈健鹏
《计算机技术与发展》
2022
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部