-
题名基于BERT-CRF模型的电子病历实体识别研究
被引量:7
- 1
-
-
作者
何涛
陈剑
闻英友
-
机构
东北大学东软研究院
辽宁省工业控制安全工程技术研究中心
-
出处
《计算机与数字工程》
2022年第3期639-643,共5页
-
基金
国家重点研发计划(编号:2018YFC0830601)
辽宁省重点研发计划(编号:2019JH2/10100027)
+1 种基金
教育部基本科研业务费项目(编号:N171802001)
辽宁省“兴辽英才计划”项目(编号:XLYC1802100)资助。
-
文摘
电子病历实体识别是智慧医疗服务中一项重要的基础任务,当前医院诊疗过程中采用人工分析病历文本的方法,容易产生关键信息遗漏且效率低下。为此,提出一种结合BERT与条件随机场的实体识别模型,使用基于双向训练Transformer的BERT中文预训练模型,在手工标注的符合BIOES标准的语料库上微调模型参数,通过BERT模型学习字符序列的状态特征,并将得到的序列状态分数输入到条件随机场层,条件随机场层对序列状态转移做出约束优化。BERT模型具有巨大的参数量、强大的特征提取能力和实体的多维语义表征等优势,可有效提升实体抽取的效果。实验结果表明,论文提出的模型能实现88%以上的实体识别F1分数,显著优于传统的循环神经网络和卷积神经网络模型。
-
关键词
深度学习
BERT
条件随机场
命名实体识别
电子病历
-
Keywords
deep learning
BERT
conditional random field
named entity recognition
electronic medical records
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名国内外“区块链+”会计研究的可视化分析
被引量:6
- 2
-
-
作者
王妮
王鹏
-
机构
东北大学东软研究院
辽宁大学商学院
-
出处
《财会月刊》
北大核心
2023年第4期69-78,共10页
-
基金
国家自然科学基金项目(项目编号:71901153)
国家社会科学基金项目(项目编号:22BGL055)
辽宁省社会科学基金项目(项目编号:L21BGL024)。
-
文摘
区块链对会计理论与会计实践影响重大,现有研究缺乏定量综述指导。以2015~2021年国内外已有“区块链+”会计文献为数据源,借助CiteSpace软件来探索“区块链+”会计的研究现状,挖掘其研究热点,梳理其演化路径,分析其研究走向。研究发现:国内外研究起步较晚,但研究态势喜人,国外研究独著现象明显,国内研究合作网络丰富深远;国外研究聚焦区块链与其他数字技术融合赋能会计信息系统的技术层面,而国内研究侧重于区块链赋能财务共享、业财融合等应用层面;国外关注“区块链+”会计引发的安全、隐私和效率问题以及组织吸收能力等管理层面,而国内关注区块链在财务监督和会计信息质量等方面的模式构建层面。本文在文献计量的基础上,从研究对象、研究思想和研究方法等方面提出“区块链+”会计的研究方向,以期为后续研究提供参考。
-
关键词
区块链
会计
CITESPACE
文献计量
聚类分析
-
分类号
F230
[经济管理—会计学]
-
-
题名一种面向未知环境的无人机群区域覆盖搜索算法研究
被引量:1
- 3
-
-
作者
刘建生
徐赛
王晨
何涛
李志
闻英友
-
机构
辽宁省网络空间安全专业技术创新中心
东北大学东软研究院
-
出处
《软件》
2023年第1期57-61,70,共6页
-
基金
国家自然科学基金委员会—辽宁联合基金重点支持项目(U1808206)资助。
-
文摘
近年来,随着无人机技术的飞速发展,旋翼无人机由于具有灵活机动、轻量化、成本低等优点在搜救领域得到了广泛应用。本文面向未知环境研究无人机群执行区域覆盖搜索任务,以任务耗时最短为算法评价指标,提出了回字形扩展搜索算法。首先对传统区域覆盖搜索算法和本文所提出的算法进行了介绍,之后针对算法建立了仿真环境模型和算法模型,并基于NetLogo仿真环境通过蒙特卡罗方法进行了试验及结果分析。与传统随机游走覆盖搜索算法进行对比,结果显示本文提出的基于搜索图的协同模式下的回字形扩展覆盖搜索算法区域覆盖耗时短、重叠率低,具有分布式、自主性、在线实时规划、抗毁性等特点。
-
关键词
区域覆盖
未知环境
回字形扩展搜索算法
无人机群
搜索图
分布式
-
Keywords
regional coverage
unknown environment
backtracking extended search algorithm
UAV group
search graph
distributed
-
分类号
TP13
[自动化与计算机技术—控制理论与控制工程]
V19
[航空宇航科学与技术—人机与环境工程]
-
-
题名基于深度残差收缩网络的HEp-2图像识别
被引量:6
- 4
-
-
作者
何涛
陈剑
闻英友
-
机构
东北大学东软研究院
-
出处
《计算机与现代化》
2021年第1期38-42,共5页
-
基金
国家重点研发计划项目(2018YFC0830601)
辽宁省重点研发计划项目(2019JH2/10100027)
+1 种基金
教育部基本科研业务费项目(N171802001)
辽宁省“兴辽英才计划”项目(XLYC1802100)。
-
文摘
人上皮细胞(HEp-2)检测抗核抗体是诊断自身免疫性疾病的常用方法,HEp-2细胞图像识别对许多自身免疫性疾病的诊疗具有重要意义。针对目前主要采用手工评估方法造成效率低效、劳动强度高等问题,提出一种基于深度残差收缩网络的HEp-2细胞图像分类模型。该模型在深度残差网络基础上进行改进,残差学习模块使用恒等映射方法可以训练更深层次的网络。在每个残差学习模块内部嵌入一个软阈值非线性变换子网络,软阈值用以消除数据中的噪声和冗余信息,这些阈值通过子网络自动学习。实验表明,该方法具有良好的性能,优于其他深度神经网络方法。
-
关键词
深度残差收缩网络
软阈值
卷积神经网络
图像识别
-
Keywords
deep residual shrinkage network
soft threshold
convolutional neural network
image recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于堆叠模型的司法短文本多标签分类
被引量:3
- 5
-
-
作者
何涛
陈剑
闻英友
孔为民
-
机构
东北大学东软研究院
定陶区人民检察院
-
出处
《计算机技术与发展》
2021年第3期27-32,共6页
-
基金
国家重点研发计划(2018YFC0830601)
辽宁省重点研发计划(2019JH2/10100027)
+1 种基金
教育部基本科研业务费项目(N171802001)
辽宁省“兴辽英才计划”项目(XLYC1802100)。
-
文摘
司法文书短文本的语义多样性和特征稀疏性等特点,对短文本多标签分类精度提出了很大的挑战,传统单一模型的分类算法已无法满足业务需求。为此,提出一种融合深度学习与堆叠模型的多标签分类方法。该方法将分类器划分成两个层次,第一层使用BERT、卷积神经网络、门限循环单元等深度学习方法作为基础分类器,每个基础分类器模型通过K折交叉验证得到所有数据的多标签分类概率值,将此概率值数据进行融合形成元数据;第二层使用自定义的深度神经网络作为混合器,以第一层的元数据为输入,通过训练多标签概率矩阵获取模型参数。该方法将强分类器关联在一起,获得比单个分类器更加强大的性能。实验结果表明,深度学习堆叠模型实现了87%左右的短文本分类F1分数,优于BERT、卷积神经网络、循环神经网络及其他单个模型的性能。
-
关键词
堆叠模型
BERT
卷积神经网络
门限循环单元
多标签分类
-
Keywords
stacking model
bidirectional encoder representations from transformers
convolutional neural network
gated recurrent unit
multi-label classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于稀疏预处理和XGBoost的生化检验智能审核
被引量:1
- 6
-
-
作者
何涛
陈剑
-
机构
东北大学东软研究院
辽宁省工业控制安全工程技术研究中心
-
出处
《计算机与数字工程》
2022年第4期796-800,共5页
-
基金
国家重点研发计划(编号:2018YFC0830601)
辽宁省重点研发计划(编号:2019JH2/10100027)
+1 种基金
教育部基本科研业务费项目(编号:N171802001)
辽宁省“兴辽英才计划”项目(编号:XLYC1802100)资助。
-
文摘
临床生化检验数据为医生进行疾病诊断提供最有力的数据支撑,当前采用基于规则的半自动异常检验值过滤和医务人员人工审核的方式,存在缺乏学习能力、效率低下的问题。为此,提出一种将检测数据进行稀疏化处理并使用极端梯度提升算法进行智能审核的机器学习模型。首先使用深度神经网络对医院信息系统导出的,经过脱敏、清洗后的检验数据用聚类算法实现样本的平衡采样,再用深度神经网络进行缺失值填充,并将选定的数据预处理成稀疏矩阵,最终使用极端梯度提升算法完成生化检验数据的智能审核。实验结果表明,论文采用的模型能实现95%左右的智能审核准确率,同时运算性能显著优于其他机器学习模型。
-
关键词
深度神经网络
稀疏数据
聚类算法
极端梯度提升
-
Keywords
deep neural network
sparse data
clustering algorithm
extreme gradient boost
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于模板张量分解和双向LSTM的司法案件罪名认定
被引量:2
- 7
-
-
作者
李大鹏
陈剑
王晨
闻英友
赵大哲
-
机构
东北大学计算机科学与工程学院
东北大学东软研究院
辽宁省工业控制安全技术工程中心
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2021年第4期760-767,共8页
-
基金
国家自然科学基金(No.61972079,No.61772126)
国家重点研发计划(No.2018YFC0830601)
+2 种基金
教育部基本科研业务费(No.171802001,No.2016002,No.2016004)
辽宁省重点研发计划(No.2019JH2/10100027)
辽宁省“兴辽英才”计划项目(No.XLYC1802100)。
-
文摘
案件罪名认定是司法业务的重要环节,尚缺乏有效的智能辅助工具和手段.针对案件定罪的难点问题,提出一种结合张量分解和双向LSTM(Long Short-Term Memory)神经网络的案件定罪方法.该方法将案件数据表示为张量,并在张量分解过程中引入模板张量.模板张量可以在双向LSTM神经网络分类模型的训练过程不断的被优化,使得分解后的核心张量包含更加有效的张量结构和特征信息,有助于提高后续分类模型的准确性,实现案件罪名的精准认定.实验结果表明:所提出的基于张量分解和双向LSTM的司法案件定罪方法比现有方法具有更好的准确性.
-
关键词
张量分解
双向长短期记忆
模板张量
案件定罪
文本分类
-
Keywords
tensor decomposition
Bi-LSTM
template tensor
conviction in judicial cases
text classification
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于区块链的充电桩并表计费管理系统
被引量:2
- 8
-
-
作者
王晨
李雪晶
闻英友
孙锦山
-
机构
东北大学东软研究院
东软集团股份有限公司研究院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第8期1769-1775,共7页
-
基金
国家自然科学基金重点项目(U1808206)资助
国家重点研发计划项目(2018YFC0830600)资助
辽宁省科技重大专项项目(2020020298-JH1/101)资助.
-
文摘
针对新能源汽车充电桩在安全、计费、运营等方面的不足,设计了一种基于区块链的充电桩并表计费管理系统.该系统基于区块链技术实现安全认证,并设计智能合约将电动车用电数据与家用电表绑定,按月生成总用电量清单,根据电网运营商的计费策略及支付通道完成费用支付.测试结果表明,该系统能够在保证安全的同时,使新能源汽车充电像手机充电般即插即充,充完即走,为充电桩的建设与发展提供了一种安全、高效的运营新模式.
-
关键词
区块链
充电桩
并表计费
智能合约
-
Keywords
blockchain
charging pile
consolidated billing
smart contract
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-