题名 生物医学文献中的蛋白质关系抽取研究
被引量:6
1
作者
赵哲焕
杨志豪
孙聪
林鸿飞
机构
大连理工大学软件学院辽宁省泛在网络与服务重点实验室
大连理工大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2018年第7期82-90,共9页
基金
国家重点研发计划项目(2016YFC0901902)
国家自然科学基金(61572102
+3 种基金
61572098
61272373)
教育部跨世纪优秀人才培养计划(NCET-13-0084)
引进人才科研专题(DUT18RC(3)004)
文摘
蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值。但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,关系词,蛋白质2"),但是召回率较低。针对以上问题,该文提出了一种混合机器学习和规则方法的蛋白质关系抽取框架。该框架先利用机器学习方法完成命名实体识别和二元关系抽取,然后利用基于句法模板和词典匹配的方法抽取表示当前两个蛋白质间关系类型的关系词。该方法在AImed语料上取得了40.18%的F值,远高于基于规则的Stanford Open IE方法。
关键词
关系词抽取
蛋白质实体识别
蛋白质关系抽取
Keywords
relational words extraction
protein named entity recognition
protein-protein interaction extraction
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 人体大数据隐私保护实验平台设计
2
作者
徐博
林驰
赵哲焕
机构
大连理工大学软件学院
出处
《实验室科学》
2018年第6期237-239,共3页
基金
国家自然科学基金(项目编号:61502071
61572094
+2 种基金
61602079)
2018年辽宁省本科教改立项一般项目
大连理工大学引进人才科研专题(项目编号:No.DUT16RC(4)63)
文摘
归纳了现阶段人体传感器网络大数据隐私保护面临的挑战与不足,并通过开展面向人体传感器网络大数据关键技术研究来建立适用于人体传感器网络特殊需求的大数据系统架构,提高系统安全性和隐私性,同时详细介绍了人体大数据实验平台的构成和原理,描述了系统框架的设置和隐私保护方法。实验表明:该平台能够有效保护人体大数据安全隐私,具有较好的教学与科研价值。
关键词
人体大数据
人体传感器网络
隐私保护
Keywords
physical big data
body sensor networks
privacy protection
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
题名 在线评论的静态多模态情感分析
被引量:3
3
作者
王开心
徐秀娟
刘宇
赵哲焕
赵小薇
机构
大连理工大学软件学院
大连理工大学辽宁省泛在网络与服务软件重点实验室
出处
《应用科学学报》
CAS
CSCD
北大核心
2022年第1期25-35,共11页
基金
国家自然科学基金(No.61672128)资助
文摘
提出了一种基于Pre-LN Transformer的静态多模态情感分类模型。该模型首先利用Pre-LN Transformer结构中的编码器提取评论文本中的语义特征,其中编码器的多头自注意力机制允许模型在不同的子空间内学到相关情感信息。然后根据ResNet提取评论的图像特征,在特征水平融合的基础上通过视觉方面注意力机制来指导文本的情感分类,实现在线评论的静态多模态情感分析。最后在Yelp数据集上执行情感分类的实验结果表明:所提出的模型在准确率上相比于BiGRU-mVGG、Trans-mVGG模型分别提高了1.34%、1.10%,验证了该方法的有效性和可行性。
关键词
情感分析
静态多模态
在线评论
视觉方面注意力
Keywords
sentiment analysis
static multimodal
online reviews
visual aspect attention
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 跨模态多标签生物医学图像分类建模识别
被引量:12
4
作者
于玉海
林鸿飞
孟佳娜
郭海
赵哲焕
机构
大连理工大学计算机科学与技术学院
大连民族大学计算机科学与工程学院
出处
《中国图象图形学报》
CSCD
北大核心
2018年第6期917-927,共11页
基金
国家自然科学基金项目(61272373
61202254
+5 种基金
71303031)
辽宁省自然科学基金项目(201602195
DC201502030202)
中央高校自主科研基金项目(DC13010313
DC201502030202)
辽宁省博士科研启动基金项目(201601084)~~
文摘
目的生物医学文献中的图像经常是包含多种模式的复合图像,自动标注其类别,将有助于提高图像检索的性能,辅助医学研究或教学。方法融合图像内容和说明文本两种模态的信息,分别搭建基于深度卷积神经网络的多标签分类模型。视觉分类模型借用自然图像和单标签的生物医学简单图像,实现异质迁移学习和同质迁移学习,捕获通用领域的一般特征和生物医学领域的专有特征,而文本分类模型利用生物医学简单图像的说明文本,实现同质迁移学习。然后,采用分段式融合策略,结合两种模态模型输出的结果,识别多标签医学图像的相关模式。结果本文提出的跨模态多标签分类算法,在Image CLEF2016生物医学图像多标签分类任务数据集上展开实验。基于图像内容的混合迁移学习方法,比仅采用异质迁移学习的方法,具有更低的汉明损失和更高的宏平均F1值。文本分类模型引入同质迁移学习后,能够明显提高标签的分类性能。最后,融合两种模态的多标签分类模型,获得与评测任务最佳成绩相近的汉明损失,而宏平均F1值从0.320上升到0.488,提高了约52.5%。结论实验结果表明,跨模态生物医学图像多标签分类算法,融合图像内容和说明文本,引入同质和异质数据进行迁移学习,缓解生物医学图像领域标注数据规模小且标签分布不均衡的问题,能够更有效地识别复合医学图像中的模式信息,进而提高图像检索性能。
关键词
多标签分类
卷积神经网络
迁移学习
生物医学图像
深度学习
Keywords
multi-label learning
convolutional neural network
transfer learning
medical image
deep learning
分类号
TP391.6
[自动化与计算机技术—计算机应用技术]