期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
DeepOCSR:一种用于光学化学结构识别的深度编码-解码网络
1
作者 杨赵朋 李建华 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第1期135-143,共9页
从科学出版物中识别光学化学结构是重新发现化学结构性质的重要组成部分,对于药物研发和天然产物研究方面具有重要意义。现有的光学化学结构识别方法存在识别率较低等问题,为了有效地提高光学化学结构识别任务的识别性能,本文提出了一... 从科学出版物中识别光学化学结构是重新发现化学结构性质的重要组成部分,对于药物研发和天然产物研究方面具有重要意义。现有的光学化学结构识别方法存在识别率较低等问题,为了有效地提高光学化学结构识别任务的识别性能,本文提出了一种用于光学化学结构识别的深度学习方法(DeepOCSR)。该方法基于编码器-解码器架构,引入了Transformer和ResNeSt模型,将出版物中的化学结构图像转换为SMILES序列。构建了两种新的化学结构数据集,其中一个包含了化学文献中常见的取代基。将本文方法与现有的其他方法进行对比实验,结果表明本文方法在相似度和有效性等关键指标上均优于对比方法。 展开更多
关键词 深度学习 化学结构识别 编码器-解码器 SMILES 取代基
下载PDF
基于深度学习的化学结构识别研究 被引量:1
2
作者 蚁佳才 张小琛 刘丹 《中南药学》 CAS 2022年第2期247-253,共7页
目的通过深度学习方法,研究如何对科学文献中的化学结构进行有效识别以达到药物重新发现的目的。方法提出一个针对化学结构识别的编码器-解码器模型。该模型通过分子指纹预训练学习分子的结构和性质信息,并将其融合到下游任务。此外,模... 目的通过深度学习方法,研究如何对科学文献中的化学结构进行有效识别以达到药物重新发现的目的。方法提出一个针对化学结构识别的编码器-解码器模型。该模型通过分子指纹预训练学习分子的结构和性质信息,并将其融合到下游任务。此外,模型还融合了注意力机制,在提升模型特征提取能力的同时,增强了模型的可解释性。结果在两个基准测试集上进行测试,本模型相比其他方法取得了具有竞争力的效果,并且提供了有效的可解释结果。结论本研究提出的基于预训练和注意力机制的深度学习模型,显著提高了化学结构识别的准确率,为药物研发提供了加速引擎。 展开更多
关键词 药物重新发现 分子指纹 深度学习 化学结构识别
下载PDF
结合注意力机制和编码器—解码器架构的化学结构识别方法
3
作者 曾水玲 李昭贤 +2 位作者 张嘉雄 丁龙飞 赵才荣 《中国图象图形学报》 CSCD 北大核心 2024年第7期1960-1969,共10页
目的 化学结构识别是化学和计算机视觉领域的一个重要问题,传统光学化学结构识别技术在复杂化学结构识别任务中易发生信息丢失或误识别的现象,同时又因为化学物质的结构多样性常导致其无法解析,识别效果不佳。而基于深度学习的模型通常... 目的 化学结构识别是化学和计算机视觉领域的一个重要问题,传统光学化学结构识别技术在复杂化学结构识别任务中易发生信息丢失或误识别的现象,同时又因为化学物质的结构多样性常导致其无法解析,识别效果不佳。而基于深度学习的模型通常具有网络结构复杂度高、上下文信息易丢失和识别率低的问题。为此,提出一种结合注意力机制和编码器—解码器架构的化学结构识别方法。方法 首先,使用改进的ResNet50(residual network)作为特征提取器抓取表征信息;其次,使用BLSTM(bi-directional long-short term memory)作为行编码器为ResNet50提取的表征信息加强空间信息;最后,使用去填充模块和基于覆盖注意力机制的LSTM(long short-term memory)网络作为模型解码器,对化学结构图像进行解码,将编码结果解码为SMILES(simplified molecular input line entry system)序列。结果 在Indigo、ChemDraw、CLEF(Conference and Labs of the Evaluation Forum)、JPO(Japanese Patent Office)、UOB(University of Birmingham)、USPTO(United States Patent and Trademark Office)、Staker、ACS(American Chemistry Society)、CASIA-CSDB(Institute of Automation of Chinese Academy of Sciences—Chemical Structure Database)和Mini CASIA-CSDB数据集上,所提方法识别准确率分别为71.1%、70.21%、45.8%、30.3%、53.02%、58.21%、43.39%、46.3%、84.42%和85.78%,高于SwimOCSR、Image2Mol和ChemPix模型得分。结论 与其他模型相比,本文方法通过少量训练集能够获得较高的识别准确率。 展开更多
关键词 化学结构识别 编码器—解码器 注意力机制 残差网络 SMILES(simplified molecular input line entry system)
原文传递
基于双路注意力机制的化学结构图像识别 被引量:4
4
作者 季秀怡 李建华 《计算机工程》 CAS CSCD 北大核心 2020年第9期213-220,共8页
基于传统图像处理技术与流水线方式的化学结构图像识别方法通常依赖于人工设计的特征,导致识别准确率较低。针对该问题,提出一种基于空间注意力机制与通道注意力机制的化学结构图像识别方法。将化学结构识别视为序列生成任务,采用卷积... 基于传统图像处理技术与流水线方式的化学结构图像识别方法通常依赖于人工设计的特征,导致识别准确率较低。针对该问题,提出一种基于空间注意力机制与通道注意力机制的化学结构图像识别方法。将化学结构识别视为序列生成任务,采用卷积神经网络(CNN)与长短期记忆(LSTM)网络相结合的深度神经网络模型实现化学结构图像到SMILES序列的转换。该深度神经网络模型由编码和解码两部分组成,编码部分使用CNN提取化学结构图像特征,解码部分融合双路注意力机制与LSTM网络生成SMILES序列。实验结果表明,该方法在Beam Size为3的情况下,识别准确率和BLEU-4值分别为81.63%和0.937,明显优于无注意力机制和单注意力机制的化学结构图像识别方法。 展开更多
关键词 化学结构图像识别 卷积神经网络 长短期记忆网络 双路注意力机制 序列生成
下载PDF
面向化学结构的线段聚类算法
5
作者 朱哲清 耿海军 钱宇华 《计算机科学》 CSCD 北大核心 2022年第5期113-119,共7页
化学键识别是化学结构识别任务的重要组成部分。化学键中的单键、双键和三键都是由线段组成的,采用霍夫变换进行线段检测时容易产生冗余数据和干扰数据。为此,提出了一种面向化学键的线段聚类算法,对霍夫变换检出的线段进行聚类,进而合... 化学键识别是化学结构识别任务的重要组成部分。化学键中的单键、双键和三键都是由线段组成的,采用霍夫变换进行线段检测时容易产生冗余数据和干扰数据。为此,提出了一种面向化学键的线段聚类算法,对霍夫变换检出的线段进行聚类,进而合并冗余线段。具体而言,基于线段间空间关系的分析,定义线段间的相对相似性与间隔相似性度量;利用这两种度量,进行基于线段合并的聚类方法。实验结果表明,所提出的相似性度量可以全面地刻画线段间的相似关系;该算法能获得较好的聚类结果,同时能够准确复原化学键组成线段的真实位置,是一种有效的化学结构图像预处理方法。 展开更多
关键词 化学结构识别 HOUGH变换 化学 线段聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部