目的 结合不同的文本向量化方法和分类模型,评估中英文对照的X线影像学报告在分类任务中的一致性。方法 提取Medical Information Mart for Intensive Care(MIMIC)数据集中的X线影像报告并翻译为中文,使用Doc2vec、词频-逆文档频率算法...目的 结合不同的文本向量化方法和分类模型,评估中英文对照的X线影像学报告在分类任务中的一致性。方法 提取Medical Information Mart for Intensive Care(MIMIC)数据集中的X线影像报告并翻译为中文,使用Doc2vec、词频-逆文档频率算法、双向编码器表示(Bidirectional Encoder Representation from Transformers,BERT)等方法对文本进行向量化,利用随机森林、卷积神经网络(Convolutional Neural Networks,CNN)、 TextCNN、Softmax等算法和模型完成分类任务。利用一致率和Kappa值对中英文对照的影像学报告的分类结果进行一致性评价。结果 在二分类任务下,中英文版本影像学报告分类一致率可以达到0.7~0.9,Kappa值为0.3~0.7,其中BERT-Softmax模型可以得到一致率为0.922,Kappa值为0.724;在三分类任务下,中英文版本的影像学报告分类一致率可以达到0.6~0.7,Kappa值可以达到0.3~0.4;在五分类任务下,BERTSoftmax得到中英文文本分类一致率为0.744,Kappa值为0.638。结论 X线影像报告的中英文版本在分类任务中具有较高的一致性,且一致性与文本向量化方法、分类模型性能及具体分类任务有关。展开更多
采用Gabriel合成法,由ω-氯甲基长叶烯(3)经中间体N-取代邻苯二甲酰亚胺衍生物(4)合成了目标化合物ω-氨甲基长叶烯(5)。化合物4和5的结构经高分辨质谱(HRMS)、傅里叶红外光谱(FT-IR)、核磁共振氢谱(1 H NMR)、核磁共振碳谱(13 C NMR)...采用Gabriel合成法,由ω-氯甲基长叶烯(3)经中间体N-取代邻苯二甲酰亚胺衍生物(4)合成了目标化合物ω-氨甲基长叶烯(5)。化合物4和5的结构经高分辨质谱(HRMS)、傅里叶红外光谱(FT-IR)、核磁共振氢谱(1 H NMR)、核磁共振碳谱(13 C NMR)和单晶X射线衍射(SC-XRD)进行表征确证,化合物5的绝对构型由合成的化合物4的晶体结构推断。在化合物4的水解反应中,采用添加氢氧化钠在无溶剂下加热回流肼解的方法,能提高化合物5的产率,简化分离提纯工艺。单因素试验结果表明:较佳的肼解反应工艺条件为n(水合肼)∶n(化合物4)=23∶1、10%氢氧化钠溶液5 g、反应温度120℃、反应时间6 h,此条件下化合物5的产率为94.1%,纯度为99.98%。体外抗菌活性测定结果表明:化合物5对4种细菌(金黄色葡萄球菌、枯草芽孢杆菌、大肠杆菌和肺炎克雷伯菌)和3种真菌(白色念珠菌、热带念珠菌和黑曲霉)的生长有明显的抑制作用,其最低抑制质量浓度(MIC)分别为1.95、1.95、7.81、3.91、3.91、1.95和15.63 mg/L。其中化合物5对白色念珠菌和热带念珠菌的抑制活性强于阳性对照酮康唑。展开更多
文摘目的 结合不同的文本向量化方法和分类模型,评估中英文对照的X线影像学报告在分类任务中的一致性。方法 提取Medical Information Mart for Intensive Care(MIMIC)数据集中的X线影像报告并翻译为中文,使用Doc2vec、词频-逆文档频率算法、双向编码器表示(Bidirectional Encoder Representation from Transformers,BERT)等方法对文本进行向量化,利用随机森林、卷积神经网络(Convolutional Neural Networks,CNN)、 TextCNN、Softmax等算法和模型完成分类任务。利用一致率和Kappa值对中英文对照的影像学报告的分类结果进行一致性评价。结果 在二分类任务下,中英文版本影像学报告分类一致率可以达到0.7~0.9,Kappa值为0.3~0.7,其中BERT-Softmax模型可以得到一致率为0.922,Kappa值为0.724;在三分类任务下,中英文版本的影像学报告分类一致率可以达到0.6~0.7,Kappa值可以达到0.3~0.4;在五分类任务下,BERTSoftmax得到中英文文本分类一致率为0.744,Kappa值为0.638。结论 X线影像报告的中英文版本在分类任务中具有较高的一致性,且一致性与文本向量化方法、分类模型性能及具体分类任务有关。
文摘采用Gabriel合成法,由ω-氯甲基长叶烯(3)经中间体N-取代邻苯二甲酰亚胺衍生物(4)合成了目标化合物ω-氨甲基长叶烯(5)。化合物4和5的结构经高分辨质谱(HRMS)、傅里叶红外光谱(FT-IR)、核磁共振氢谱(1 H NMR)、核磁共振碳谱(13 C NMR)和单晶X射线衍射(SC-XRD)进行表征确证,化合物5的绝对构型由合成的化合物4的晶体结构推断。在化合物4的水解反应中,采用添加氢氧化钠在无溶剂下加热回流肼解的方法,能提高化合物5的产率,简化分离提纯工艺。单因素试验结果表明:较佳的肼解反应工艺条件为n(水合肼)∶n(化合物4)=23∶1、10%氢氧化钠溶液5 g、反应温度120℃、反应时间6 h,此条件下化合物5的产率为94.1%,纯度为99.98%。体外抗菌活性测定结果表明:化合物5对4种细菌(金黄色葡萄球菌、枯草芽孢杆菌、大肠杆菌和肺炎克雷伯菌)和3种真菌(白色念珠菌、热带念珠菌和黑曲霉)的生长有明显的抑制作用,其最低抑制质量浓度(MIC)分别为1.95、1.95、7.81、3.91、3.91、1.95和15.63 mg/L。其中化合物5对白色念珠菌和热带念珠菌的抑制活性强于阳性对照酮康唑。