随着互联网信息的发展,如何有效地表示不同语言所含的信息已成为自然语言处理(Natural Language Processing,NLP)领域的一项重要任务.然而,很多传统的机器学习模型依赖在高资源语言中进行训练,无法迁移到低资源语言中使用.为了解决这一...随着互联网信息的发展,如何有效地表示不同语言所含的信息已成为自然语言处理(Natural Language Processing,NLP)领域的一项重要任务.然而,很多传统的机器学习模型依赖在高资源语言中进行训练,无法迁移到低资源语言中使用.为了解决这一问题,结合迁移学习和深度学习模型,提出一种多语言双向编码器表征量(Multi-lingual Bidirectional Encoder Representations from Transformers,M-BERT)的迁移学习方法.该方法利用M-BERT作为特征提取器,在源语言领域和目标语言领域之间进行特征转换,减小不同语言领域之间的差异,从而提高目标任务在不同领域之间的泛化能力.首先,在构建BERT模型的基础上,通过数据收集处理、训练设置、参数估计和模型训练等预训练操作完成M-BERT模型的构建,并在目标任务上进行微调.然后,利用迁移学习实现M-BERT模型在跨语言文本分析方面的应用.最后,在从英语到法语和德语的跨语言迁移实验中,证明了本文模型具有较高的性能质量和较小的计算量,并在联合训练方案中达到了96.2%的准确率.研究结果表明,该文模型实现了跨语言数据迁移,且验证了其在跨语言NLP领域的有效性和创新性.展开更多
背景与目的囊腔型肺癌作为一种特殊类型的肺癌逐步得到人们的关注,其最常见的病理类型为腺癌。囊腔型肺腺癌的浸润性对诊疗方案的选择和预后至关重要。本研究旨在分析囊腔型肺腺癌临床多特征,探讨其浸润性的独立危险因素并建立风险预测...背景与目的囊腔型肺癌作为一种特殊类型的肺癌逐步得到人们的关注,其最常见的病理类型为腺癌。囊腔型肺腺癌的浸润性对诊疗方案的选择和预后至关重要。本研究旨在分析囊腔型肺腺癌临床多特征,探讨其浸润性的独立危险因素并建立风险预测模型。方法回顾性分析2021年1月至2022年7月于南京医科大学第一附属医院胸外科行手术治疗的129例囊腔型肺腺癌患者,根据病理结果分成浸润前组:非典型腺瘤样增生(atypical adenomatous hyperplasia,AAH)、原位腺癌(adenocarcinoma in situ,AIS)、微浸润型腺癌(minimally invasive adenocarcinoma,MIA)与浸润组:浸润性腺癌(invasive adenocarcinoma,IAC)。其中浸润前组47例,男性19例,女性28例,平均年龄(51.23±14.96)岁;浸润组82例,男性60例,女性22例,平均年龄(61.27±11.74)岁。收集两组病例多组临床特征,采用单因素分析、LASSO回归、多因素Logistic回归分析得出囊腔型肺腺癌浸润性的独立危险因素,建立浸润性风险预测模型。结果单因素分析显示年龄、性别、吸烟史、肺气肿、神经元特异性烯醇化酶(neuron-specific enolase,NSE)、囊腔数、病灶直径、囊腔直径、结节直径、实性成分直径、囊壁结节、囊壁光滑程度、囊腔形状、分叶征、短毛刺征、胸膜牵拉、血管穿行与支气管穿行在囊腔型肺腺癌浸润前组与浸润组间存在统计学差异(P<0.05)。上述变量经LASSO回归降维处理,进一步筛选出的变量包括:年龄、性别、吸烟史、NSE、囊腔数、病灶直径、囊腔直径、囊壁结节、囊壁光滑程度与分叶征,并纳入多因素Logistic回归分析,发现囊壁结节(P=0.035)与分叶征(P=0.001)是囊腔型肺腺癌浸润性的独立危险因素(P<0.05)。建立预测模型如下:P=e^x/(1+e^x),x=-7.927+1.476*囊壁结节+2.407*分叶征,曲线下面积(area under the curve,AUC)为0.950。结论囊壁结节及分叶征为囊腔型肺腺癌浸润性的独立危险因素,对囊腔型肺腺癌的浸润性预测具有一定的指导意义。展开更多
针对并网风电场中,经典一次调频控制方法存在抗干扰能力弱、机组易脱网的问题,提出一种基于滑模变结构的风电机组一次调频控制算法。首先,在永磁同步风电机组工作原理的基础上,建立含有大电网的风电机组模型。其次,为了解决传统比例积...针对并网风电场中,经典一次调频控制方法存在抗干扰能力弱、机组易脱网的问题,提出一种基于滑模变结构的风电机组一次调频控制算法。首先,在永磁同步风电机组工作原理的基础上,建立含有大电网的风电机组模型。其次,为了解决传统比例积分微分(proportional integral differential,PID)控制下抗干扰能力弱的问题、引入经典滑模变结构控制器。然后,针对经典滑模变结构控制器导致执行机构存在抖振较多的缺点,提出一种基于sigmoid函数趋近率的滑模变结构一次调频控制算法。最后,通过MATLAB/Simulink对风电机组一次调频进行建模仿真,并与经典控制算法相比,验证了所提算法的可行性,在风速波动和电网故障的环境下,滑模变结构一次调频控制算法更具有效性。展开更多
文摘随着互联网信息的发展,如何有效地表示不同语言所含的信息已成为自然语言处理(Natural Language Processing,NLP)领域的一项重要任务.然而,很多传统的机器学习模型依赖在高资源语言中进行训练,无法迁移到低资源语言中使用.为了解决这一问题,结合迁移学习和深度学习模型,提出一种多语言双向编码器表征量(Multi-lingual Bidirectional Encoder Representations from Transformers,M-BERT)的迁移学习方法.该方法利用M-BERT作为特征提取器,在源语言领域和目标语言领域之间进行特征转换,减小不同语言领域之间的差异,从而提高目标任务在不同领域之间的泛化能力.首先,在构建BERT模型的基础上,通过数据收集处理、训练设置、参数估计和模型训练等预训练操作完成M-BERT模型的构建,并在目标任务上进行微调.然后,利用迁移学习实现M-BERT模型在跨语言文本分析方面的应用.最后,在从英语到法语和德语的跨语言迁移实验中,证明了本文模型具有较高的性能质量和较小的计算量,并在联合训练方案中达到了96.2%的准确率.研究结果表明,该文模型实现了跨语言数据迁移,且验证了其在跨语言NLP领域的有效性和创新性.
文摘背景与目的囊腔型肺癌作为一种特殊类型的肺癌逐步得到人们的关注,其最常见的病理类型为腺癌。囊腔型肺腺癌的浸润性对诊疗方案的选择和预后至关重要。本研究旨在分析囊腔型肺腺癌临床多特征,探讨其浸润性的独立危险因素并建立风险预测模型。方法回顾性分析2021年1月至2022年7月于南京医科大学第一附属医院胸外科行手术治疗的129例囊腔型肺腺癌患者,根据病理结果分成浸润前组:非典型腺瘤样增生(atypical adenomatous hyperplasia,AAH)、原位腺癌(adenocarcinoma in situ,AIS)、微浸润型腺癌(minimally invasive adenocarcinoma,MIA)与浸润组:浸润性腺癌(invasive adenocarcinoma,IAC)。其中浸润前组47例,男性19例,女性28例,平均年龄(51.23±14.96)岁;浸润组82例,男性60例,女性22例,平均年龄(61.27±11.74)岁。收集两组病例多组临床特征,采用单因素分析、LASSO回归、多因素Logistic回归分析得出囊腔型肺腺癌浸润性的独立危险因素,建立浸润性风险预测模型。结果单因素分析显示年龄、性别、吸烟史、肺气肿、神经元特异性烯醇化酶(neuron-specific enolase,NSE)、囊腔数、病灶直径、囊腔直径、结节直径、实性成分直径、囊壁结节、囊壁光滑程度、囊腔形状、分叶征、短毛刺征、胸膜牵拉、血管穿行与支气管穿行在囊腔型肺腺癌浸润前组与浸润组间存在统计学差异(P<0.05)。上述变量经LASSO回归降维处理,进一步筛选出的变量包括:年龄、性别、吸烟史、NSE、囊腔数、病灶直径、囊腔直径、囊壁结节、囊壁光滑程度与分叶征,并纳入多因素Logistic回归分析,发现囊壁结节(P=0.035)与分叶征(P=0.001)是囊腔型肺腺癌浸润性的独立危险因素(P<0.05)。建立预测模型如下:P=e^x/(1+e^x),x=-7.927+1.476*囊壁结节+2.407*分叶征,曲线下面积(area under the curve,AUC)为0.950。结论囊壁结节及分叶征为囊腔型肺腺癌浸润性的独立危险因素,对囊腔型肺腺癌的浸润性预测具有一定的指导意义。
文摘针对并网风电场中,经典一次调频控制方法存在抗干扰能力弱、机组易脱网的问题,提出一种基于滑模变结构的风电机组一次调频控制算法。首先,在永磁同步风电机组工作原理的基础上,建立含有大电网的风电机组模型。其次,为了解决传统比例积分微分(proportional integral differential,PID)控制下抗干扰能力弱的问题、引入经典滑模变结构控制器。然后,针对经典滑模变结构控制器导致执行机构存在抖振较多的缺点,提出一种基于sigmoid函数趋近率的滑模变结构一次调频控制算法。最后,通过MATLAB/Simulink对风电机组一次调频进行建模仿真,并与经典控制算法相比,验证了所提算法的可行性,在风速波动和电网故障的环境下,滑模变结构一次调频控制算法更具有效性。