针对词向量语义信息不完整以及文本特征抽取时的一词多义问题,提出基于BERT(Bidirectional Encoder Representation from Transformer)的两次注意力加权算法(TARE)。首先,在词向量编码阶段,通过构建Q、K、V矩阵使用自注意力机制动态编...针对词向量语义信息不完整以及文本特征抽取时的一词多义问题,提出基于BERT(Bidirectional Encoder Representation from Transformer)的两次注意力加权算法(TARE)。首先,在词向量编码阶段,通过构建Q、K、V矩阵使用自注意力机制动态编码算法,为当前词的词向量捕获文本前后词语义信息;其次,在模型输出句子级特征向量后,利用定位信息符提取全连接层对应参数,构建关系注意力矩阵;最后,运用句子级注意力机制算法为每个句子级特征向量添加不同的注意力分数,提高句子级特征的抗噪能力。实验结果表明:在NYT-10m数据集上,与基于对比学习框架的CIL(Contrastive Instance Learning)算法相比,TARE的F1值提升了4.0个百分点,按置信度降序排列后前100、200和300条数据精准率Precision@N的平均值(P@M)提升了11.3个百分点;在NYT-10d数据集上,与基于注意力机制的PCNN-ATT(Piecewise Convolutional Neural Network algorithm based on ATTention mechanism)算法相比,精准率与召回率曲线下的面积(AUC)提升了4.8个百分点,P@M值提升了2.1个百分点。在主流的远程监督关系抽取(DSER)任务中,TARE有效地提升了模型对数据特征的学习能力。展开更多
清溪乌鳖(Qingxi black strain of Pelodiscus sinensis)是基于太湖花鳖(Taihu strain of P.sinensis)体色黑化个体选育而成的新品种,为研究体色黑化对中华鳖群体分化的影响,通过测定太湖花鳖、清溪乌鳖的23项形态学指标、3项生物学指...清溪乌鳖(Qingxi black strain of Pelodiscus sinensis)是基于太湖花鳖(Taihu strain of P.sinensis)体色黑化个体选育而成的新品种,为研究体色黑化对中华鳖群体分化的影响,通过测定太湖花鳖、清溪乌鳖的23项形态学指标、3项生物学指标及营养组成,对太湖花鳖和清溪乌鳖种质性状进行系统评估。结果显示:(1)形态学指标的主成分分析、聚类分析结果一致且两者形态差异主要表现在背甲、腹甲、四肢和头部的形态差异;差异系数分析结果显示两者尚未达到亚种分化水平。(2)太湖花鳖的可食净重占比显著高于清溪乌鳖;而背甲重占比,太湖花鳖显著低于清溪乌鳖。(3)太湖花鳖肌肉中的粗蛋白含量(♂:18.15%,♀:18.08%)显著低于清溪乌鳖(♂:18.85%,♀:18.89%);而粗脂肪含量,太湖花鳖(♂:0.56%,♀:0.56%)显著高于清溪乌鳖(♂:0.43%,♀:0.45%)。(4)清溪乌鳖肌肉中的必需氨基酸/非必需的含量比值(♂:84.44%,♀:85.54%)和呈味氨基酸/总氨基酸的含量比值(♂:38.65%,♀:38.35%)显著高于太湖花鳖(♂:80.59%,♀:81.82%)、(♂:37.88%,♀:37.36%);而必需氨基酸/总氨基酸的含量比值(太湖花鳖♂:50.46%,♀:50.70%;清溪乌鳖♂:51.01%,♀:51.44%),两者之间无显著差异;太湖花鳖裙边中的羟脯氨酸含量(♂:16.08%,♀:16.12%)显著高于清溪乌鳖(♂:15.77%,♀:15.69%)。(5)太湖花鳖和清溪乌鳖肌肉中饱和脂肪酸含量(太湖花鳖♂:31.89%,♀:30.92%;清溪乌鳖♂:31.64%,♀:32.88%)、单不饱和脂肪酸含量(太湖花鳖♂:30.50%,♀:30.160%;清溪乌鳖♂:30.55%,♀:30.71%)、多不饱和脂肪酸含量(太湖花鳖♂:30.94%,♀:30.58%;清溪乌鳖♂:31.98%,♀:32.72%)和EPA+DHA的含量(太湖花鳖♂:12.63%,♀:12.39%;清溪乌鳖♂:12.98%,♀:12.82%)基本接近,仅在个别脂肪酸的含量存在显著差异。展开更多
文摘针对词向量语义信息不完整以及文本特征抽取时的一词多义问题,提出基于BERT(Bidirectional Encoder Representation from Transformer)的两次注意力加权算法(TARE)。首先,在词向量编码阶段,通过构建Q、K、V矩阵使用自注意力机制动态编码算法,为当前词的词向量捕获文本前后词语义信息;其次,在模型输出句子级特征向量后,利用定位信息符提取全连接层对应参数,构建关系注意力矩阵;最后,运用句子级注意力机制算法为每个句子级特征向量添加不同的注意力分数,提高句子级特征的抗噪能力。实验结果表明:在NYT-10m数据集上,与基于对比学习框架的CIL(Contrastive Instance Learning)算法相比,TARE的F1值提升了4.0个百分点,按置信度降序排列后前100、200和300条数据精准率Precision@N的平均值(P@M)提升了11.3个百分点;在NYT-10d数据集上,与基于注意力机制的PCNN-ATT(Piecewise Convolutional Neural Network algorithm based on ATTention mechanism)算法相比,精准率与召回率曲线下的面积(AUC)提升了4.8个百分点,P@M值提升了2.1个百分点。在主流的远程监督关系抽取(DSER)任务中,TARE有效地提升了模型对数据特征的学习能力。
文摘清溪乌鳖(Qingxi black strain of Pelodiscus sinensis)是基于太湖花鳖(Taihu strain of P.sinensis)体色黑化个体选育而成的新品种,为研究体色黑化对中华鳖群体分化的影响,通过测定太湖花鳖、清溪乌鳖的23项形态学指标、3项生物学指标及营养组成,对太湖花鳖和清溪乌鳖种质性状进行系统评估。结果显示:(1)形态学指标的主成分分析、聚类分析结果一致且两者形态差异主要表现在背甲、腹甲、四肢和头部的形态差异;差异系数分析结果显示两者尚未达到亚种分化水平。(2)太湖花鳖的可食净重占比显著高于清溪乌鳖;而背甲重占比,太湖花鳖显著低于清溪乌鳖。(3)太湖花鳖肌肉中的粗蛋白含量(♂:18.15%,♀:18.08%)显著低于清溪乌鳖(♂:18.85%,♀:18.89%);而粗脂肪含量,太湖花鳖(♂:0.56%,♀:0.56%)显著高于清溪乌鳖(♂:0.43%,♀:0.45%)。(4)清溪乌鳖肌肉中的必需氨基酸/非必需的含量比值(♂:84.44%,♀:85.54%)和呈味氨基酸/总氨基酸的含量比值(♂:38.65%,♀:38.35%)显著高于太湖花鳖(♂:80.59%,♀:81.82%)、(♂:37.88%,♀:37.36%);而必需氨基酸/总氨基酸的含量比值(太湖花鳖♂:50.46%,♀:50.70%;清溪乌鳖♂:51.01%,♀:51.44%),两者之间无显著差异;太湖花鳖裙边中的羟脯氨酸含量(♂:16.08%,♀:16.12%)显著高于清溪乌鳖(♂:15.77%,♀:15.69%)。(5)太湖花鳖和清溪乌鳖肌肉中饱和脂肪酸含量(太湖花鳖♂:31.89%,♀:30.92%;清溪乌鳖♂:31.64%,♀:32.88%)、单不饱和脂肪酸含量(太湖花鳖♂:30.50%,♀:30.160%;清溪乌鳖♂:30.55%,♀:30.71%)、多不饱和脂肪酸含量(太湖花鳖♂:30.94%,♀:30.58%;清溪乌鳖♂:31.98%,♀:32.72%)和EPA+DHA的含量(太湖花鳖♂:12.63%,♀:12.39%;清溪乌鳖♂:12.98%,♀:12.82%)基本接近,仅在个别脂肪酸的含量存在显著差异。