方面情感三元组抽取(ASTE)是方面情感分析中一项极具挑战性的子任务,目的是提取所给句子中的方面项、观点项和对应的情感极性。现有的面向ASTE任务的模型分为流水线模型和端到端模型。针对流水线模型易受到错误传播的影响,且大部分现有...方面情感三元组抽取(ASTE)是方面情感分析中一项极具挑战性的子任务,目的是提取所给句子中的方面项、观点项和对应的情感极性。现有的面向ASTE任务的模型分为流水线模型和端到端模型。针对流水线模型易受到错误传播的影响,且大部分现有端到端模型忽略了句子中丰富的句法信息问题,提出一种语义和句法增强的双通道方面情感三元组抽取模型(SSED-ASTE)。首先,使用BERT(Bidirectional Encoder Representation from Transformers)编码器对上下文编码;其次,使用双向长短期记忆(Bi-LSTM)网络捕捉上下文语义依赖关系;再次,通过2个并行的图卷积网络(GCN)分别使用自注意力机制和依存句法分析提取语义特征和句法特征并融合;最后,使用网格标记方案(GTS)抽取三元组。在4个公开数据集上进行实验分析,与GTS-BERT模型相比,所提模型的F1值分别提升了0.29、1.50、2.93和0.78个百分点。实验结果表明,所提模型可以有效利用句子中隐含的语义信息和句法信息,实现较准确的三元组抽取。展开更多
针对基于字级别的命名实体识别方法无法充分利用句子词语信息的问题,提出一种融合词语信息的细粒度命名实体识别模型。该模型通过引入外部词典,在基于字表示中融入句子潜在词语的信息,避免了分词错误传播的问题,同时构建了一种增强型字...针对基于字级别的命名实体识别方法无法充分利用句子词语信息的问题,提出一种融合词语信息的细粒度命名实体识别模型。该模型通过引入外部词典,在基于字表示中融入句子潜在词语的信息,避免了分词错误传播的问题,同时构建了一种增强型字向量表达;利用扁平化的Lattice Transformer网络结构对字和词语的表示以及位置关系信息进行建模;通过CRF(Conditional Random Filed)计算得到最优标签序列。在细粒度命名实体语料CLUENER2020上进行了实验,精确率达到82.46%,召回率达到83.14%,F1值达到82.80%,验证了融合词语信息可以提升细粒度命名实体识别效果。展开更多
本文基于密度泛函理论(DFT)的第一性原理计算了W、Mn、V、Ti替位掺杂二维MoSi_(2)N_(4)后的几何结构、电子结构以及光学性质的变化.电子结构分析表明W、Mn、W、Ti替位掺杂二维MoSi_(2)N_(4)后的禁带宽度分别为1.806 e V、1.003 e V、1.2...本文基于密度泛函理论(DFT)的第一性原理计算了W、Mn、V、Ti替位掺杂二维MoSi_(2)N_(4)后的几何结构、电子结构以及光学性质的变化.电子结构分析表明W、Mn、W、Ti替位掺杂二维MoSi_(2)N_(4)后的禁带宽度分别为1.806 e V、1.003 e V、1.218 e V和1.373 e V;四种过渡金属掺杂后MoSi_(2)N_(4)的带隙类型没有发生改变,均为间接带隙半导体;W掺杂后的杂质能级靠近价带顶,费米能级靠近价带顶,为p型半导体,杂质能级为受主能级;Mn掺杂后的杂质能级靠近导带底,费米能级靠近导带底,为n型半导体;V和Ti掺杂后杂质能级位于费米能级附近,为复合中心;光学性质分析表明,在2 e V~4 e V的能量区间内,W掺杂结构的吸收波长为336 nm,体系发生红移;Mn、V和Ti替位掺杂后的吸收波长分别为320 nm、358 nm和338 nm,且掺杂体系均发生蓝移.展开更多
文摘方面情感三元组抽取(ASTE)是方面情感分析中一项极具挑战性的子任务,目的是提取所给句子中的方面项、观点项和对应的情感极性。现有的面向ASTE任务的模型分为流水线模型和端到端模型。针对流水线模型易受到错误传播的影响,且大部分现有端到端模型忽略了句子中丰富的句法信息问题,提出一种语义和句法增强的双通道方面情感三元组抽取模型(SSED-ASTE)。首先,使用BERT(Bidirectional Encoder Representation from Transformers)编码器对上下文编码;其次,使用双向长短期记忆(Bi-LSTM)网络捕捉上下文语义依赖关系;再次,通过2个并行的图卷积网络(GCN)分别使用自注意力机制和依存句法分析提取语义特征和句法特征并融合;最后,使用网格标记方案(GTS)抽取三元组。在4个公开数据集上进行实验分析,与GTS-BERT模型相比,所提模型的F1值分别提升了0.29、1.50、2.93和0.78个百分点。实验结果表明,所提模型可以有效利用句子中隐含的语义信息和句法信息,实现较准确的三元组抽取。
文摘针对基于字级别的命名实体识别方法无法充分利用句子词语信息的问题,提出一种融合词语信息的细粒度命名实体识别模型。该模型通过引入外部词典,在基于字表示中融入句子潜在词语的信息,避免了分词错误传播的问题,同时构建了一种增强型字向量表达;利用扁平化的Lattice Transformer网络结构对字和词语的表示以及位置关系信息进行建模;通过CRF(Conditional Random Filed)计算得到最优标签序列。在细粒度命名实体语料CLUENER2020上进行了实验,精确率达到82.46%,召回率达到83.14%,F1值达到82.80%,验证了融合词语信息可以提升细粒度命名实体识别效果。
文摘本文基于密度泛函理论(DFT)的第一性原理计算了W、Mn、V、Ti替位掺杂二维MoSi_(2)N_(4)后的几何结构、电子结构以及光学性质的变化.电子结构分析表明W、Mn、W、Ti替位掺杂二维MoSi_(2)N_(4)后的禁带宽度分别为1.806 e V、1.003 e V、1.218 e V和1.373 e V;四种过渡金属掺杂后MoSi_(2)N_(4)的带隙类型没有发生改变,均为间接带隙半导体;W掺杂后的杂质能级靠近价带顶,费米能级靠近价带顶,为p型半导体,杂质能级为受主能级;Mn掺杂后的杂质能级靠近导带底,费米能级靠近导带底,为n型半导体;V和Ti掺杂后杂质能级位于费米能级附近,为复合中心;光学性质分析表明,在2 e V~4 e V的能量区间内,W掺杂结构的吸收波长为336 nm,体系发生红移;Mn、V和Ti替位掺杂后的吸收波长分别为320 nm、358 nm和338 nm,且掺杂体系均发生蓝移.