GNSS观测时间序列包含复杂的非线性构造运动,如地面质量荷载、模型残差、周围环境因素等。由于环境因素的复杂性,季节性信号可能具备准周期时变的特征,传统的时间序列分析模型很难模型化。因此,可以采用一种双向长短期记忆(Bidirectiona...GNSS观测时间序列包含复杂的非线性构造运动,如地面质量荷载、模型残差、周围环境因素等。由于环境因素的复杂性,季节性信号可能具备准周期时变的特征,传统的时间序列分析模型很难模型化。因此,可以采用一种双向长短期记忆(Bidirectional Long Short-Term Memory,BiLSTM)循环神经网络与变分模态分解(Variational Mode Decomposition,VMD)联合的信号重构方法。首先利用VMD强大的分解能力将GNSS信号进行频域剖分并将其分为多项子信号和噪声项,再基于BiLSTM强大的学习能力对GNSS信号进行训练建模。结果表明,BiLSTM+VMD模型能充分挖掘信号的时频域特征,提高信号重构的精度和稳定性,GNSS N、E、U三分量重构结果均方根误差(Root Mean Squared Error,RMSE)都表现出不同程度的降低,尤其水平方向效果更为显著,相比EMD与VMD方法,E方向离散度分别降低了61%和19%,N方向离散度分别降低了20%和14%。这为GNSS观测时间序列中信号提取与模型参数估计提供了一个有价值的模型。展开更多
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona...针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。展开更多
文摘GNSS观测时间序列包含复杂的非线性构造运动,如地面质量荷载、模型残差、周围环境因素等。由于环境因素的复杂性,季节性信号可能具备准周期时变的特征,传统的时间序列分析模型很难模型化。因此,可以采用一种双向长短期记忆(Bidirectional Long Short-Term Memory,BiLSTM)循环神经网络与变分模态分解(Variational Mode Decomposition,VMD)联合的信号重构方法。首先利用VMD强大的分解能力将GNSS信号进行频域剖分并将其分为多项子信号和噪声项,再基于BiLSTM强大的学习能力对GNSS信号进行训练建模。结果表明,BiLSTM+VMD模型能充分挖掘信号的时频域特征,提高信号重构的精度和稳定性,GNSS N、E、U三分量重构结果均方根误差(Root Mean Squared Error,RMSE)都表现出不同程度的降低,尤其水平方向效果更为显著,相比EMD与VMD方法,E方向离散度分别降低了61%和19%,N方向离散度分别降低了20%和14%。这为GNSS观测时间序列中信号提取与模型参数估计提供了一个有价值的模型。
文摘针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。