为解决现有分割网络中小面积区域像素表达能力差、区域上下文信息类别被混淆、区域分布不规则等导致的鸡蛋沙壳区域分割性能不佳的问题,本文以此类鸡蛋图像为研究对象,提出了一种基于上下文信息的鸡蛋沙壳区域实例分割方法(Global-Local...为解决现有分割网络中小面积区域像素表达能力差、区域上下文信息类别被混淆、区域分布不规则等导致的鸡蛋沙壳区域分割性能不佳的问题,本文以此类鸡蛋图像为研究对象,提出了一种基于上下文信息的鸡蛋沙壳区域实例分割方法(Global-Local Contexts based Instance Segmentation Model for Egg Sand-shell Region,GL-ISR)。首先,对沙壳区域特征进行全局(Global Context Information Module,GCIM)和局部(Local Context Information Module,LCIM)上下文信息建模,前者利用金字塔池化对特征图进行多尺度上下文加权聚合以收集不同像素区域的上下文信息,后者则通过构建Label Map与Label Prior Layer监督上下文依赖类别以区分上下文信息来源;其次,将两部分上下文与原特征图进行聚合,以增强沙壳区域特征表达能力,从而提高模型的分割性能。为验证所提模型的有效性,本文在包含3类区域、7160幅沙壳蛋图像的自标注数据集上进行了实验。结果表明,GL-ISR在IoU阈值为0.5和0.75情况下分别取得70.02%和44.16%的最优mAP值,在IoU阈值介于0.5至0.95之间取得最优平均mAP值48.22%,显著优于其他模型。具体地,GL-ISR的在光滑区域、面状沙壳和点状沙壳上分别取得85.16%、46.39%和41.17%的像素精准度,即使在分割难度较大的点状沙壳区域上,该模型的像素精准度仍保持在40%以上。因此,上述实验结果表明了GL-ISR模型在鸡蛋沙壳区域分割方面的有效性,可为沙壳蛋品质改良提供理论基础。展开更多
随着农作物病虫害研究文献的快速增长,对农作物病虫害领域文献进行文本挖掘变得越来越重要。开发有效、准确的农作物病虫害命名实体识别系统有助于在农作物病虫害相关研究报告中提取研究成果,为农作物病虫害的治理提供有效建议。本文针...随着农作物病虫害研究文献的快速增长,对农作物病虫害领域文献进行文本挖掘变得越来越重要。开发有效、准确的农作物病虫害命名实体识别系统有助于在农作物病虫害相关研究报告中提取研究成果,为农作物病虫害的治理提供有效建议。本文针对中文农作物病虫害数据集缺失问题,提出了基于半远程监督的停等算法,利用该算法构建中文农作物病虫害领域语料库,大幅度减少标注过程的人工成本和时间成本;同时,提出了中文农作物病虫害命名实体识别模型(Agricultural information extraction,Agr-IE),该模型基于BERT-BILSTM-CRF,辅以多源信息融合(多源分词信息和全局词汇嵌入信息)丰富字符向量,使其充分结合字符级与词汇级的信息,以提高模型捕捉上下文信息的能力。实验表明,该模型可以有效地识别病害、虫害、药剂、作物等实体,F1值分别为96.56%、95.12%、94.48%、95.54%,并对识别难度较大的病原实体具有较好的识别效果,F1值为81.48%,高于BERT-BILSTM-CRF、BERT等模型的相应值。本文所提模型在MSRA和Weibo等其他领域数据集上与CAN-NER、Lattice-LSTM-CRF等模型进行了对比实验,并取得最佳的识别效果,F1值分别为95.80%、94.57%,表明该算法具有一定的泛化能力。展开更多
为了解决农业病虫害命名实体识别过程中存在的内在语义信息缺失、局部上下文特征易被忽略和捕获长距离依赖能力不足等问题,以农业病虫害文本为研究对象,提出一种基于部首嵌入和注意力机制的农业病虫害命名实体识别模型(Chinese agricult...为了解决农业病虫害命名实体识别过程中存在的内在语义信息缺失、局部上下文特征易被忽略和捕获长距离依赖能力不足等问题,以农业病虫害文本为研究对象,提出一种基于部首嵌入和注意力机制的农业病虫害命名实体识别模型(Chinese agricultural diseases and pests named entity recognition with joint radical-embedding and self-attention,RSADP)。首先,该模型将部首嵌入集成到字符嵌入中作为输入,用以丰富语义信息。其中,针对部首嵌入设计了3种特征提取策略,即卷积神经网络(Convolutional neural network,CNN)、双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)和CNNBiLSTM;其次,采用多层不同窗口尺寸的CNNs层提取不同尺度的局部上下文信息;然后,在BiLSTM提取全局序列特征的基础上,采用自注意力机制进一步增强模型提取更长距离依赖的能力;最后,采用条件随机场(Conditional random field,CRF)联合识别实体边界和划分实体类别。在包含11个类别和24715条标注样本的农业病虫害自制语料上进行了实验。结果表明,本文模型RSADP在该数据集上精确率、召回率和F1值分别为94.16%、94.47%和94.32%;在具体实体类别上,RSADP在作物、病害、虫害等易识别实体上F1值高达95.81%、97.76%和97.23%。同时,RSADP在草害、病原等难以识别实体上F1值仍保持86%以上。实验结果表明,本文所提模型能够有效识别农业病虫害命名实体,其识别精度优于其他模型,且具有一定的泛化性。展开更多
为解决病虫害文献识别过程中存在语义特征学习不够、上下文信息不能充分利用等问题,以病虫害相关文献摘要为研究对象,提出一种基于注意力池化策略和堆叠式双向长短期记忆(Bi-directional long-short term memory,BiLSTM)的神经网络模型(...为解决病虫害文献识别过程中存在语义特征学习不够、上下文信息不能充分利用等问题,以病虫害相关文献摘要为研究对象,提出一种基于注意力池化策略和堆叠式双向长短期记忆(Bi-directional long-short term memory,BiLSTM)的神经网络模型(AP-LSTM)。该模型采用堆叠式长短期记忆结构,提高了对语义特征的学习能力,在进行堆叠操作时,通过将输入向量与输出向量拼接,进一步加强了对语义信息的表征;然后采用基于注意力机制的池化策略为不同的词分配不同权重,使模型在抓住重点的同时能够充分利用上下文信息。本文在包含1439条正例、1061条负例的自标注数据集上进行了实验,所提出的AP-LSTM模型在该数据集上的精确率、召回率、F1值和准确率分别为92.67%、97.20%、94.88%和94.00%,实验结果表明,AP-LSTM模型能够有效识别病虫害文献。展开更多
文摘为解决现有分割网络中小面积区域像素表达能力差、区域上下文信息类别被混淆、区域分布不规则等导致的鸡蛋沙壳区域分割性能不佳的问题,本文以此类鸡蛋图像为研究对象,提出了一种基于上下文信息的鸡蛋沙壳区域实例分割方法(Global-Local Contexts based Instance Segmentation Model for Egg Sand-shell Region,GL-ISR)。首先,对沙壳区域特征进行全局(Global Context Information Module,GCIM)和局部(Local Context Information Module,LCIM)上下文信息建模,前者利用金字塔池化对特征图进行多尺度上下文加权聚合以收集不同像素区域的上下文信息,后者则通过构建Label Map与Label Prior Layer监督上下文依赖类别以区分上下文信息来源;其次,将两部分上下文与原特征图进行聚合,以增强沙壳区域特征表达能力,从而提高模型的分割性能。为验证所提模型的有效性,本文在包含3类区域、7160幅沙壳蛋图像的自标注数据集上进行了实验。结果表明,GL-ISR在IoU阈值为0.5和0.75情况下分别取得70.02%和44.16%的最优mAP值,在IoU阈值介于0.5至0.95之间取得最优平均mAP值48.22%,显著优于其他模型。具体地,GL-ISR的在光滑区域、面状沙壳和点状沙壳上分别取得85.16%、46.39%和41.17%的像素精准度,即使在分割难度较大的点状沙壳区域上,该模型的像素精准度仍保持在40%以上。因此,上述实验结果表明了GL-ISR模型在鸡蛋沙壳区域分割方面的有效性,可为沙壳蛋品质改良提供理论基础。
文摘随着农作物病虫害研究文献的快速增长,对农作物病虫害领域文献进行文本挖掘变得越来越重要。开发有效、准确的农作物病虫害命名实体识别系统有助于在农作物病虫害相关研究报告中提取研究成果,为农作物病虫害的治理提供有效建议。本文针对中文农作物病虫害数据集缺失问题,提出了基于半远程监督的停等算法,利用该算法构建中文农作物病虫害领域语料库,大幅度减少标注过程的人工成本和时间成本;同时,提出了中文农作物病虫害命名实体识别模型(Agricultural information extraction,Agr-IE),该模型基于BERT-BILSTM-CRF,辅以多源信息融合(多源分词信息和全局词汇嵌入信息)丰富字符向量,使其充分结合字符级与词汇级的信息,以提高模型捕捉上下文信息的能力。实验表明,该模型可以有效地识别病害、虫害、药剂、作物等实体,F1值分别为96.56%、95.12%、94.48%、95.54%,并对识别难度较大的病原实体具有较好的识别效果,F1值为81.48%,高于BERT-BILSTM-CRF、BERT等模型的相应值。本文所提模型在MSRA和Weibo等其他领域数据集上与CAN-NER、Lattice-LSTM-CRF等模型进行了对比实验,并取得最佳的识别效果,F1值分别为95.80%、94.57%,表明该算法具有一定的泛化能力。
文摘为了解决农业病虫害命名实体识别过程中存在的内在语义信息缺失、局部上下文特征易被忽略和捕获长距离依赖能力不足等问题,以农业病虫害文本为研究对象,提出一种基于部首嵌入和注意力机制的农业病虫害命名实体识别模型(Chinese agricultural diseases and pests named entity recognition with joint radical-embedding and self-attention,RSADP)。首先,该模型将部首嵌入集成到字符嵌入中作为输入,用以丰富语义信息。其中,针对部首嵌入设计了3种特征提取策略,即卷积神经网络(Convolutional neural network,CNN)、双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)和CNNBiLSTM;其次,采用多层不同窗口尺寸的CNNs层提取不同尺度的局部上下文信息;然后,在BiLSTM提取全局序列特征的基础上,采用自注意力机制进一步增强模型提取更长距离依赖的能力;最后,采用条件随机场(Conditional random field,CRF)联合识别实体边界和划分实体类别。在包含11个类别和24715条标注样本的农业病虫害自制语料上进行了实验。结果表明,本文模型RSADP在该数据集上精确率、召回率和F1值分别为94.16%、94.47%和94.32%;在具体实体类别上,RSADP在作物、病害、虫害等易识别实体上F1值高达95.81%、97.76%和97.23%。同时,RSADP在草害、病原等难以识别实体上F1值仍保持86%以上。实验结果表明,本文所提模型能够有效识别农业病虫害命名实体,其识别精度优于其他模型,且具有一定的泛化性。
文摘为解决病虫害文献识别过程中存在语义特征学习不够、上下文信息不能充分利用等问题,以病虫害相关文献摘要为研究对象,提出一种基于注意力池化策略和堆叠式双向长短期记忆(Bi-directional long-short term memory,BiLSTM)的神经网络模型(AP-LSTM)。该模型采用堆叠式长短期记忆结构,提高了对语义特征的学习能力,在进行堆叠操作时,通过将输入向量与输出向量拼接,进一步加强了对语义信息的表征;然后采用基于注意力机制的池化策略为不同的词分配不同权重,使模型在抓住重点的同时能够充分利用上下文信息。本文在包含1439条正例、1061条负例的自标注数据集上进行了实验,所提出的AP-LSTM模型在该数据集上的精确率、召回率、F1值和准确率分别为92.67%、97.20%、94.88%和94.00%,实验结果表明,AP-LSTM模型能够有效识别病虫害文献。