针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona...针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。展开更多
为全面了解畜禽养殖废水领域的研究进展,利用VOSviewer对Web of Science(WoS)核心合集数据库中2003—2023年畜禽养殖废水相关文献进行统计及可视化分析,通过关键词聚类分析,了解该领域的研究主线及多年变化。结果显示:畜禽养殖废水研究...为全面了解畜禽养殖废水领域的研究进展,利用VOSviewer对Web of Science(WoS)核心合集数据库中2003—2023年畜禽养殖废水相关文献进行统计及可视化分析,通过关键词聚类分析,了解该领域的研究主线及多年变化。结果显示:畜禽养殖废水研究领域近3年发文量增长迅猛,截至2023年发文量已达4117篇,中国、美国学者对该领域研究的贡献度较高且合作密切;有机物、营养物质、致病菌、重金属和抗生素为畜禽养殖废水处理的主要污染物,其中,重金属和抗生素近年来引起了较多的关注,加强畜禽养殖废水中抗生素的监管与处理具有紧迫性;在时间尺度上的映射发现,畜禽养殖废水主要以生物处理技术为主,关键词microalgae-based wastewater treatment(微藻驱动废水处理)的平均出现年份为2022年,表明其为当前畜禽养殖废水处理的新兴技术。此外,还从污染物种类、处理技术方面探讨了畜禽养殖废水处理研究的不足及未来发展趋势,提出基于可持续发展观的低能耗、抗冲击、高附加值的处理技术可能是未来的研究重点,应在此基础上开发新的水处理技术及应用研究。展开更多
文摘针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。
文摘为全面了解畜禽养殖废水领域的研究进展,利用VOSviewer对Web of Science(WoS)核心合集数据库中2003—2023年畜禽养殖废水相关文献进行统计及可视化分析,通过关键词聚类分析,了解该领域的研究主线及多年变化。结果显示:畜禽养殖废水研究领域近3年发文量增长迅猛,截至2023年发文量已达4117篇,中国、美国学者对该领域研究的贡献度较高且合作密切;有机物、营养物质、致病菌、重金属和抗生素为畜禽养殖废水处理的主要污染物,其中,重金属和抗生素近年来引起了较多的关注,加强畜禽养殖废水中抗生素的监管与处理具有紧迫性;在时间尺度上的映射发现,畜禽养殖废水主要以生物处理技术为主,关键词microalgae-based wastewater treatment(微藻驱动废水处理)的平均出现年份为2022年,表明其为当前畜禽养殖废水处理的新兴技术。此外,还从污染物种类、处理技术方面探讨了畜禽养殖废水处理研究的不足及未来发展趋势,提出基于可持续发展观的低能耗、抗冲击、高附加值的处理技术可能是未来的研究重点,应在此基础上开发新的水处理技术及应用研究。