期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
不同自然语言处理方法在土壤环境污染调查报告文本信息抽取中的对比研究
1
作者 孙维维 潘贤章 +5 位作者 刘杰 郭观林 李衍 王娟 项钰 王睿 《环境科学研究》 CAS CSCD 北大核心 2024年第3期607-615,共9页
土壤环境污染调查报告中包含着丰富的土壤环境、污染源、迁移途径和受体等信息,但是这些非结构化类型的数据很难直接使用,需要先进行文本信息抽取,以供后续进一步分析处理.本研究针对土壤环境污染调查报告文本信息抽取的技术难点,分别... 土壤环境污染调查报告中包含着丰富的土壤环境、污染源、迁移途径和受体等信息,但是这些非结构化类型的数据很难直接使用,需要先进行文本信息抽取,以供后续进一步分析处理.本研究针对土壤环境污染调查报告文本信息抽取的技术难点,分别采用传统规则匹配方法、BERT模型和GPT模型的自然语言处理(NLP)方法,进行文本信息抽取,并对其抽取效果进行评价.结果表明:GPT模型的抽取准确率、召回率和F1分数分别达到97.80%、84.43%和90.62%,相比于传统规则匹配方法分别提高了86.70%、299.12%和200.70%,相比于BERT模型分别提高了18.10%、154.21%和91.15%.进一步分析发现,虽然GPT模型在文本要素信息抽取中具有一定优势,但是规则匹配方法简单易用且部分要素抽取效率较高;同时,通过增加训练样本量及优化标注和模型参数等手段,BERT模型有较大的提升空间,因此,针对土壤环境污染调查报告中不同文本要素标签,可以采用合适的NLP方法,以兼顾文本信息抽取效率与精度. 展开更多
关键词 文本要素抽取 BERT模型 GPT模型 污染地块 土壤环境污染调查报告
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部