基于BERT在税务公文系统中实现纠错功能

Implementation of Error Correction Function in Tax Official Document System Based on BERT

下载PDF

导出

摘要税务公文作为社会政治的产物,具有鲜明的政治性。而撰制公文是一项严肃的工作,必须保持准确、严肃的文体特点。为减轻撰制者和审核者的负担,该实验针对税务系统,利用基于BERT-BiLSTM-CRF的序列标注模型和BERT掩码语言模型的特点,对公文句子中常见的单个字错误进行了检错、纠错实验。准确率、召回率和F1值相比传统的纠错方法有着明显的提升。结果表明,基于BERT-BiLSTM-CRF的序列标注模型和BERT掩码语言模型在税务公文检错纠错应用中具有较大价值。 As a product of social politics,tax official documents have a distinct political nature.Writing official documents is a serious work,and it must maintain accurate and serious style characteristics.In order to reduce the burden of writers and reviewers,this experiment is aimed at the tax system and uses the advantages of the BERT-BiLSTM-CRF-based sequence labeling and BERT mask language model to detect and correct single word errors in official document sentences.Compared with traditional error correction methods,the accuracy rate,recall rate and F1 value are significantly improved.The results show that the BERT-BiLSTM-CRF-based sequence labeling and BERT mask language model have great value in the error detection and correction of tax administrative documents.

作者袁野朱荣钊 YUAN Ye;ZHU Rongzhao(School of Computer Science and Information Engineering,Hubei University,Wuhan 430062,China)

机构地区湖北大学计算机与信息工程学院

出处《现代信息科技》 2020年第13期19-21,共3页 Modern Information Technology

关键词税务公文 BERT掩码语言模型 BERT-BiLSTM-CRF 序列标注 tax administrative documents BERT mask language model BERT-BiLSTM-CRF sequence labeling

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1王虹,张仰森.基于词性预测的中文文本自动查错研究[J].贵州师范大学学报（自然科学版）,2001,19(2):72-75. 被引量：4

二级参考文献5

1孙才,罗振声.汉语文本校对字词级查错处理的研究[A].第四届计算语言学会议论文集(语言工程)[C].北京:清华大学出版社,1997.319-324.
2张仰森,丁冰青.中文文本自动校对中基于"捆绑+过滤”的字词级查错系统研究与实践[A],1998中文信息处理国际会议论文集[C].北京:清华大学出版社,1998.392-397
3Karen Kukich. Techniques for Automatically CorrectingWords in Text [J] .ACM Computing Surveys, 1992,24(4).
4Andrew R. Golding, Yues Achabes. Combining TrigramBased and Feature-Based Methods for Context-SensitiveSpelling Correction [A]. in: The Computation and Language E-Print Archive[C]. CMP-LG /9605037,1996.
5于勐,姚天顺.一种混合的中文文本校对方法[J].中文信息学报,1998,12(2):31-36. 被引量：22

共引文献3

1李蓉.一个用于OCR输出的中文文本的拼写校对系统[J].中文信息学报,2009,23(5):92-97. 被引量：3
2黄改娟,王匆匆,张仰森.基于动态文本窗口和权重动态分配的中文文本纠错方法[J].郑州大学学报（理学版）,2020,52(3):9-14. 被引量：10
3汪苏琪,王明文,曾雪强.面向规范性文件的基于BERT的文本纠错模型[J].山西大学学报（自然科学版）,2022,45(2):257-263. 被引量：3

1杨春燕.税务公文拟制的规范性——以某税务机关的一份通知为例[J].湖南税务高等专科学校学报,2019,32(2):47-49.
2张梦琦,张玉良,郑憧憬.梨树县气象资料公文系统开发与在气象服务中的应用[J].区域治理,2018,0(3):225-225.
3赵莉萍.对提升电子公文系统运转效率的实践与思考[J].西铁科技,2020(1):39-40.
4钱芳.抓住演讲辞文体特点,培养中学生写作能力[J].语文天地,2020(25):47-48.
5高长峰.关于推进国家治理体系和治理能力现代化的思考[J].世纪桥,2020(5):86-89. 被引量：1
6蓝永琛.行政拘留暂缓执行制度的重构与反思[J].广西警察学院学报,2020,33(3):30-35. 被引量：5
7王星光.民事二审裁判思维与裁判方法的扭曲与修正[J].山东法官培训学院学报,2020,36(3):78-89. 被引量：1
8刘焕雨.井下单总线传输特性及电路设计[J].陕西工业职业技术学院学报,2020,15(2):1-4.
9相建强.协会八届二次理事扩大会工作报告[J].口腔护理用品工业,2020,30(4):48-57.
10张佳,石俊.提升大学生中华文化自信建设社会主义文化强国[J].教育教学论坛,2020(37):83-84. 被引量：1

现代信息科技

2020年第13期

浏览历史

内容加载中请稍等...

基于BERT在税务公文系统中实现纠错功能

参考文献1

二级参考文献5

共引文献3

相关作者

相关机构

相关主题

浏览历史