基于深度学习的法院信息文本分类被引量：2

Research on Classification of Court Information Texts Based on Deep Learning

下载PDF

导出

摘要为解决在法院数据信息化过程中,海量的法院文书存在缺乏自动管理分类的问题,提出一种基于字符级卷积神经网络的文本分类模型。模型通过卷积神经网络进行特征提取,能够精确有效地解决文本分类问题。实验结果证明,该模型可以实现在测试集上准确率99.67%的分类,且训练用时只有常用循环神经网络算法的50%。 In the process of court data informatization,there is a lack of automatic management classification in massive court documents.This paper proposes a text classification model based on character-level convolutional neural network,which can effectively solve the problem.The model extracts features through convolutional neural networks,which can classify texts efficiently and accurately.Experiments show that the model can achieve an accuracy rate 99.67%of classification on the test set,and the training time is only 50%of the commonly used Recurrent Neural Networks.

作者杨帆陈建峡郑吟秋黄煜俊李超 YANG Fan;CHEN Jianxia;ZHENG Yingqiu;HUANG Yujun;LI Chao(School of Computer Science,Hubei Univ.of Tech.,Wuhan 430068,China)

机构地区湖北工业大学计算机学院

出处《湖北工业大学学报》 2019年第4期63-67,共5页 Journal of Hubei University of Technology

基金湖北省科技厅自然科学基金青年面上项目(2017CFB326)

关键词法院信息文本卷积神经网络字符级深度学习文本分类 court information text convolutional neural network text classification character level deep learning

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1庞亮,兰艳艳,徐君,郭嘉丰,万圣贤,程学旗.深度文本匹配综述[J].计算机学报,2017,40(4):985-1003. 被引量：65
2郭喜跃,何婷婷.信息抽取研究综述[J].计算机科学,2015,42(2):14-17. 被引量：84
3刘稳,王锦,李锐,游景扬,陈建峡.法院判决书关键信息抽取系统设计与实现[J].湖北工业大学学报,2018,33(1):63-67. 被引量：6
4张帆,王敏.基于深度学习的医疗命名实体识别[J].计算技术与自动化,2017,36(1):123-127. 被引量：20
5李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5. 被引量：178

二级参考文献59

1吴友政,赵军,段湘煜,徐波.问答式检索技术及评测研究综述[J].中文信息学报,2005,19(3):1-13. 被引量：48
2张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：66
3俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：157
4[16]Hobbs J,Appelt D,Bear J et al.FASTUS:A Cascaded Finite-State Transducer for Extracting Information from Natural-Language Text[C].In:Roche,Schabes eds. Finite State Devices for Natural Language Processing, MIT Press,Cambridge MA, 1996
5[17]Appelt D E.Introduction to Information Extraction[J].AI COMMUNICATIONS, 1999; 12(3)
6[18]Yangarber R.Scenario Customization for Information Extraction[D].Ph D Thesis.New York University,2001-01
7[19]Cowie J, Lehnert W.Information Extraction[J].Communications of the ACM, 1996;39(1)
8[20]Grishman R Adaptive information extraction and sublangu age analysis[C].In:Proceedings of IJCAI-2001 Workshop on Adaptive Text Extraction and Mining,2001
9[1]Applet D E,Israel D J.Introduction to Information Extraction Technology. A Tutorial for IJCAI-99,1999
10[2]Gaizauskas R,Wilks Y.Information Extraction:Beyond Document Retrieval[J].Journal of Documentation, 1997

共引文献339

1孔静静,于琦,李敬华,于彤,张竹绿,田野,祖雅琪.实体抽取综述及其在中医药领域的应用[J].世界科学技术-中医药现代化,2022,24(8):2957-2963. 被引量：4
2陈平,匡尧,陈婧.基于BERT-wwm-ext多特征文本表示的经济事件主体抽取方法研究[J].武汉电力职业技术学院学报,2020(2):45-50. 被引量：1
3张海瑜,陈庆龙,张斯静,张子怡,杨帆,李鑫星.基于语义知识图谱的农业知识智能检索方法[J].农业机械学报,2021,52(S01):156-163. 被引量：12
4刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：12
5王竹,谷松原.基于裁判文书争议焦点的民事案由逻辑图谱构建研究——以产品责任领域为例[J].民商法争鸣,2022(2):13-25.
6李春楠,王雷,孙媛媛,林鸿飞.基于BERT的盗窃罪法律文书命名实体识别方法[J].中文信息学报,2021,35(8):73-81. 被引量：19
7吴天昊,古丽拉·阿东别克.基于神经元块级别注意力机制的LSTM关系抽取[J].计算机应用研究,2020,37(S02):76-79. 被引量：6
8宋颖毅,叶东升,王坤龙,葛志.无监督的问句相似度匹配方法[J].计算机应用研究,2020,37(S02):69-72. 被引量：2
9林少娃,陈奕汝,顾洁,伍蓓蓓,雍旭龙.基于隐含狄利克雷分布主题模型和特征级异构数据融合的电力故障主动性预警研究[J].电子器件,2022,45(2):432-438. 被引量：9
10胡雨晴,纪明宇,王晨龙.基于依存句法的句子相似度计算方法[J].智能计算机与应用,2020(4):113-118. 被引量：2

同被引文献19

1冯斌,张又文,唐昕,郭创新,王坚俊,杨强,王慧芳.基于BiLSTM-Attention神经网络的电力设备缺陷文本挖掘[J].中国电机工程学报,2020,40(S01):1-10. 被引量：53
2李玉亮.数据分类分级的现状与发展[J].中国信息安全,2021(5):55-56. 被引量：15
3杨碧瑶,王鹏.从《联邦信息安全管理法案》看美国信息安全管理[J].保密科学技术,2012(8):37-39. 被引量：6
4王惠莅,杨晨,张明天,杨建军.美国国家标准和技术研究院信息安全标准化系列研究(三) SP 800系列信息安全标准研究[J].信息技术与标准化,2011(5):65-69. 被引量：5
5张明天,王惠莅,杨晨,杨建军.美国国家标准和技术研究院信息安全标准化系列研究(四) FIPS 199《联邦信息和信息系统安全分类》标准解读[J].信息技术与标准化,2011(7):52-55. 被引量：7
6孙锐,赵战生.DIAP计划所体现的美国信息保障实施思路[J].信息安全与通信保密,2002,24(2):16-18. 被引量：1
7陈驰,马红霞,赵延帅.基于分类分级的数据资产安全管控平台设计与实现[J].计算机应用,2016,36(A01):265-268. 被引量：18
8马志程,顾凯成,杨鹏.基于文本分类的电企舆情识别方案设计与实现[J].电子设计工程,2017,25(3):28-31. 被引量：4
9顾斌,彭涛,车伟.基于词典扩充的电力客服工单情感倾向性分析[J].现代电子技术,2017,40(11):163-166. 被引量：6
10董娜,刘伟娜,侯波涛.基于大数据的网络异常行为建模方法[J].电力信息与通信技术,2018,16(1):6-10. 被引量：8

引证文献2

1杨波,王琼,杨仕博.面向智能电网的文本分类研究综述[J].电子技术与软件工程,2020(17):198-200. 被引量：2
2周亮,张晓娟,邱意民,朱亚运,缪思薇,姜琳.电力数据分类分级方法研究[J].电力信息与通信技术,2023,21(4):25-30. 被引量：3

二级引证文献5

1花洁,李伟.基于人工神经网络的电网负荷数据分类方法[J].能源与环保,2022,44(2):264-269. 被引量：2
2彭茜,王爱娟,李峻阳,刘万平.基于高效遗传算法的电网需求侧调度优化研究及其收敛性分析[J].电力系统保护与控制,2022,50(6):33-42. 被引量：22
3何培颖,傅晓菲,陈涵,吴凡,翁武仙,唐昭媛.基于数据安全提升的电力数据共享实践探索[J].山东电力高等专科学校学报,2023,26(6):64-67.
4冀智华,王瑞,张巧.基于特征分析的智能网联汽车数据分级方法研究[J].网络安全与数据治理,2024,43(4):67-70. 被引量：1
5尹亮,郭涛,马跃强.电力交易数据安全分类分级管理综述[J].工业信息安全,2024(4):68-75.

1董申.会计信息化对企业财务管理的影响[J].经济视野,2019,0(11):121-121.
2陆文.信息型产品介绍类商务文本的翻译策略[J].中华辞赋,2019,0(6):6-6.
3杨亚楠,赵文辉,张健,谭珅,张贝贝.基于多视图协同的政策文本可视化研究[J].数据分析与知识发现,2019,3(6):30-41. 被引量：5
4陶萌萌.“短视频+社交”新媒介语境下的内容传播趋向探讨[J].出版广角,2019(15):62-64. 被引量：13
5汪航,曾术益.对造船企业信息化推进工作的几点建议[J].现代工业经济和信息化,2019,9(8):53-55. 被引量：1
6张志远,李庭恩.基于自注意力机制的双向分层语义模型[J].计算机工程与设计,2019,40(9):2607-2613. 被引量：1
7王静.论电信企业内部审计信息化[J].会计师,2019,0(14):52-53.

湖北工业大学学报

2019年第4期

浏览历史

内容加载中请稍等...

基于深度学习的法院信息文本分类被引量：2

参考文献5

二级参考文献59

共引文献339

同被引文献19

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于深度学习的法院信息文本分类 被引量：2

参考文献5

二级参考文献59

共引文献339

同被引文献19

引证文献2

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于深度学习的法院信息文本分类被引量：2