基于法律大数据的智能系统

Intelligence System Based on Big Data of Law

下载PDF

导出

摘要随着互联网规模的不断壮大,信息量正以前所未有的速度巨量增长着。在这个环境下,大数据应运而生。其法律数据呈现出数量大、速率快、多样化的特点。如何运用先进的方式对海量数据进行采集、处理以及分析显得尤为关键。提出了一套基于法律大数据的智能系统。该系统利用Scrapy网络爬虫采集判决文书和法律条目并使用正则和TF-IDF提取要素信息和文本关键字,实现多维度的文书分类检索功能,并结合Word2Vec与TF-IDF分析文章相似度,实现相关文书的内容推荐。 With the continuous development of the Internet,the amount of information is growing at an unprecedented rate leading to the big data age.The law data in big data age shows the character of large quantity,fast speed and diversification.It is particularly important to use advanced methods to collect,process and analyze massive data.This paper proposes an display system based on big data of law which could collect judgement documents law terms and the key elements and keywords through Scrapy framework and regular expression matching,TF-IDF respectively for achieving the categorization of query function from the aspect of territory and court,text keyword,case type or etc.The system also achieve the recommendation function of related documents by calculating the similarity of articles through Word2Vec and TF-IDF.

作者张健东 Zhang Jiandong

机构地区上海大学通信与信息工程学院

出处《工业控制计算机》 2020年第5期69-71,共3页 Industrial Control Computer

关键词法律大数据数据采集数据检索 Word2vec 内容推荐 big data of law data acquisition data-retrieval Word2Vec content recommendation

分类号 D910 [政治法律—法学] TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1左卫民.关于法律人工智能在中国运用前景的若干思考[J].清华法学,2018,12(2):108-124. 被引量：248
2唐明,朱磊,邹显春.基于Word2Vec的一种文档向量表示[J].计算机科学,2016,43(6):214-217. 被引量：145
3祝永志,荆静.基于Python语言的中文分词技术的研究[J].通信技术,2019,52(7):1612-1619. 被引量：59
4汪静,罗浪,王德强.基于Word2Vec的中文短文本分类问题研究[J].计算机系统应用,2018,27(5):209-215. 被引量：38

二级参考文献58

1张玉芳,彭时名,吕佳.基于文本分类TFIDF方法的改进与应用[J].计算机工程,2006,32(19):76-78. 被引量：121
2Baeza-Yates R,Ribeiro-Neto B.Modern Information Retrieval[M].New York:ACM press,1999.
3Manning C D,Schütze H.Foundations of Statistical NaturalLanguage Processing [M].Cambridge:MIT press,1999.
4Hwang M,Choi C,Youn B,et al.Word Sense Disambiguation Based on Relation Structure[C]∥International Conference on Advanced Language Processing and Web Information Technology.2008:15-20.
5Wang X,Mccallum A,Wei X.Topical N-Grams:Phrase andTopic Discovery,with an Application to Information Retrieval [C]∥IEEE International Conference on Data Mining.IEEE Computer Society,2007:697-702.
6Haruechaiyasak C,Jitkrittum W,Sangkeettrakarn C,et al.Im-plementing News Article Category Browsing Based on Text Categorization Technique [C]∥2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology.IEEE Computer Society,2008:143-146.
7Mikolov T,Sutskever I,Chen K,et al.Distributed Representations of Words and Phrases and their Compositionality [J].Advances in Neural Information Processing Systems,2013,26:3111-3119.
8Mikolov T,Chen K,Corrado G,et al.Efficient Estimation of Word Representations in Vector Space [C]∥ICLR 2013.2013.
9Joachims T.A Probabilistic Analysis of the Rocchio Algorithm with TFIDF for Text Categorization [M].Springer US,1997:143-151.
10Hinton G E.Learning distributed representations of concepts[C]∥Proceedings of CogSci.1986:1-12.

共引文献478

1韩希霖.自动化行政:风险、规范与救济[J].郑州师范教育,2023,12(6):34-40. 被引量：1
2张永亮,林盛浩,张洁玉.算法权力之规制:算法影响评估制度的生成及展开[J].证券法苑,2022(1):227-246. 被引量：2
3胡铭,宋灵珊.“人工+智能”:司法智能化改革的基本逻辑[J].浙江学刊,2021(2):12-23. 被引量：30
4马国洋.论刑事诉讼中人工智能证据的审查[J].中国刑事法杂志,2021(5):158-176. 被引量：26
5查云飞.行政裁量自动化的学理基础与功能定位[J].行政法学研究,2021(3):114-124. 被引量：71
6郝晶晶.智慧法院视阈下法官助理制度的改革路径[J].特区实践与理论,2021(2):42-48. 被引量：2
7刘智铭,王晓利.人机协同视阈下的民事案件繁简分流智能化模式建构[J].数字法治,2024(1):168-184.
8刘若男.司法人工智能的障碍分析与优化路径[J].网络信息法学研究,2021(2):27-48.
9王伟.从计算社会科学到计算法学:重新检视因果关系科学之范畴[J].网络信息法学研究,2020(1):191-214. 被引量：3
10王星译.刑事证明标准的规范功能与实践归宿[J].环球法律评论,2021,43(3):117-132. 被引量：21

1吴德佩.大数据技术在档案管理中的应用[J].数字技术与应用,2020,38(6):51-52. 被引量：2
2王秦,杨继凯,徐国辉,周丽霞.隧道全生命周期信息化实践与探索[J].江西公路科技,2020(2):83-86.
3刘国忠.省级政务信息资源共享体系建设探索[J].电脑知识与技术,2020,16(18):229-230.
4本期导读[J].现代电影技术,2020(7):3-3.
5陈艺专.引导学生有效阅读提升读后续写能力[J].英语教师,2020,20(13):174-177.
6杨佳乐,王俊豪,钱卫宁,罗轶凤.裁定文书中企业破产事件的自动化抽取[J].华东师范大学学报（自然科学版）,2020(4):88-97. 被引量：4
7高凡,李樊,张铭,王志飞,赵俊华.基于文本挖掘的高速铁路动车组故障多级分类研究[J].计算机测量与控制,2020,28(7):59-63. 被引量：3
8舒洪水.司法大数据文本挖掘与量刑预测模型的研究[J].法学,2020(7):113-129. 被引量：15
9高志刚,李程,李欢,王国松.近岸溢油漂移扩散预测方法研究——以胶州湾溢油事件为例[J].海洋通报,2020,39(2):272-280. 被引量：4

工业控制计算机

2020年第5期

浏览历史

内容加载中请稍等...

基于法律大数据的智能系统

参考文献4

二级参考文献58

共引文献478

相关作者

相关机构

相关主题

浏览历史