基于深度学习的法律文书识别方法研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于深度学习的法律文书识别方法研究
孟昕
【期刊名称】《《电子科技》》
【年(卷),期】2019(032)012
【总页数】3页(P84-86)
【关键词】法律文书; 自然语言处理; 深度学习; 实体识别; LSTM; CRFs
【作者】孟昕
【作者单位】扬州大学广陵学院江苏扬州225000
【正文语种】中文
【中图分类】TN911.7; TP311
随着人工智能技术的发展,各行业均在经历着深刻的变革。
依托互联网技术优化高校大学生法律意识培养的方法是高校思想政治教育发展的必然趋势,高校应当善用互联网方式不断优化法治教育,提高法治教育的针对性和科学性。
近年来,法律文书的数量呈爆炸增长的趋势,建立数字化、结构化的法律文书知识库具有重要意义:(1)数字化的法律文书知识库可以向法律工作者提供智能化的检索服务,实现法律
文书的高效查找;(2)数字化、结构化的法律文书知识库可以利用人工智能技术实
现文书的简化,形成简约化报告,同时对文书进行智能化评估[1-3]。
数字化、结构化的法律文书知识库的建立需要依托于人工智能技术中的自然语言处理技术。
通过自然语言处理,快速识别法律文书中存在的客观实体,实现文书的结
构化拆解和分类,提升知识库建立的效率[4-6]。
基于以上分析,本文提出了基于深度学习技术的法律文书识别方法。
该方法可以通过对法律文书中语句的扫描,获取文书中的客观实体,实现法律文书的智能化识别[7]。
1 算法研究
1.1 LSTM单元结构
长短期记忆模型是一种特殊的卷积神经网络单元。
传统的神经元结构输出由S型激活函数作用于输入的线性组合构成,而LSTM网元用存储单元进行了替代,其结构如图1所示[8-9]。
图1 LSTM网元结构Figure 1. LSTM cell
由图1可以看出,LSTM的存储Cell结合了输入门、输出门和遗忘门。
其更新方法如下:
定义权重矩阵Wi,Wf,Wc,Wo,Ui,Uf,Uc,Uo,Vo;偏置矩阵bi,bf,bc,bo;t时刻的输出xt。
网元需要根据各种外因的作用更新t时刻的状态,在这一过程中还需引入更新值it和候选值同时可以得到遗忘门输出值ft
(1)
根据式(1)的结果,可以得到t时刻更新状态Ct
(2)
根据更新后的状态量,可以得到LSTM输出门的输出ht
ot=σ(Woxt+Uoht-1+VoCt+bo)ht=ot⊙tanh(Ct)
(3)
式中,σ为激活函数,本文使用的激活函数为Sigmoid函数。
1.2 LSTM实体识别架构
实体识别是自然语言处理研究的重要分支之一。
该技术可以识别出文章段落中具有特定含义的实体。
在海量的法律文书中,法务工作通常需要快速识别其中的某些特定实体,如当事人姓名、案由和审判机构等。
传统的实体识别需要依托于标注完备的样本数据,然后使用监督学习方法。
但法律文书资料中缺乏标注。
因此,需要采用启发式规则使用新的网络结构。
图2 深度学习网络Figure 2. Deep learning network
基于LSTM网元结构的深度学习网络,如图2所示。
从图2可以看出,本文使用的深度学习网络共有5层。
第一层是输入层,输入层将整句文本转化为单个的汉字;第二层为Embedding层,该层通过查表将汉字转化为机器可以处理的向量送入LSTM层,该层的输出xi可表示为
xi=vci-1⊕vci⊕vci+1⊕…⊕vci+1,i+2
(4)
在LSTM层中,通过LSTM网元式(3)的计算方法可以得到LSTM层的输出
hi=LSTM(xi)
(5)
经过LSTM层后,网络中的传递方式与一般的神经网络大致相同
(6)
其中,Pi是最终得到的预测结果标签集合。
2 算法实现
2.1 网络设置
对图2所示的网络结构的网络参数进行设置,相关参数的大小如表1所示。
表1数据集网络规模Table 1. Network parameter参数描述参数值词向量维度100LSTM层输出维度128全连接层输出维度64Batch层32
网络的Dropout速率设置为0.5,神经网络的迭代次数为20次。
在训练数据上,使用25篇已人工标注后的法律文书作为训练数据,其余55篇作为测试数据。
为
了比对本算法的性能,使用当前常用的CRFs[10]算法作为对比算法。
2.2 算法测试
为了衡量算法的性能,定义算法的准确率P=正确识别的实体数量/系统实体总量,召回率R=正确识别的实体数量/语料中对应类别的实体总数和F值:
(7)
表2~表4分别给出了两种算法在法律文书测试集中当事人姓名、案由和审判机构等的识别精度。
表2测试集中当事人姓名实体的识别测试结果Table 2. Identification test results of the name entity of the parties in the test set算法
PRFCRFs98.92%94.53%96.67LSTM99.30%94.60%96.89
表3测试集中案由实体的识别测试结果Table 3. Identification test results of
the entity in the centralized test case算法
PRFCRFs79.52%65.90%72.09LSTM92.58%74.77%82.73
表4测试集中审判机构实体的识别测试结果Table 4. Identification test results
of the entity of the centralized trial organization算法
PRFCRFs75.4%68.23%72.21LSTM87.48%76.50%81.62
从表2~表4可以看出,LSTM深度网络相较于CRFs网络在网络性能上有所提升。
具体体现在,对于当事人姓名实体的识别,两个算法均有较好的指标。
而对于案由和审判机构等的识别,LSTM算法在准确率、召回率和F上均有约10%的提升。
测试结果表明,本文提出的LSTM深度网络可以在法律文书实体的识别中取得比
现有算法更优的效果。
3 结束语
为了提升结构化、数字化法律文书知识库的建立效率,本文使用自然语言处理中的实体识别算法对法律文书中的重要结构性内容如:当事人姓名、案由和审判机构等,进行了自动化识别与分类。
文中使用人工标注的法律文书作为训练集对LSTM深
度学习网络进行训练。
测试结果表明,该方法可以取得较好的识别效果。
作为高校辅导员要解决好大学生对法治需要与法学教育不充分、不平衡之间的矛盾,结合互联网改变传统法治教育方式,保证了高校思想政治教育的质量和效果。
大学生法律意识的培养是对其人生观、世界观和价值观的培养,他们是社会主义法治国家建设和社会主义现代化建设的主力军。
只有加强对大学生法律意识的培养,运用法治思维以及法治方式处理问题,才能抵制社会上某些不良风气,弥补传统教育方法的不足。
参考文献
【相关文献】
[1] Sundar N G,Sunny A T.An efficient information extraction model for personal named entity[J].International Journal of Computer Trends & Technology,2013,4(3):446-449.
[2] Zhao X,Wu Y,Song G,et al.A deep learning model integrating FCNNs and CRFs for
brain tumor segmentation[J].Medical Image Analysis,2017,43(7):98-111.
[3] Lydia L,Bing Q,Yanyan Z,et al.A syntactic path-based hybrid neural network for negation scope detection[J].Frontiers of Computer Science,2018(3):56-63.
[4] Zhang M,Yu N,Fu G.A simple and effective neural model for joint word segmentation and POS tagging[J].IEEE ACM Transactions on Audio,Speech,and Language Processing,2018(5):17-31.
[5] Chuan-Long Y,Yue-Fei Z,Jin-Long F,et al.A deep learning approach for intrusion detection using recurrent neural networks[J].IEEE Access,2017(9):11-17.
[6] Wang Y,Lin X,Wu L,et al.Effective multi-query expansions: collaborative deep networks based feature learning for robust landmark retrieval[J].IEEE Transactions on Image
Processing,2017(6):31-38.
[7] Zhang Y,Zhang M,Liu Y,et al.Boost phrase-level polarity labelling with review-level sentiment classification[J].Computer Science,2015(4):46-53.
[8] Li S,Lin J,Li G,et al.Vehicle type detection based on deep learning in traffic
scene[J].Procedia Computer Science,2018,13(1):564-572.
[9] Huang Y,Liu X,Tian X,et al.Deep supervised dictionary learning for no-reference image quality assessment[J].Journal of Electronic Imaging,2018,27(2):1-9.
[10] Lv P,Zhong Y,Ji Z,et al.Unsupervised change detection based on hybrid conditional random field model for high spatial resolution remote sensing imagery[J].IEEE Transactions on Geoscience & Remote Sensing,2018(5):1-14.。