基于一种自适应突触学习的动态相关系数与相位同步分析
视网膜功能启发的边缘检测层级模型
视网膜功能启发的边缘检测层级模型郑程驰 1范影乐1摘 要 基于视网膜对视觉信息的处理方式, 提出一种视网膜功能启发的边缘检测层级模型. 针对视网膜神经元在周期性光刺激下产生适应的特性, 构建具有自适应阈值的Izhikevich 神经元模型; 模拟光感受器中视锥细胞、视杆细胞对亮度的感知能力, 构建亮度感知编码层; 引入双极细胞对给光−撤光刺激的分离能力, 并结合神经节细胞对运动方向敏感的特性, 构建双通路边缘提取层; 另外根据神经节细胞神经元在多特征调控下延迟激活的现象, 构建具有脉冲延时特性的纹理抑制层; 最后将双通路边缘提取的结果与延时抑制量相融合, 得到最终边缘检测结果. 以150张来自实验室采集和AGAR 数据集中的菌落图像为实验对象对所提方法进行验证, 检测结果的重建图像相似度、边缘置信度、边缘连续性和综合指标分别达到0.9629、0.3111、0.9159和0.7870, 表明所提方法能更有效地进行边缘定位、抑制冗余纹理、保持主体边缘完整性. 本文面向边缘检测任务, 构建了模拟视网膜对视觉信息处理方式的边缘检测模型, 也为后续构建由视觉机制启发的图像计算模型提供了新思路.关键词 边缘检测, 视网膜, Izhikevich 模型, 神经编码, 方向选择性神经节细胞引用格式 郑程驰, 范影乐. 视网膜功能启发的边缘检测层级模型. 自动化学报, 2023, 49(8): 1771−1784DOI 10.16383/j.aas.c220574Multi-layer Edge Detection Model Inspired by Retinal FunctionZHENG Cheng-Chi 1 FAN Ying-Le 1Abstract Based on the processing of visual information by the retina, this paper proposes a multi-layer model of edge detection inspired by retinal functions. Aiming at the adaptive characteristics of retinal neurons under periodic light stimulation, an Izhikevich neuron model with adaptive threshold is established; By simulating the perception ability of cones and rods for luminance and color in photoreceptors, the luminance perception coding layer is con-structed; By introducing the ability of bipolar cells for separating light stimulation, and combining with the charac-teristics of ganglion cells sensitive to the direction of movement, a multi-pathway edge extraction layer is constructed;In addition, according to the phenomenon of delayed activation of ganglion cell neurons under multi-feature regula-tion, a texture inhibition layer with pulse delay characteristics is constructed; Finally, by fusing the result of multi-pathway edge extraction with the delay suppression amount, the final edge detection result is obtained. The 150colony images from laboratory collection and AGAR dataset are used as experimental objects to test the proposed method. The reconstruction image similarity, edge confidence, edge continuity and comprehensive indicators of the detection results are 0.9629, 0.3111, 0.9159 and 0.7870, respectively. The results show that the proposed method can better localize edges, suppress redundant textures, and maintain the integrity of subject edges. This research is oriented to the task of edge detection, constructs an edge detection model that simulates the processing of visual information by the retina, and also provides new ideas for the construction of image computing model inspired by visual mechanism.Key words Edge detection, retina, Izhikevich model, neural coding, direction-selective ganglion cells (DSGCs)Citation Zheng Cheng-Chi, Fan Ying-Le. Multi-layer edge detection model inspired by retinal function. Acta Automatica Sinica , 2023, 49(8): 1771−1784边缘检测作为目标分析和识别等高级视觉任务的前级环节, 在图像处理和工程应用领域中有重要地位. 以Sobel 和Canny 为代表的传统方法大多根据相邻像素间的灰度跃变进行边缘定位, 再设定阈值调整边缘强度和冗余细节[1]. 虽然易于计算且快速, 但无法兼顾弱边缘感知与纹理抑制之间的有效性, 难以满足复杂环境下的应用需要. 随着对生物视觉系统研究的进展, 人们对视觉认知的过程和视觉组织的功能有了更深刻的了解. 许多国内外学者在这些视觉组织宏观作用的基础上, 进一步考虑神经编码方式与神经元之间的相互作用, 并应用于边缘检测中. 这些检测方法大多首先会选择合适的神经元模型模拟视觉组织细胞的群体放电特性, 再关联例如视觉感受野和方向选择性等视觉机制, 以不收稿日期 2022-07-14 录用日期 2022-11-29Manuscript received July 14, 2022; accepted November 29,2022国家自然科学基金(61501154)资助Supported by National Natural Science Foundation of China (61501154)本文责任编委 张道强Recommended by Associate Editor ZHANG Dao-Qiang1. 杭州电子科技大学模式识别与图像处理实验室 杭州 3100181. Laboratory of Pattern Recognition and Image Processing,Hangzhou Dianzi University, Hangzhou 310018第 49 卷 第 8 期自 动 化 学 报Vol. 49, No. 82023 年 8 月ACTA AUTOMATICA SINICAAugust, 2023同的编码方式将输入的图像转化为脉冲信号, 经过多级功能区块处理和传递后提取出图像的边缘. 其中, 频率编码和时间编码是视觉系统编码光刺激的重要方式, 在一些计算模型中被广泛使用. 例如,文献[2]以HH (Hodgkin-Huxley)神经元模型为基础, 使用多方向Gabor滤波器模拟神经元感受野的方向选择性, 实现神经元间连接强度关联边缘方向,将每个神经元的脉冲发放频率作为边缘检测的结果输出, 实验结果表明其比传统方法更有效; 文献[3]在 LIF (Leaky integrate-and-fire) 神经元模型的基础上进行改进, 引入根据神经元响应对外界输入进行调整的权值, 在编码的过程中将空间的脉冲发放转化为时序上的激励强度, 实现强弱边缘分类, 对梯度变化幅度小的弱边缘具有良好的检测能力. 除此之外, 也有关注神经元突触间的相互作用, 通过引入使突触的连接权值产生自适应调节的机制来提取边缘信息的计算方法. 例如, 文献 [4] 构建具有STDP (Spike-timing-dependent plasticity) 性质的神经元模型, 根据突触前后神经元首次脉冲发放时间顺序来增强或减弱突触连接, 对真伪边缘具有较强的辨别能力; 文献 [5] 则在构建神经元模型时考虑了具有时间不对称性的STDP机制, 再融合方向特征和侧抑制机制重建图像的主要边缘信息, 其计算过程对神经元突触间的动态特性描述更加准确.更进一步, 神经编码也被应用于实际的工程需要.例如, 文献 [6]针对现有的红外图像边缘检测算法中存在的缺陷, 构建一种新式的脉冲神经网络, 增强了对红外图像中弱边缘的感知; 文献 [7] 则通过模拟视皮层的处理机制, 使用包含左侧、右侧和前向3条并行处理支路的脉冲神经网络模型提取脑核磁共振图像的边缘, 并将提取的结果用于异常检测,同样具有较好的效果. 上述方法都在一定程度上考虑了视觉组织中神经元的编码特性以及视觉机制,与传统方法相比, 在对复杂环境的适应性更强的同时也有较高的计算效率. 但这些方法都未能考虑到神经元自身也会随着外界刺激产生适应, 从而使活动特性发生改变. 此外, 上述方法大多也只选择了频率编码、时间编码等编码方式中的一种, 并不能完整地体现视觉组织中多种编码方式的共同作用.事实上, 在对神经生理实验和理论的持续探索中发现, 视觉组织(以视网膜为例)在对视觉刺激的加工中就存在着丰富的动态特性和编码机制[8−9]. 视网膜作为视觉系统中的初级组织结构, 由多种不同类型的细胞构成, 共同组成一个纵横相连、具有层级结构的复杂网络, 能够针对不同类型的刺激性选择相应的编码方式进行有效处理. 因此, 本文面向图像的边缘检测任务, 以菌落图像处理为例, 模拟视网膜中各成分对视觉信息的处理方式, 构建基于视网膜动态编码机制的多层边缘检测模型, 以适应具有多种形态结构差异的菌落图像边缘检测任务.1 材料和方法本文提出的算法流程如图1所示. 首先, 根据视网膜神经元在周期性光刺激下脉冲发放频率发生改变的特性, 构建具有自适应阈值特性的Izhikevich 神经元模型, 改善神经元的同步发放能力; 其次, 考虑光感受器对强弱光和颜色信息的不同处理方式编码亮度信息, 实现不同亮度水平目标与背景的区分;然后, 引入固视微动机制, 结合神经节细胞的方向选择性和给光−撤光通路的传递特性, 将首发脉冲时间编码的结果作为双通路的初级边缘响应输出;随后, 模拟神经节细胞的延迟发放特性, 融入对比度和突触前后偏好方向差异, 计算各神经元的延时抑制量, 对双通路的计算结果进行纹理抑制; 最后,整合双通路边缘信息, 将二者融合为最终的边缘检测结果.1.1 亮度感知编码层构建神经元模型时, 本文综合考虑对神经元生理特性模拟的合理性和进行仿真计算的高效性, 以Izhikevich模型[10]为基础构建神经元模型. Izhike-vich模型由Izhikevich在HH模型的基础上简化而来, 在保留原模型对神经元放电模式描述的准确性的同时, 也具有较低的时间复杂度, 适合神经元群体计算时应用, 其表达式如下式所示v thv th 其中, v为神经元的膜电位, 其初始值设置为 −70; u为细胞膜恢复变量, 设置为14; I为接收的图像亮度刺激; 为神经元脉冲发放的阈值, 设置为30; a描述恢复变量u的时间尺度, b描述恢复变量u 对膜电位在阈值下波动的敏感性, c和d分别描述产生脉冲发放后膜电位v的重置值和恢复变量u的增加程度, a, b, c, d这4个模型参数的典型值分别为0.02、0.2、−65和6. 若某时刻膜电位v达到,则进行一次脉冲发放, 同时该神经元对应的v被重置为c, u被重置为u + d.适应是神经系统中广泛存在的现象, 具体表现为神经元会根据外界的刺激不断地调节自身的性质. 其中, 视网膜能够适应昼夜环境中万亿倍范围的光照变化, 这种适应能够帮助其在避免饱和的同时保持对光照的敏感性[11]. 研究表明, 视网膜持续1772自 动 化 学 报49 卷接受外界周期性光刺激时, 光感受器会使神经元细胞的活动特性发生改变, 导致单个神经元的发放阈值上升, 放电频率下降; 没有脉冲发放时, 对应阈值又会以指数形式衰减, 同时放电频率逐渐恢复[12].因此, 本文在Izhikevich 模型的基础上作出改进,加入根据脉冲发放频率对阈值进行自适应调节的机制, 如下式所示τ1τ2τ1τ2v th τ1v th τ2其中, 和 分别为脉冲发放和未发放时阈值变化的时间常数, 其值越小, 阈值变化的幅度越大, 神经元敏感性变化的过程越快; 反之, 则表示阈值变化的幅度越小, 神经元敏感性变化的过程也就越慢.生理学实验表明, 在外界持续光刺激下, 神经元对刺激产生适应导致放电频率降低后, 这种适应衰退的过程比产生适应的过程通常要长数倍[13]. 因此,为了在准确模拟生理特性的同时保证计算模型的性能, 本文将 和 分别设置为20和40. 这样, 当某时刻某个神经元产生脉冲发放时, 则对应阈值 根据 的值升高, 神经元产生适应, 活跃度降低; 反之, 对应阈值 根据 的值下降, 神经元的适应衰退, 活跃度提升. 实现限制活跃神经元的脉冲发放频率, 促进不活跃神经元的脉冲发放, 改善神经元群体的同步发放能力, 减少检测目标内部冗余. 图2边缘检测结果图 1 边缘检测算法原理图Fig. 1 Principle of edge detection algorithm8 期郑程驰等: 视网膜功能启发的边缘检测层级模型1773显示了改进前后的Izhikevich 模型对图像进行处理后目标内部冗余情况.0∼255为了规范检测目标图像的亮度范围, 本文将输入的彩色图像Img 各通路的亮度映射到 区间内, 如下式所示Img (;i )I (;i )其中, 和 表示经亮度映射前和映射后的R 、G 、B 三种颜色分量图像; max(·) 和min(·)分别计算对应分量图像中的最大和最小像素值.光感受器分两类, 分别为视锥细胞和视杆细胞[14], 都能将接收到的视觉刺激转化为电信号, 实现信息的编码和传递. 其中, 视锥细胞能够根据外界光刺激的波长来分解为三个不同的颜色通道[15].考虑到人眼对颜色信息的敏感性能有效区分离散目标与背景, 令图像中的每个像素点对应一个神经元,将R 、G 、B 三种颜色分量图像分别输入上文构建的神经元模型中, 在一定时间范围内进行脉冲发放,如下式所示fires (x,y ;i )其中, 为每个神经元的脉冲发放次数,函数Izhikevich(·)表示式(2)给出的神经元模型.视杆细胞对光线敏感, 主要负责弱光环境下的外界刺激感知. 当光刺激足够强时, 视杆细胞的感知能力达到饱和, 视觉系统转为使用视锥细胞负责亮度信息的处理[16]. 因此, 除了对颜色信息敏感外,视锥细胞对强光也有高度辨别能力. 考虑到作为检测对象的图像中, 目标与背景具有不同的亮度水平,本文构建一种综合视锥细胞和视杆细胞亮度感知能力的编码方法, 以适应目标与背景不同亮度对比的多种情况, 如下式所示I base I base (x,y )fires Res (x,y )其中, var(·) 计算图像亮度方差; ave(·) 计算图像亮度均值. 本文取三种颜色分量图像中方差最大的一幅作为基准图像 , 对于其中的像素值 ,将其中亮度低于平均亮度的部分设置为三种颜色分量脉冲发放结果的最小值, 反之设置为最大值, 最终得到模型的亮度编码结果 , 实现在图像局部亮度相对较低的区域由视杆细胞进行弱光感知, 亮度较高区域由视锥细胞处理, 强化计算模型对不同亮度目标和背景的区分能力, 凸显具有弱边缘的对象. 图3显示了亮度感知编码对存在弱边缘的对象的感知能力.1.2 基于固视微动的多方向双通路边缘提取层Img gray 人眼注视目标时, 接收的图像并非是静止的,而是眼球以每秒2至3次的微动使投射在视网膜上的图像发生持续运动, 不断地改变照射在光感受器上的光刺激[17]. 本文考虑人眼的固视微动机制,在原图像的灰度图像 上构建大小为3×3的微动作用窗口temp , 使窗口接收到的亮度信息朝8个方向进行微动, 如下式所示p i q i θi temp θi d x d y 其中, 和 是用于决定微动方向 的参数, 其值被设置为 −1、0或1, 通过计算反正切函数能够得到以45° 为单位、从0° 到315° 的8个角度的微动方向, 对应8个微动结果窗口 ; 和 分别表示水平和竖直方向的微动尺度; Dir 为计算得到(a) 原图(a) Original image (b) Izhikevich 模型(b) Izhikevich model (c) 改进的 Izhikevich 模型(c) Improved Izhikevich model图 2 改进前后的Izhikevich 模型对图像进行脉冲发放的结果对比图Fig. 2 Comparison of the image processing results of the Izhikevich model before and after improvement1774自 动 化 学 报49 卷Dir (x,y )的微动方向矩阵, 其中每个像素点的值为 ;sum(·) 计算窗口中像素值的和. 本文取每个微动窗口前后差异最大的方向作为该点的偏好方向, 分别用数字1 ~ 8表示.视网膜存在一类负责对运动刺激编码、具有方向选择性的神经节细胞 (Direction-selective gangli-on cells, DSGCs)[18]. 经过光感受器处理, 转化为电信号的视觉信息, 通过双极细胞处理后传递给神经节细胞. 双极细胞可分为由光照增强 (ON) 激发的细胞和由光照减弱 (OFF) 激发的细胞[19], 分别将信号输入给光通路 (ON-pathway)和撤光通路 (OFF-pathways) 两条并行通路[20], 传递给光运动和撤光运动产生的刺激. 而神经节细胞同样包括ON 和OFF 两种, 会对给光和撤光所产生的运动方向做出反应[21]. 因此, 本文构造5×5大小的对特定方向微动敏感的神经节细胞感受野窗口, 将其对偏好方向和反方向微动所产生的响应分别作为给光通路和撤光通路的输入. 以偏好方向为45° 的方向选择性神θi fires Res S xy ∗通过上述定义, 可以形成以45° 为单位、从0°到315° 的8个方向的感受野窗口, 与上文 的8个方向对应. 之后本文在亮度编码结果 上构筑与感受野相同大小的局部窗口 , 根据最优方向矩阵Dir 对应窗口中心点的方向, 取与其相同和相反方向的感受野窗口和亮度编码结果进行卷积运算 (本文用符号 表示卷积运算), 分别作为ON 和OFF 通道的输入, 如下式所示T ON T OFF 考虑到眼球微动能够将静止的空间场景转变为视网膜上的时间信息流, 激活视网膜神经元的发放,同时ON 和OFF 两通路也只在光刺激的呈现和撤去的瞬时产生电位发放, 因此本文采用首发脉冲时间作为编码方式, 将 和 定义为两通路首次脉冲发放时间构成的时间矩阵, 并作为初级边缘响应的结果. 将1个单位的发放时间设置为0.25, 当总发放时间大于30时停止计算, 此时还未进行发放的神经元即被判断为非边缘.1.3 多特征脉冲延时纹理抑制层视网膜神经节细胞在对光刺激编码的过程中,外界刺激特征的变化会显著影响神经元的反应时间. 研究发现, 当刺激对比度增大时, 神经元反应延时会减小, 更快速地进行脉冲发放; 反之, 则反应延时增大, 抑制神经元的活性[22]. 除此之外, 方向差异也会影响神经元活动, 突触前后偏好方向相似的神经元更倾向于优先连接, 在受到外界刺激时能够更快被同步激活[23]. 因此, 本文引入视网膜的神经元延时发放机制, 考虑方向和对比度对神经元敏感性的影响, 构造脉冲延时抑制模型. 首先结合局部窗口权重函数计算图像对比度, 如下式所示ω(x i ,y i )其中, 为窗口权重函数, L 为亮度图像, Con(a) 原图(a) Original image (b) Izhikevich 模型(b) Izhikevich model (c) 改进的 Izhikevich 模型(c) Improved Izhikevich model (d) 亮度感知编码(d) Luminance perception coding图 3 不同方式对存在弱边缘的菌落图像的处理结果Fig. 3 Different ways to process the image of colonies with weak edges8 期郑程驰等: 视网膜功能启发的边缘检测层级模型1775S xy x i y i µ=∑x i ,y i ∈S xy ω(x i ,y i )为对比度图像, 为以(x , y )为中心的局部窗口,( , ) 为方窗中除中心外的周边像素, ws 为局部方窗的窗长, . 之后考虑局部方窗中心神经元和周边神经元方向差异, 同时用高斯函数模拟对比度大小与延时作用强度之间的关系, 构建脉冲延时抑制模型, 如下式所示D Dir (x,y )D Con (x,y )D (x,y )∆Dir (x i ,y i )min {|θ(x i ,y i )−θ(x,y )|,2π−|θ(x i ,y i )−θ(x,y )|}δ其中, 和 分别表示方向延时抑制量和对比度延时抑制量; 为计算得到的综合延时抑制量; 为突触前后神经元微动方向的差异, 被定义为 ; 用于调节对比度延时抑制量.T ON T OFFRes ON Res OFF 将上文计算得到的两个时间矩阵 和 中进行过脉冲发放的神经元与综合延时抑制量相加, 同样设置1个单位的发放时间为0.25, 将经延时作用后总发放时间大于30的神经元设置为不发放, 即判定为非边缘, 反之则判定为边缘. 根据式(19)和式(20) 得到两通道边缘检测结果 和. 最后, 将两通道得到的结果融合, 得到最终边缘响应结果Res ,如下式所示2 算法流程基于视网膜对视觉信息的处理顺序和编码特性, 本文构建图4所示的算法流程, 具体步骤如下:1) 根据视网膜在外界持续周期性光刺激下产生的适应现象, 在式(1)所示的Izhikevich 模型上作出改进, 构建如式(2)所示的具有自适应阈值的Izhikevich 模型.2) 根据式(3)将作为检测目标的图像映射到0 ~ 255区间规范亮度范围, 接着分离3种通道的颜色分量, 根据式(4)输入到改进的Izhikevich 模型中进行脉冲发放.3) 根据式(5)的方差计算提取出基准图像, 再结合基准图像根据式(6)对三通道脉冲发放的结果进行亮度感知编码, 得到亮度编码结果.4) 考虑人眼的固视微动机制, 根据式(7)和式(8)通过原图的灰度图像提取每个神经元的偏好方向, 得到微动方向矩阵, 接着根据式(9)和式(10)构筑8个方向的方向选择性神经节细胞感受野窗口.5) 根据式(11)和式(12), 将感受野窗口与亮度编码图像作卷积运算, 并输入Izhikevich 模型中得到ON 和OFF 通路的首发脉冲时间矩阵, 作为两通道的初级边缘响应.6) 根据式(13) ~ 式 (15), 结合局部窗口权重计算图像对比度.7) 考虑对比度和突触前后偏好方向对脉冲发放的延时作用, 根据式(16) ~ 式 (18)构建延时纹理抑制模型, 并根据式(19)和式(20)将纹理抑制模型和两通道的初级边缘响应相融合.8) 根据式(21)将两通路纹理抑制后的结果在神经节细胞处进行整合, 得到最终边缘响应结果.3 结果为了验证本文方法用于菌落边缘检测的有效性, 本文选择Canny 方法和其他3种同样基于神经元编码的边缘检测方法作为横向对比, 并进行定性、定量分析. 首先, 选择文献[4]提出的基于神经元突触可塑性的边缘检测方法(Synaptic plasticity model, SPM), 用于对比本文方法对弱边缘的增强效果; 其次, 选择文献[24]提出的基于抑制性突触的多层神经元群放电编码的边缘检测方法 (Inhibit-ory synapse model, ISM), 验证本文的延时抑制层在抑制冗余纹理方面的有效性; 然后, 选择文献[25]提出的基于突触连接视通路方向敏感的分级边缘检测方法(Orientation sensitivity model, OSM), 对比本文方法在抑制冗余纹理的同时保持边缘提取完整性上的优势; 最后, 还以本文方法为基础, 选择去除亮度感知编码后的方法(No luminance coding,NLC)作为消融实验, 以验证本文方法模拟光感受器功能的亮度感知编码模块的有效性.本文使用实验室在微生物学实验中采集的菌落图像和AGAR 数据集[26]作为实验对象. 前者具有丰富的颜色和形态结构, 用于检验算法对复杂检测环境的适应性; 后者则存在更多层次强度的边缘信息, 菌落本身与背景的颜色和亮度水平也较为相近,用于检测算法对颜色、亮度特征和弱边缘的敏感性.本文通过局部采样生成150张512×512像素大小的测试图像, 其中38张来自实验室采集, 112张来自AGAR 数据集. 然后分别使用上文的6种边缘1776自 动 化 学 报49 卷检测算法提取图像边缘, 使每种算法得到150张边缘检测结果, 其中部分检测结果如图5所示.定性分析图5可知, Canny 、SPM 和ISM 方法在Colony4和Colony5等存在弱边缘的图像中往往会出现大面积的边缘丢失. OSM 方法对弱边缘的敏感性强于以上3种方法, 但仍然会出现不同程度的边缘断裂, 且在调整阈值时难以均衡边缘连续性和目标菌落内部冗余. NLC 方法同样丢失了Colony4和Colony5中几乎所有的边缘, 对于Colony3也只能检出其中亮度较低的菌落内部, 对于梯度变化不明显的边缘辨别力差. 与其他方法相比, 本文方法检出的边缘更加显著且完整性更高, 对于弱边缘也有很强的检测能力, 在Colony3、Colony4和Colony5等存在多层次水平强弱边缘的菌落图像中能够取得较好的检测结果. 为了对检测结果进行定量分析并客观评价各方法的优劣, 计算边缘图像重建相似度MSSIM [27]对检测结果进行重建, 并计算重建图像与原图像的相似度作为边缘定位的准确性RGfires (R)fires (G)亮度编码结果Luminance codingresult方差计算Variance1 2 3ON-result对比度Contrast脉冲延时抑制量Neuron spiking delay感受野窗口感受野窗口DSGC templateOFF-通路输出OFF-result 5)6)7)图 4 边缘检测算法流程图Fig. 4 The procedure of edge detection algorithm8 期郑程驰等: 视网膜功能启发的边缘检测层级模型1777图 5 Colony1 ~ Colony5的边缘检测结果(第1行为原图; 第2行为Canny 检测的结果; 第3行为SPM 检测的结果; 第4行为ISM 检测的结果; 第5行为OSM 检测的结果; 第6行为NLC 检测的结果; 第7行为本文方法检测的结果)Fig. 5 Edge detection results of Colony1 to Colony5 (The first line is original images; The second line is the results of Canny; The third line is the results of SPM; The fourth line is the results of ISM; The fifth line is the results of OSM;The sixth line is the results of NLC; The seventh line is the results of the proposed method)1778自 动 化 学 报49 卷指标. 首先对检测出的边缘图像做膨胀处理, 之后将原图像上的像素值赋给膨胀后边缘的对应位置,得到的图像记为ET , 则边缘重建如下式所示T k ET d k 其中, 为图像 上3×3窗口中8个方向的周边像素, 为窗口中心像素点与周边像素的距离, 计算得到重建图像R . 重建图像的相似度指标如下式所示µA µB σA σB σAB 其中, 和 为原图像和重建图像的灰度均值, 和 为其各自的标准差, 为原图像与重建图像之间的协方差. 将原图像和重建图像各自分为N 个子图, 并分别计算相似度指标SSIM , 得到平均相似度指标MSSIM . 除此之外, 为了验证边缘检测方法检出边缘的真实性和对菌落内部冗余纹理的抑制能力, 本文计算边缘置信度BIdx [28], 根据边缘两侧灰度值的跃变程度判断边缘的真伪. 边缘置信度指标如下式所示σij E (x i k ,y ik )(x i ,y i )d i其中, 为边缘像素在原图像对应位置的邻域标准差, EdgeNum 为边缘像素数量. 另外, 本文进一步计算边缘连续性 CIdx [29]来验证检出目标的边缘完整性. 首先将得到的边缘图像E 分割为m 个区域, 分别计算每个区域中的边缘像素 到其空间中心 的距离 ,则连续性指标如下式所示c i k C i n i 其中, 为边缘连续性的贡献值, D 为阈值, 为第i 个区域的像素点的连续性贡献值之和,为第i 个区域边缘像素点数量. 最后, 将计算得到的3个指标根据下式融合, 得到综合评价指标EIdx [21]其中, row 和col 分别为原图像的行数和列数. 于是, 检测图像的各项性能指标如表1 ~ 表5所示, 图像重建的结果如图6所示.表 1 不同检测方法下的重建相似度MSSIM Table 1 MSSIM of different methodsSerial number MSSIMCanny SPMISMOSMNLC本文方法Colony10.74520.77250.83570.92650.91750.9371Colony20.79510.79710.84900.95280.94470.9725Colony30.85760.86620.83140.91490.83370.9278Colony40.96900.98270.98380.98870.98930.9972Colony50.96340.97580.97800.97710.98830.9933表 2 不同检测方法下的边缘置信度BIdx Table 2 BIdx of different methodsSerial number BIdxCanny SPMISMOSMNLC本文方法Colony10.49880.46180.43070.58010.50580.6026Colony20.18210.15370.15530.33650.46150.4479Colony30.19830.15100.16100.26340.12630.3257Colony40.16310.14880.19060.14370.15210.2016Colony50.16200.18960.19020.18820.17350.1654表 3 不同检测方法下的边缘连续性CIdxTable 3 CIdx of different methodsSerial numberCIdxCanny SPMISMOSMNLC本文方法Colony10.83770.85300.86010.86760.97490.9652Colony20.80690.86550.85330.82930.91770.9518Colony30.80640.74080.72930.82690.77640.9406Colony40.81430.86110.90440.84300.90150.9776Colony50.90470.84480.86320.85920.87090.95718 期郑程驰等: 视网膜功能启发的边缘检测层级模型1779。
动画短片制作的参考文献
以下是一些动画短片制作的参考文献:1. 胡西伟. 基于三维动画与虚拟现实技术的理论研究[D]. 武汉大学,2005。
2. 王欣东. 数字艺术三个发展阶段之时间划分探析[J]. 影视技术,2011(3)。
3. 卢风顺,宋君强,银福康. CPU/GPU 协同并行计算研究综述[J]. 自然科学总论,2011(3).4. Nickolls J,Dally W J. The GPU Computing Era[J]. IEEE Computing Society,IEEE Micro,2010(5-6)。
5. Sanders J,Kandrot E. CUDA by Example-An Introduction to General-Purpose GPU Programming[M]. Addison-Wesley,2010(8-11)。
6. 方旭东. 面向大规模科学计算的CPU-GPU 异构并行技术研究[D]. 国防科学技术大学研究生院,2009。
7. 岳俊,邹进贵,何豫航. 基于CPU 与GPU/CUDA 的数字图像处理程序的性能比较[J]. 地理空间信息,2012(4)。
8. 张舒,褚艳利. GPU 高性能运算之CUDA[M]. 中国水利水电出版社,2009(14-120)。
9. Parent R. Computer Animation-Algorithms and Techniques[M]. Academic Press,2002(2-31)。
10. 徐鹏. 软件开发模型在三维动画模型制作中的应用[D]. 上海复旦大学软件学院,2009。
11. 刘姚新. 基于GPU 的实时绘制算法研究[D]. 重庆大学,2007。
12. Luebke D,Reedy M,Cohen J D,et al. Level of Detail for 3D Graphics[M]. Morgan Kaufmann Publisher,2003(P3-83)。
基于Swin_Transformer的岩石岩性智能识别研究
现代电子技术Modern Electronics Technique2024年4月1日第47卷第7期Apr. 2024Vol. 47 No. 70 引 言岩石识别是地质调查的基础性工作。
在野外地质调查中,地质工作者会根据岩石的颜色、结构构造、矿物成分等辨识岩石的岩性。
随着计算机视觉和深度学习技术的飞速发展,岩石纹理图像的自动识别和分类已经成为地质学中一个热门的研究方向。
近年来,许多国际和国内的研究团队都投入大量的精力进行此类研究,以期获得更高的识别精度和更稳健的分类效果[1]。
自AlexNet [2]在ImageNet [3]上取得重大突破后,卷积神经网络(Convolutional Neural Network, CNN )[4]便一直引领着计算机视觉领域的研究。
随着深度学习的发展,各种卷积神经网络在岩石识别分类方面取得显著进展。
卷积运算可以有效地替代人工提取特征的方法,从而更准确地获取图像纹理与色彩中的岩石图像信息,精准识别岩石类型。
文献[5]基于Iception⁃v3深度卷积神经网基于Swin Transformer 的岩石岩性智能识别研究韩鑫豪1,2, 何月顺1, 陈 杰1,2, 熊凌龙1,2, 钟海龙1, 杜 萍1, 田 鸣3(1.东华理工大学 信息工程学院, 江西 南昌 330013;2.江西省放射性地学大数据技术工程实验室, 江西 南昌 330013;3.郑州市公安局网监支队, 河南 郑州 450000)摘 要: 常规卷积神经网络在识别纹理多变的岩石图像时,由于感受野和局部处理方式的局限性,识别精度不高,为解决上述问题,在复杂情况下准确识别岩石岩性,提高地质调查的效率,文中提出一种基于改进Swin Transformer 的岩石识别方法。
该方法增加了空间局部感知模块,并结合Transformer 的自注意力结构来增强对局部相关性的提取。
为增强泛化,模型中添加了Dropout 层,减少对单神经元的依赖。
山东大学学报(工学版)总目次
第6期第50卷总目次山东大学学报(工学版)第50卷2020 年总目次机器学习与数据挖掘基于域对抗网络和B E R T 的跨领域文本情感分析...............基于V i B e 算法运动特征的关键帧提取算法......................自适应属性选择的实体对齐方法.............................基于门控循环单元与主动学习的协同过滤推荐算法...........基于异质集成学习的虚假评论检测..........................一种使用并行交错采样进行超分辨的方法....................基于校正神经网络的视频追踪算法...........................基于改进Y O L O v 3的复杂场景车辆分类与跟踪..................基于混合决策的改进鸟群算法..............................一种基于深度神经网络的句法要素识别方法..................基于多维相似度和情感词扩充的相同产品特征识别...........符号序列的L D A 主题特征表示方法 .........................基于元图归一化相似性度量的实体推荐.......................基于Laplacian 支持向量机和序列信息的m i c r o R N A -结合残基预测 基于三维剪切波变换和B M 4D 的图像去噪方法................................蔡国永,林强,任凯琪(1-1)……李秋玲,邵宝民,赵磊,王振,姜雪(1-8)……苏佳林,王元卓,靳小龙,程学旗(1-14)......陈德蕾,王成,陈建伟,吴以茵(1-21)…张大鹏,刘雅军,张伟,沈芬,杨建盛(2-1)........................朱安,徐初(2-10)...........陈宁宁,赵建伟,周正华(2-17).............宋士奇,朴燕,蒋泽新(2-27)闫威,张达敏,张绘娟,辛梓芸,陈忠云(2-34)......陈艳平,冯丽,秦永彬,黄瑞章(2-44)...................胡龙茂,胡学钢(2-50).............冯超,徐鲲鹏,陈黎飞(2-60).............张文凯,禹可,吴晓非(2-66).....................马昕,王雪(2-76)......张胜男,王雷,常春红,郝本利(2-83)基于预测数据特征的空气质量预测方法...................................................................................................高铭壑,张莹,张蓉蓉,黄子豪,黄琳焱,李繁菀,张昕,王彦浩(2-91)基于轻型卷积神经网络的火焰检测方法..........................严云洋,杜晨锡,刘以安,高尚兵(2-100)基于深度学习的洗衣机异常音检测..........................李春阳,李楠,冯涛,王朱贺,马靖凯(2-108)语义分析及向量化大数据跨站脚本攻击智检.....................................张海军,陈映辉(2-118)自然语言问答中的语义关系识别.....................一种Chirplet 神经网络自动目标识别算法..............基于G a b o r 特征的乳腺肿瘤M R 图像分类识别模型......基于U A R T 串口的多机通讯.............................基于多模态子空间学习的语义标签生成方法.........基于背景复杂度自适应距离阈值修正的S u B S E N S E 算法基于双重启发式信息求解影响最大化问题的蚁群算法…联合检测的自适应融合目标跟踪.....................基于核极限学习机自编码器的标记分布学习.........基于集成学习〇,的质量浓度预测模型................基于空间注意力和卷积神经网络的视觉情感分析..............................段江丽,胡新(3-1)......................李怡霏,郭尊华(3-8).........袁高腾,刘毅慧,黄伟,胡兵(3-15).............................马金平(3-24)田楓,李欣,刘芳,李闯,孙小强,杜睿山(3-31)...............成科扬,孙爽,詹永照(3-38)•…覃俊,李蔚栋,易金莉,刘晶,马懋德(3-45)...............刘保成,朴燕,宋雪梅(3-51).......王一宾,李田力,程玉胜,钱坤(3-58)..................彭岩,冯婷婷,王洁(4-1)............蔡国永,贺歆灏,储阳阳(4-8)• 2 ■山东大学学报(工学版)第50卷一种基于多目标的容器云任务调度算法...............基于卷积神经网络的深度线段分类算法................基于类激活映射-注意力机制的图像描述方法...........基于Bi -LSTM 的脑电情绪识别.........................带特征指标约束描述的设计模式分类挖掘..............基于NRC 和多模态残差神经网络的肺部肿瘤良恶性分类中文对话理解中基于预训练的意图分类和槽填充联合模型融合残差块注意力机制和生成对抗网络的海马体分割••…........................谢晓兰,王琦(4-14)..............赵宁宁,唐雪嵩,赵鸣博(4-22).....廖南星,周世斌,张国鹏,程德强(4-28)..................刘帅,王磊,丁旭涛(4-35).....肖卓宇,何锫,陈果,徐运标,郭杰(6-48)■•…霍兵强,周涛,陆惠玲,董雅丽,刘珊(6-59)........................马常霞,张晨(6-68)张月芳,邓红霞,呼春香,钱冠宇,李海芳(6-76)控制科学与工程基于空间隐患分布与运动意图解析的危险评估方法........一类非仿射非线性大系统的结构在线扩展.................GPRS 监管的多协议异构现场总线控制系统................基于新型趋近律的参数未知分数阶Rucklidge 系统的滑模同步分数阶Brussel 系统混沌同步的三种控制方案...............一类非线性混沌系统的自适应滑模同步...................含对数项分数阶T 混沌系统的滑模同步...................赵越男,陈桂友,孙琛,卢宁,譽立伟(1 -28)............曹小洁,李小华,刘辉(1-35)……侯鹏飞,孙竹梅,王琦,白建云(1-49).........王春彦,邸金红,毛北行(4-40).........................程春蕊(4-46)..................程春蕊,毛北行(5-1)..................孟晓玲,毛北行(5-7)土木工程含层状节理岩体力学性质数值模拟研究.......................................徐子瑶,虞松,付强(3-66)水泥土搅拌桩沿海软基处理..............................................吕国仁,葛建东,肖海涛(3-73)高地应力下砂岩力学参数和波速变化规律试验研究..............................宫嘉辰,陈士海(3-82)饱和地基中单排孔近场隔振的现场试验与数值分析智慧公路关键技术发展综述...................双节理岩体T B M 滚刀破岩过程数值模拟......基于熵值法的水利施工企业绩效考核K P I 设计方法偏压大跨小净距公路隧道施工力学行为..........基于B P 神经网络算法的结构振动模态模糊控制••砂土介质中颗粒浆液扩散距离变化规律........预应力中空棒构件设计与力学特性..............隐伏溶洞对隧道围岩稳定性影响规律及处治技术硬岩隧道纯钢纤维混凝土管片应用..............喷扩锥台压灌桩最优构造.......................松散地层隧道进洞段管棚注浆加固效应分析……孙连勇,时刚,崔新壮,周明祥,王永军,纪方,闫小东(3-88)................................吴建清,宋修广(4-52)施雪松,管清正,王文扬,许振浩,林鹏,王孝特,刘洁(4-70).........................................程森(4-80)........................................王春国(4-85)...........................王志伟,葛楠,李春伟(5-13)........................冯啸,夏冲,王凤刚,张兵(5-20).............................林超,张程林,王勇(5-26).....................陈禹成,王朝阳,郭明,林鹏(5-33)..............徐振,李德明,王彬,詹谷益,张世杰(5-44)...........李连祥,邢宏侠,李金良,黄亨利,王雷(6-82)...................余俊,翁贤杰,樊文胜,张连震(6-92)机械与能动工程柔性Rushton 桨的振动特性.........................................................刘欣,杨锋茶(5-50)湿法脱硫塔一维传热传质性能模型理论与试验.....................陈保奎,孙奉仲,高明,史月涛(5-56)波浪能发电装置浮体形状参数对俘能性能影响............刘延俊,王伟,陈志,王冬海,王登帅,薛钢(6-1)深拖地震线列阵的动力学建模与位置预报...................朱向前,魏峥嵘,裴彦良,于凯本,宗乐(6-9)淹没深度对三自由度波能浮子获能的影响........................黄淑亭,翟晓宇,刘延俊,史宏达(6-17)尾缘襟翼振荡水翼的水动力特性.................................孙光,王勇,谢玉东,陈晨,张玉兵(6-23)深海带电插拔连接器力学特性分析…韩家桢,王勇,谢玉东,王启先,张新标,高文彬,李荣兰,张传军(6-30) 振荡翼改进运动模型的能量捕获性能分析............................乔凯,王启先,王勇,谢玉东(6-40)第6期第50卷总目次电气工程能源消费发展及预测方法综述..............................杨明,杜萍静,刘凤全,郝旭鹏,孛一凡(1-56)基于物理不可克隆函数的电网NB-IoT端到端安全加密方案............................................................................................刘冬兰,刘新,陈剑飞,王文婷,张昊,马雷,李冬(丨-63)中央空调紧急控制应对受端电网直流闭锁故障研究.................................................................................................刘萌,程定一,张文,张恒旭,李宽,张国辉,苏建军U-72)风电爬坡事件的非精确条件概率预测..........................王勃,汪步惟,杨明,赵元春,朱文立(丨-82)考虑同步调相机无功特性的多馈入直流同时换相失败风险评估方法............................................................................................麻常辉,王亮,谭邵卿,卢奕,马欢,赵康(3-98)考虑路灯充电桩接入的城市配电网电压控制方法............宋士瞻,陈浩宇,张健,王坤,郝庆水(3-104)基于分时电价的含光伏的智慧家庭能量调度方法…潘志远,刘超男,李宏伟,王婧,王威,刘静,郑鑫(3-111)基于弹性梯度下降算法的B P神经网络降雨径流预报模型..........金保明,卢光毅,王伟,杜伦阅(3-117)基于学习理论的含光储联合系统的输电网双层规划……孙东磊,赵龙,秦敬涛,韩学山,杨明,王明强(4-90) 考虑内部动态约束的MMC功率运行区间的确定及控制方法……张锋,杨桂兴,岳晨晶,郝全睿,李东(4 - 9 8)虾米腰弯管内置导流板优化...................................祁金胜,曹洪振,石岩,杜文静,王湛(5-64)基于B P神经网络的短期光伏集群功率区间预测........孙东磊,王艳,于一潇,韩学山,杨明,闰芳晴(5-70)偏心方圆节扩散管数值模拟.................................曹洪振,祁金胜,袁宝强,杜文静,王湛(5-77)烟气成分对湿式电除尘器电晕放电特性的影响.................王磊,张玉磊,李兆东,张金峰,王翔(5-83)含电极式电锅炉的地区电网电源侧综合效益分析......葛维春,李昭,赵东,李振宇,叶青,傅予,于娜(5-90)基于特征频带相电流提取的故障选相和选线方法........................张贺军,王鹏,徐凯,石访(5-99)电动汽车虚拟储能可用容量建模.......................................李蓓,赵松,谢志佳,牛萌(6-101)基于RTDS的配电网一二次融合仿真技术...............李志,余绍峰,苏毅方,王蔚,蒋宏图,张伟(6-112)芒刺参数对电晕放电及细颗粒物脱除特性的影响............................王磊,李明臻,王翔(6-118)含不凝气蒸汽在锯齿形表面的凝结传热特性............................闫吉庆,王效嘉,田茂诚(6-129)化学与环境济南城区大气PM2.5、PM,。
融合犯罪构成的多任务判决预测
引文格式:杨书新,江斌,黄伟东.融合犯罪构成的多任务判决预测[J ].赣南师范大学学报,2023,44(3):55-61.融合犯罪构成的多任务判决预测*杨书新,江 斌,黄伟东†(江西理工大学信息工程学院,江西赣州 341000)摘 要:判决预测是人工智能技术在司法领域的一项重要应用.现有的研究大多聚焦案情描述预测判决结果,未充分利用法律中已有的犯罪构成信息.3个子任务中罪名和法条预测任务之间的关系更为密切,两者属于双向关联关系,刑期预测任务整体依赖于罪名和法条预测任务,如何有效利用这种任务关系建模有待进一步研究.文章针对这些问题,提出一种融合犯罪构成的多任务判决预测模型M J P -F C C (M u l t i -t a s k J u d g e m e n t P r e d i c t i o n F u s i n gC r i m e C o n s t i t u t i o n ).考虑到罪名和法条预测任务之间的密切关系,将二者视为一个整体预测任务,内部以硬参数共享的形式联合建模.为了充分利用犯罪构成信息来辅助罪名和法条预测,从犯罪构成中抽取关键词融入模型.为了能够学习到任务的依赖特征,进而提升刑期预测性能,将整体预测任务建模后的输出结果输入给刑期预测任务.在C A I L 2018数据集上开展实验,验证模型的有效性.关键词:判决预测;犯罪构成;多任务学习;特征融合中图分类号:T P 391.1 文献标志码:A 文章编号:2096-7659(2023)03-0055-070 引言判决预测主要基于案情描述预测审判结果,通常包括罪名㊁法条和刑期预测等3个子任务.作为司法审判的辅助工具,判决预测不仅可以提高审判效率,还能够减少人为的主观因素对案件结果的影响.早期的研究者主要使用统计学方法分析特定场景下的法律案例[1-2],这些方法虽然使得预测结果具有一定的可解释性,但难以适应真实的案件场景.随着机器学习和文本挖掘技术的出现,研究者开始将判决预测任务归为文本分类任务,这些研究[3-4]往往针对特定任务,严重依赖人工注释.近年来,随着神经网络的兴起,许多研究者开始将神经网络应用于判决预测任务,例如,Z HO N G 等[5]使用循环神经网络来构建基于拓扑顺序的判决预测框架.Y A N G 等[6]进一步设计一种带注意力机制的模型.L I 等[7]从案情描述中提取7种犯罪属性来区分易混淆罪名.Z HU 等[8]使用T r a n s f o r m e r -HA N (H i e r a r c h i c a l A t t e n t i o n N e t w o r k )模型结构来提高文本编码能力.X U 等[9]设计一种结合图神经网络的蒸馏模型来区分易混淆罪名.潘瑞东等[10]使用预训练模型B E R T (B i d i r e c t i o n a l E n c o d e r R e pr e s e n t a t i o n f r o m T r a n s f o r m e r s )来完成罪名和法条预测任务.L Y U 等[11]设计基于强化学习的框架来提取4种犯罪元素.韩晓晖等[12]引入法院观点生成任务来提高预测的可解释性.Z H A O 等[13]提出因果推断框架来学习因果关系.张晗等[14]提出融合法律文本多层结构信息来提高预测性能.现有的研究虽然取得一定的进展,但是仍面临如下挑战.现有的研究[5-7,9-10]大多聚焦案情描述信息预测判决结果,忽略了对法律中已有的犯罪构成信息的充分利用.法官在审理案件时,通常会同时考虑案件的事实描述和犯罪构成.犯罪构成是指该行为构成犯罪所必须具备的基本条件,它是确定该行为是否犯罪的标准.给定案件的事实描述,法官需要依据犯罪构成来认定适用的罪名和法条.只有当行为符合犯罪构成,才能构成犯罪.判决结果由所犯罪名㊁相关的法律条款和刑罚组成,审判时法官既可以根据已认定的具体罪名查找到相关的法条,也可以通过已认定的相关法条来确定具体的罪名,刑罚的确定直接受到具体的罪名和相关的法条共同影响.由此可知,三个任务之间存在关系,罪名和法条预测任务之间存在双向关联关系,刑期预测任务整2023年 赣南师范大学学报 ɴ.3第三期 J o u r n a l o f G a n n a n N o r m a l U n i v e r s i t y M a y .2023*收稿日期:2023-01-09 D O I :10.13698/j.c n k i .c n 36-1346/c .2023.03.010 基金项目:江西省教育厅青年项目(G J J 2200868);国家自然科学基金资助项目(72261018) 作者简介:杨书新(1978-),男,江西理工大学信息工程学院教授,博士,硕士生导师,研究方向:自然语言处理㊁社交网络分析. †通讯作者:黄伟东(1968-),男,江西理工大学信息工程学院副教授,研究方向:人工智能㊁机器视觉.Copyright ©博看网. All Rights Reserved.体依赖于罪名和法条预测任务.如何利用这种任务关系进行建模,将影响判决预测的性能.为解决上述问题,文章提出一种融合犯罪构成的多任务判决预测模型M J P -F C C .考虑到任务之间的关系,罪名和法条预测任务通过共享全部底层参数实现联合建模,具体来说,采用双向门控循环单元(B i d i r e c -t i o n a l G a t e d R e c u r r e n t U n i t ,B i G R U )和自注意力机制(S e l f -a t t e n t i o n)对案情描述编码,为了充分利用犯罪构成信息来辅助预测,采用词频-逆文档频率算法(t e r m f r e q u e n c y -i n v e r s e d o c u m e n t f r e q u e n c y,T F -I D F )从犯罪构成中抽取关键词,生成特征向量后融入模型.刑期预测任务中采用B E R T 和B i G R U 对案情描述编码,并与罪名和法条预测任务的输出进行融合,利用任务依赖关系来提高刑期预测的性能.在C A I L 2018数据集上进行实验,模型在罪名㊁法条㊁刑期预测任务上的M F 1值均高于基线模型,验证了模型的有效性.1 问题定义本节将介绍所研究问题的定义㊁相关术语以及符号表示.具体说明如下:定义1 案情描述.案情描述是对案件的事实描述,包括案件发生时间㊁地点㊁起因㊁经过㊁结果等信息.定义2 犯罪构成.法律概念,指该行为构成犯罪所必须具备的基本条件,是定罪量刑的法律标准.定义3 判决预测.本文研究的判决预测主要基于案情描述预测判决结果,包括罪名㊁法条㊁刑期预测.研究范围集中在刑事案件.输入有两组:案情描述㊁犯罪构成关键词.输出有三组:罪名㊁法条㊁刑期.因此,判决预测任务可以形式化表述为:F S ,C =^y 1,^y 2,^y 3 .其中S ㊁C 分别表示案情描述㊁犯罪构成关键词,^y 1㊁^y 2㊁^y 3分别表示预测的罪名㊁法条㊁刑期.图1 M J P -F C C 模型结构2 方法文章提出的融合犯罪构成的多任务判决预测模型M J P -F C C 的结构如图1所示,该模型可以分为2个模块:罪名和法条预测模块㊁刑期预测模块.本节将对这2个模块进行详细介绍.2.1 罪名和法条预测模块罪名和法条预测任务之间存在双向关联关系,为捕捉两者的关联信息,对罪名和法条预测任务进行联合建模.法官在认定罪名和法条时,能够根据案情描述中的重要信息来确定与案件相关的罪名和法条.考虑到任务特点和训练成本,因此,采用B i G R U 和S e l f -a t t e n t i o n 对案情描述编码,学习到案情描述的特征表示,并融入犯罪构成关键词,进而得到最终的编码表示.2.1.1 B i G R U -A t t e n t i o n 编码层与单向的G R U 模型相比,B i G R U 模型可以从前后两个方向更好地学习上下文之间的关系.因此,这里用B i G R U 模型来记忆上下文,学习上下文的词向量表示.首先使用j i e b a 分词工具对案情描述S 进行分词并去除停用词,然后采用W o r d 2Ve c 中的连续词袋模型(C o n t i n u o u s B a g -of -W o r d s ,C B OW )作为E m b e d d i ng 层将每个词转换成对应的词嵌入向量,最后得到嵌入表示x 1,x 2, ,x n ,n 为词的数量.词嵌入x i 通过B i G R U 层得到正向的隐层状态h i ң和反向的隐层状态h i ѳ,经加权求和得到最终的隐层状态h i .分别计算如下:65赣南师范大学学报 2023年Copyright ©博看网. All Rights Reserved.h i ң=G R U ңx i,(1)h i ѳ=G R U ѳx i,(2)h i =w i h i ң+v i h i ѳ+b i .(3)其中,w i 和v i 分别表示正向的隐层状态h i ң和反向的隐层状态h i ѳ所对应的权重,b i 表示偏置.于是案情描述的嵌入表示x 1,x 2,...,x n 进入B i G R U 后得到的隐层状态表示如下:h 1,h 2, ,h n =B i G R U x 1,x 2, ,x n.(4) 事实上,案情描述中出现的词对判决的重要程度不同.一般来说,在案情描述中被告人的具体行为以及由此导致的后果等信息对案件审判起到至关重要的作用,而案发时间和地点等信息相对来说重要程度较小.为体现每个词在案情描述中的重要程度,突出案情描述中的关键信息.将得到的H =h 1,h 2, ,h n 输入给S e l f -a t t e n t i o n,得到输出G h .计算公式如下:U =t a n h W u H +b u,(5)α=e x pU TU w ðn k =1e x pU TkU w ,(6)G h =ðnt =1αH .(7)其中,W u 和b u 分别是权重矩阵和偏置向量,U w 表示注意力矩阵,n 为词的数量,α是分配的概率权重.2.1.2 犯罪构成关键词的融入表1 部分犯罪构成关键词罪名犯罪构成关键词妨害公务工作人员㊁执行㊁职务㊁依法㊁阻碍㊁国家㊁行为人㊁暴力㊁构成㊁公务活动寻衅滋事公私㊁财物㊁损毁㊁情节恶劣㊁辱骂㊁任意㊁拦截㊁占用㊁造成危险物品肇事危险物品㊁规定㊁违反㊁重大事故㊁行为人㊁储存㊁物品㊁使用㊁造成㊁毒害性非法采矿采矿㊁开采㊁矿产资源㊁矿区㊁矿产㊁规定㊁矿种㊁国家㊁矿山企业㊁保护性开设赌场赌博㊁营利㊁行为㊁开设㊁网站㊁主体㊁赌具㊁社会风尚㊁利用网络㊁目的聚众斗殴殴斗㊁首要分子㊁社会公德㊁法纪㊁主体㊁藐视㊁参加者㊁构成㊁公然非法持有毒品毒品㊁行为人㊁持有㊁行为㊁贩卖㊁走私㊁制造㊁所有权㊁主观容留他人吸毒吸毒㊁容留㊁场所㊁提供㊁吸毒者㊁行为人㊁构成㊁烟馆㊁主观从犯罪构成中抽取关键词融入罪名和法条预测任务,旨在提高罪名和法条的预测性能.在中国找法网爬取罪名的犯罪构成,对每条犯罪构成,采用T F -I D F 算法抽取前10个关键词共同表示犯罪构成的核心语义.表1列出了抽取到的部分犯罪构成关键词.与得到案情描述的向量表示做法类似,犯罪构成关键词序列经E m b e d d i n g 层转换成对应的词嵌入K =k 1,k 2, ,k c ,c 为词的数量.通过1个全连接层和1个最大池化层,得到关键词的特征表示M ,与案情描述编码端的输出G h 拼接后得到P .经过一个全连接层后,将输出Q 作为编码器端最终的编码表示.计算公式如下:M =m a xs w i s h W k K +b k,(8)P =G h ;M ,(9)Q =s w i s h W p P +b p.(10)其中,W k 和b k 分别是第1个全连接层的权重矩阵和偏置向量,s w i s h (㊃)是激活函数,m a x (㊃)是最大池化层,W p 和b p 分别是第2个全连接层的权重矩阵和偏置向量.2.1.3 罪名和法条的标签预测使用全连接层作为分类器,使用s i gm o i d 激活函数将输出转化为罪名㊁法条的各类别预测概率:^y 1=s i g m o i d W 1Q +b 1,(11)^y 2=s i g m o i d W 2Q +b 2.(12)其中,W 1和b 1分别是罪名预测任务分类器的权重矩阵和偏置向量,W 2和b 2分别是法条预测任务分类器的权重矩阵和偏置向量,^y 1㊁^y 2分别表示罪名㊁法条的各类别预测概率.由于罪名和法条预测问题属于多标签分类问题,使用二分类交叉熵损失函数,即:L o s s =-ð2i =1λi ðY i j=1(y i ,j l o g 2^y i ,j +1-y i ,j l o g 21-^y i ,j ).(13)75第3期 杨书新,江 斌,黄伟东 融合犯罪构成的多任务判决预测Copyright ©博看网. All Rights Reserved.其中,y i ,j 和^y i ,j 分别是第i 个任务第j 类真实标签对应的o n e -h o t 编码和预测标签的概率,Y i ㊁λi 分别表示第i 个任务的标签总数和权重参数.为获得罪名预测标签,将罪名按刑法规定的10大犯罪类型进行分类,例如抢劫罪和抢夺罪同属于侵犯财产罪,通常抢劫罪和抢夺罪不会同时出现,因此,只保留同类型中概率值最大的罪名.再从中选择概率大于阈值τ1的罪名作为预测标签,若不存在,则只取概率最大的罪名作为预测标签.为获得法条预测标签,将所有预测概率大于阈值τ2的法条作为预测结果,若不存在,则只取概率最大的法条作为预测标签.2.2 刑期预测模块刑期预测任务相较于罪名和法条预测任务更加困难,因为刑期的认定不仅受到相关罪名和法条的影响,还与涉案金额㊁伤害程度等因素有关,这进一步要求模型要有很强的信息抽取和语义理解能力.因此,采用B E R T 和B i G R U 作为编码器,与罪名和法条预测任务中的输出Q 融合,采用全连接层作为分类器输出.2.2.1 B E R T -B i G R U 编码层B E R T 是一种由多层T r a n s f o r m e r 编码模块组成的预训练模型,可以通过在大规模语料库中学习到的语义表达迁移到判决预测中,提高语义表达准确度.B i G R U 模型可以进一步捕获上下文信息.将案情描述文本补齐或截断为固定长度l ,映射得到词嵌入e 1,e 2, ,e d,d 为词的数量.经过多层T r a n s f o r m e r 模块后得到输出t 1,t 2, ,t d.T r a n s f o r m e r 在图1中用T r m 表示.再输入给B i G R U ,得到张量n 1,n 2, ,n d.即:t 1,t 2, ,t d =B e r t e 1,e 2, ,e d,(14)n 1,n 2, ,n d =B i G R U t 1,t 2, ,t d.(15) 将罪名和法条预测任务联合建模得到的输出Q 作为输入,与N =n 1,n 2, ,n d 拼接得到V .即V =N ;Q .(16)2.2.2 刑期的标签预测使用全连接层作为分类器,使用s i gm o i d 激活函数将输出映射为刑期的各类别预测概率:^y 3=s i g m o i d W 3V +b 3.(17)其中,W 3和b 3分别是全连接层的权重矩阵和偏置向量,^y 3表示刑期的各类别预测概率.采用二分类交叉熵作为损失函数:L o s s =-ðYj =1(y j l o g 2^y j +1-y jl o g 21-^y j )(18)其中,y j 和^y j 分别是第j 类真实标签对应的on e -h o t 编码和预测标签的概率,Y 表示标签总数.将刑期划分为11个不重叠的区间,使刑期预测任务由回归任务转化为单标签分类任务,获得刑期的预测概率后,取概率最大的刑期作为预测标签.3 实验3.1 数据集采用公开的C A I L 2018数据集,主要由C A I L -s m a l l 和C A I L -b i g 2个子数据集组成.对C A I L -s m a l l 数据集进行清洗,去掉无效及错误标记等异常样本,保留不少于50个案例样本的罪名和法条类别.为验证模型在多罪名场景下的性能,对C A I L -b i g 数据集只保留多罪名样本,并从C A I L -s m a l l 数据集中提取多罪名样本进行补充,为便于区分,将清洗之后的数据集重命名为C A I L -m u l t i .在对2个数据集进行预处理后,按照8ʒ2的比例将每个数据集随机分成训练集和测试集,得到的数据集统计如表2所示.表2 数据集统计数据集C A I L -s m a l l C A I L -m u l t i 训练集16242685285测试集4060621321罪名类别172136法条类别164124刑期类别11113.2 实验设置在罪名和法条预测模块中,案情描述生成词嵌入向量时,词汇大小和词嵌入大小分别设置为8000㊁400;犯罪构成关键词生成词嵌入向量时,词汇大小和词嵌入大小分别为794㊁100;B i G R U 的隐藏单元大小为128,S e l f -a t t e n t i o n 的权重矩阵为32;采用A d a m 优化器,学习率参考其默认参数设为1ˑ10-3[15];参考文献[5],设置任务的权重参数λi 为1;按照多标签分类的通用设置,设固定阈值τ1㊁τ2均85赣南师范大学学报 2023年Copyright ©博看网. All Rights Reserved.为0.5.刑期预测模块中,B E R T 采用12层的T r a n s f o r m e r 结构,使用中文预训练权重c h i n e s e _L-12_H-768_A-12初始化参数;受到B E R T 能处理的文本最大长度限制,设置预处理后的案情描述文本长度l 为512;采用A d a m 优化器,学习率参考B E R T 的推荐参数设为2ˑ10-5[16].批处理大小为16,训练20轮,最后在测试集上进行性能评估.本实验采用的操作系统为W i n d o w s 10专业工作站版64位,处理器为I n t e l C o r ei 9-10900K ,内存32G B ,G P U 配置为N V I D I A G e F o r c e R T X 309024G B ,编程语言为p y t h o n 3.8,学习框架为t e n s o r f l o w 2.3.3.3 评价指标考虑到不同类别间样本不均衡,采用多分类问题常用的3个评价指标来评估模型的性能,分别是宏平均精确率(m a c r o -p r e c i s i o n ,M P )㊁宏平均召回率(m a c r o -r e c a l l ,M R )㊁宏平均F 1值(m a c r o -F 1,M F 1).其中,宏平均是指对应所有类别指标的平均值.主要参考指标为M F 1,值越高,表明模型的综合性能越好.MP =1n ðni =1P i =1n ðni =1T P i T P i +F P i,(19)M R =1n ðni =1R i =1n ðni =1T P i T P i +F N i,(20)M F 1=1n ðni =1F 1i =1n ðni =12P i R i Pi +R i .(21)其中,T P i ㊁F P i ㊁F N i 分别表示第i 个类别对应的真正样本数㊁假正样本数㊁假负样本数.P i ㊁R i ㊁F 1i 分别表示第i 个类别对应的精确率㊁召回率㊁F 1值.3.4 基线模型为验证模型的有效性,使用两类基线模型进行对比,一类是文本分类任务通用模型,如C N N ㊁G R U ㊁B i G R U ㊁H A N ;一类是专门针对判决预测任务提出的近几年具有代表性的模型,如T o pJ U D G E ㊁M P B F N -W C A ㊁L A D A N.分别采用多任务的训练方式完成判决预测任务.C N N[17]:该模型通过多个不同尺寸的卷积核来提取文本特征,捕捉局部相关性.G R U[18]:该模型是循环神经网络的一种变体,通过门控机制和记忆单元来理解长文本信息.B i G R U [19]:该模型是循环神经网络的一种变体,可以从前后两个方向学习上下文之间的关系.H A N[20]:以R N N 结构作为特征抽取器,采用注意力机制,从字词到句子两个层次对文本进行分析.T o pJ U D G E [5]:基于拓扑顺序构建的一种多任务判决预测模型.M P B F N-W C A [6]:基于拓扑顺序的带有反向结果验证的多任务判决预测模型.L A D A N [9]:结合图神经网络构建的一个蒸馏模型,能够提取相似罪名之间的区分特征.3.5 实验结果及分析在C A I L -s m a l l 和C A I L -m u l t i 2个数据集上进行实验,验证M J P -F C C 模型的有效性.3.5.1 性能对比从表3㊁表4可以看出,与其他基线模型相比,M J P -F C C 模型在C A I L -s m a l l 和C A I L -m u l t i 数据集上的3个任务的M F 1值最高,由此可知,M J P -F C C 模型综合性能好于基线模型.表3 在C A I L -s m a l l 数据集上的判决预测结果(%)模型罪名预测M P M R M F 1法条预测M P M R M F 1刑期预测M P M R M F 1C N N 80.6573.7775.5677.3269.8871.9135.5534.7033.57G R U83.8175.6578.2578.7570.7573.0737.4435.1434.91B i G R U 83.7776.8578.6779.7071.7474.0636.9835.7035.08HA N 80.9874.7376.4577.4871.1072.6938.5533.3133.16T o p J U D G E 80.6776.8477.5574.6572.7372.8938.4135.1135.15M P B F N -W C A 84.2177.6379.4376.8575.7774.8538.7636.1035.21L A D A N 84.2377.6579.8278.1075.8776.5739.1037.5338.13M J P -F C C85.6779.3882.3783.2575.7978.9843.8440.7742.1895第3期 杨书新,江 斌,黄伟东 融合犯罪构成的多任务判决预测Copyright ©博看网. All Rights Reserved.表4 在C A I L -m u l t i 数据集上的判决预测结果(%)模型罪名预测M P M R M F 1法条预测M P M R M F 1刑期预测M P M R M F 1C N N 84.8563.0570.5084.4166.8773.1237.5330.5331.66G R U84.6262.7770.4885.4066.5372.7732.3929.6230.26B i G R U 84.7264.2571.6485.0667.5273.6336.7430.3531.82HA N80.5559.2566.7078.2262.3267.6331.3130.6530.70T o pJ U D G E 84.1364.6971.6883.4067.6673.3233.6131.5432.20M P B F N -W C A 84.8665.1772.4781.0372.1474.7235.0432.1533.09L A D A N84.7965.3673.6585.4472.5477.3939.3534.5736.28M J P -F C C 84.9770.8676.7983.1274.4678.3939.9436.9238.27相比在通用模型中性能表现相对较好的B i G R U 模型,M J P -F C C 模型在C A I L -s m a l l 数据集上的罪名㊁法条㊁刑期预测任务的M F 1值分别提升了3.7%㊁4.92%和7.1%,在C A I L -m u l t i 数据集上分别提升了5.15%㊁4.76%和6.45%.原因是M J P -F C C 模型在判决预测任务上更具针对性,充分利用了多个模型的优点,弥补了单一模型的缺陷.与针对判决预测任务而设计的L A D A N 模型相比,M J P -F C C 模型在罪名和法条预测任务上的评价指标并非完全占优,但在刑期预测任务上全部优于L A D A N 模型,可能是因为L A D A N模型设计了图蒸馏结构来提取相似罪名的区分特征,M J P -F C C 模型由于融合了犯罪构成信息也起到了类似的效果,还由于利用了任务之间的依赖关系,在刑期预测方面性能表现更好.从具体子任务的角度来看,M J P -F C C 模型在2个数据集上的刑期预测任务上的性能表现与在其他2个任务上相比差距明显,原因是量刑受到被告人的认罪态度㊁社会的危害程度等多因素影响,这些影响因素没有体现在案情描述中,导致刑期预测困难.从数据集的角度来看,M J P -F C C 模型在C A I L -s m a l l 数据集上的性能表现好于C A I L -m u l t i ,可能的原因是C A I L -m u l t i 数据集全是多罪名样本,对模型的特征提取能力要求更高,相对更难预测.3.5.2 消融实验为评估犯罪构成关键词在罪名和法条预测任务中的作用,以及罪名和法条预测任务联合建模得到的输出Q 对刑期预测任务的影响,在C A I L -s m a l l 数据集上分别进行消融实验.结果分别如表5和表6所示.表5 在罪名和法条预测任务上做的消融实验(%)模型罪名预测M P M R M F 1法条预测M P M R M F 1M J P -F C C85.6779.3882.3783.2575.7978.98w /o K e yw o r d s 83.9177.5380.2081.0773.4276.09表6 在刑期预测任务上做的消融实验(%)模型刑期预测M P M R M F 1M J P -F C C43.8440.7742.18w /o Q41.8739.9440.91w /o K e yw o r d s w /o Q 分别表示未融合犯罪构成关键词㊁罪名和法条预测任务联合建模得到的输出Q 不输入给刑期预测任务.通过比较发现,融合犯罪构成关键词的M J P -F C C 模型比未融合时在罪名㊁法条预测任务的M F 1值分别提高了2.17%㊁2.89%,说明了犯罪构成关键词在罪名和法条预测任务上的有效性.Q 的输入使刑期预测任务的M F 1值提高了1.27%,说明模型学习到了任务的依赖特征.4 结束语为了充分利用犯罪构成信息以及任务关系,文章提出一种融合犯罪构成的多任务判决预测模型M J P -F C C ,通过硬参数共享的形式对罪名和法条预测任务联合建模,将犯罪构成关键词融入模型以提升罪名和法条预测的性能.为了学习刑期预测任务的依赖特征,将建模后的输出作为刑期预测任务的输入,以提高刑期预测的性能.实验结果验证了本方法的有效性.研究也存在一定的不足.首先,并未关注少样本类别预测,虽然在数据预处理中去除了少样本类别,但是依然存在不同类别间样本不均衡问题.其次,刑期预测的性能仍有很大的提升空间,未来将深入研究数罪并罚带来的量刑问题,尝试考虑更多的影响因素来提高刑期预测性能.6赣南师范大学学报 2023年Copyright ©博看网. All Rights Reserved.参考文献:[1] S E G A L J A.P r e d i c t i n g s u p r e m e c o u r t c a s e s p r o b a b i l i s t i c a l l y:T h e s e a r c h a n d s e i z u r e c a s e s ,1962-1981[J ].A m e r i c a n P o l i t i c a l S c i e n c e R e v i e w ,1984,78(4):891-900.[2] L A U D E R D A L E B E ,C L A R K T S .T h e s u p r e m e c o u r t 's m a n y m e d i a n j u s t i c e s [J ].A m e r i c a n P o l i t i c a l S c i e n c e R e v i e w ,2012,106(4):847-866.[3] L I U Y H ,C H E N Y L .A t w o -p h a s e s e n t i m e n t a n a l y s i s a p p r o a c h f o r j u d ge m e n t p r e d i c t i o n [J ].J o u r n a l of I n f o r m a t i o n S c i e n c e ,2018,44(5):594-607.[4] A L E T R A S N ,T S A R A P A T S A N I S D ,P R E O ŢI U C -P I E T R O D ,e t a l .P r e d i c t i n g j u d i c i a l d e c i s i o n s o f t h e e u r o pe a n c o u r t of h u m a n r igh t s :A n a t u r a l l a n g u a g e p r o c e s si n g p e r s p e c t i v e [J ].P e e r J C o m pu t e r S c i e n c e ,2016,2:e 93.[5] Z H O N G H ,G U O Z ,T U C ,e t a l .L e g a l j u d g m e n t p r e d i c t i o n v i a t o p o l o g i c a l l e a r n i n g [C ].P r o c e e d i n g s o f t h e 2018C o n f e r e n c e o n E m pi r i -c a l M e t h o d s i n N a t u r a l L a n g u a g e P r o c e s s i n g ,2018:3540-3549.[6] Y A N G W ,J I A W ,Z HO U X ,e t a l .L e g a l j u d g m e n t p r e d i c t i o n v i a m u l t i -p e r s p e c t i v e b i -f e e d b a c k n e t w o r k [C ].P r o c e e d i n gs o f t h e 28t h I n -t e r n a t i o n a l J o i n t C o n f e r e n c e o n A r t i f i c i a l I n t e l l i ge n c e ,2019:4085-4091.[7] L I S ,L I U B ,Y E L ,e t a l .E l e m e n t -a w a r e l e g a l j u d g m e n t p r e d i c t i o nf o r c r i m i n a l c a s e s w i t h c o n f u s i ng ch a r g e s [C ].P r o c e e di n gs o f t h e 2019I E E E 31s t I n t e r n a t i o n a l C o n f e r e n c e o n T o o l s w i t h A r t i f i c i a l I n t e l l i ge n c e ,2019:660-667.[8] Z HU K ,G U O R ,HU W ,e t a l .L e g a l j u d g m e n t p r e d i c t i o n b a s e d o n m u l t i c l a s s i nf o r m a t i o n f u s i o n [J ].C o m p l e x i t y,2020,2020:1-12.[9] X U N ,WA N G P ,C H E N L ,e t a l .D i s t i n g u i s h c o n f u s i n g l a w a r t i c l e s f o r l e g a l j u d g m e n t p r e d i c t i o n [C ].P r o c e e d i n gs o f t h e 58t h A n n u a l M e e t i n g o f t h e A s s o c i a t i o n f o r C o m p u t a t i o n a l L i n gu i s t i c s ,2020:3086-3095.[10] 潘瑞东,孔维健,齐洁.基于预训练模型与知识蒸馏的法律判决预测算法[J ].控制与决策,2022,37(1):67-76.[11] L Y U Y ,WA N G Z ,R E N Z ,e t a l .I m p r o v i n g l e g a l j u d g m e n t p r e d i c t i o n t h r o u gh r e i n f o r c e d c r i m i n a l e l e m e n t e x t r a c t i o n [J ].I n f o r m a t i o n P r o c e s s i n g &M a n a g e m e n t ,2022,59(1):102780.[12] 韩晓晖,王文同,宋连欣,等.基于有序多任务学习的司法二审判决预测方法[J ].中文信息学报,2022,36(3):162-172.[13] Z HA O Q ,G U O R ,F E N G X ,e t a l .R e s e a r c h o n a d e c i s i o n p r e d i c t i o n m e t h o d b a s e d o n c a u s a l i n f e r e n c e a n d a m u l t i -e x p e r t f t o p j u d ge m e c h a n i s m [J ].M a t h e m a t i c s ,2022,10(13):2281-2302.[14] 张晗,郑伟昊,窦志成,等.融合法律文本结构信息的刑事案件判决预测[J ].计算机工程与应用,2023,59(3):253-263.[15] K I N GMA D P ,B A J .A d a m :A m e t h o d f o r s t o c h a s t i c o p t i m i z a t i o n [C ].P r o c e e d i n g s o f t h e 3r d I n t e r n a t i o n a l C o n f e r e n c e o n L e a r n i n gR e p r e s e n t a t i o n s ,2015:1-15.[16] D E V L I N J ,C H A N G M-W ,L E E K ,e t a l .B e r t :P r e -t r a i n i n g o f d e e p b i d i r e c t i o n a l t r a n s f o r m e r s f o r l a n g u a g e u n d e r s t a n d i n g[C ].P r o -c e e d i n gs o f N A A C L -H L T 2019,2019:4171-4186.[17] K I M Y.C o n v o l u t i o n a l n e u r a l n e t w o r k s f o r s e n t e n c e c l a s s i f i c a t i o n [C ].P r o c e e d i n g s o f t h e 2014C o n f e r e n c e o n E m pi r i c a l M e t h o d s i n N a t -u r a l L a n g u a g e P r o c e s s i n g,2014:1746-1751.[18] C HO K ,V A N M E R R I ëN B O E R B ,G U L C E H R E C ,e t a l .L e a r n i n g p h r a s e r e p r e s e n t a t i o n s u s i n gr n n e n c o d e r -d e c o d e r f o r s t a t i s t i c a l m a -c h i n e t r a n s l a t i o n [C ].P r o c e e d i n g s o f t h e 2014C o n f e r e n c e o n E m p i r i c a l M e t h o d s i n N a t u r a l L a n g u a g e P r o c e s s i n g,2014:1724-1734.[19] Z HO U L ,B I A N X.I m p r o v e d t e x t s e n t i m e n t c l a s s i f i c a t i o n m e t h o d b a s e d o n b i g r u -a t t e n t i o n [J ].J o u r n a l o f P h y s i c s :C o n f e r e n c e S e r i e s ,2019,1345(3):032097.[20] Y A N G Z ,Y A N G D ,D Y E R C ,e t a l .H i e r a r c h i c a l a t t e n t i o n n e t w o r k s f o r d o c u m e n t c l a s s i f i c a t i o n [C ].P r o c e e d i n gs o f t h e 2016C o n f e r -e n c e o f t h e N o r t h A m e r i c a n C h a p t e r o f t h e A s s o c i a t i o n f o r C o m p u t a t i o n a l L i n g u i s t i c s :H u m a n L a n g u a g e T e c h n o l o gi e s ,2016:1480-1489.M u l t i -t a s k J u d g e m e n t P r e d i c t i o n F u s i n g Cr i m e C o n s t i t u t i o n Y A N G S h u x i n ,J I A N G B i n ,HU A N G W e i d o n g(S c h o o l o f I n f o r m a t i o n E n g i n e e r i n g ,J i a n g x i U n i v e r s i t y o f S c i e n c e a n d T e c h n o l o g y,G a n z h o u 341000,C h i n a )A b s t r a c t :J u d g m e n t p r e d i c t i o n i s a n i m p o r t a n t a p p l i c a t i o n o f a r t i f i c i a l i n t e l l i g e n c e t e c h n o l o g y i n t h e ju d i c i a l f i e l d .M o s t o f t h e e x i s t i n g s t u d i e s f o c u s o n c a s e d e s c r i p t i o n s t o p r e d i c t v e r d i c t o u t c o m e s ,b u t d o n o t t a k e f u l l a d v a n t a ge of t h e c r i m e c o n s t i t u -t i o n i n f o r m a t i o n a v a i l a b l e i n t h e l a w.A m o ng th e t h r e e t a s k s ,t h e c h a r g e a n d l a w a r ti c l e p r e d i c t i o n t a s k s a r e m o r e c l o s e l y re l a t -e d t o e a c h o t h e r ,a n d t h e y a r e b i -d i r e c t i o n a l l y r e l a t e d ,w h i l e t h e t e r m of p e n a l t y p r e d i c t i o n t a s k a s a w h o l e d e pe n d s o n t h e c h a r g e a n d l a w a r t i c l e p r e d i c t i o n t a s k s .H o w t o ef f e c t i v e l y u s e t h i s t a s k r e l a t i o n s h i p m o d e l i ng n e e d s f u r th e r r e s e a r c h .Ai m i n ga t t h e ab o v e p r o b l e m s ,t h i s p a p e r p r o p o s e s a m u l t i -t a s k j u d g m e n t p r e d ic t i o n m ode lf u s i ng cr i m e c o n s t i t u t i o n (M J P -F C C ).C o n -s i d e r i n g t h e c l o s e r e l a t i o n s h i p b e t w e e n t h e c h a r g e a n d l a w a r t i c l e p r e d i c t i o n t a s k s ,t h e t w o a r e c o n s i d e r e d a s a n o v e r a l l pr e d i c -t i o n t a s k a n d m o d e l e d j o i n t l y i n t e r n a l l y i n t h e f o r m o f h a r d p a r a m e t e r s h a r i n g.I n o r d e r t o m a k e f u l l u s e o f t h e c r i m e c o n s t i t u -t i o n i n f o r m a t i o n t o a s s i s t t h e c h a r g e a n d l a w a r t i c l e p r e d i c t i o n ,k e yw o r d s f r o m t h e c r i m e c o n s t i t u t i o n a r e e x t r a c t e d a n d f u s e d i n -t o t h e m o d e l .I n o r d e r t o b e a b l e t o l e a r n t h e t a s k -d e p e n d e n t f e a t u r e s a n d t h u s i m p r o v e t h e t e r m o f p e n a l t y pr e d i c t i o n p e r f o r m -a n c e ,t h e o u t p u t o f t h e o v e r a l l p r e d i c t i o n t a s k m o d e l e d i s f e d t o t h e t e r m o f p e n a l t y p r e d i c t i o n t a s k .E x pe r i m e n t s w e r e c a r r i e d o u t o n t h e C A I L 2018d a t a s e t t o v e r if y th e e f f e c t i v e n e s s o f t h e m o d e l .K e yw o r d s :j u d g m e n t p r e d i c t i o n ;c r i m e c o n s t i t u t i o n ;m u l t i -t a s k l e a r n i n g ;f e a t u r e f u s i o n 16第3期 杨书新,江 斌,黄伟东 融合犯罪构成的多任务判决预测Copyright ©博看网. All Rights Reserved.。
EEG信号瞬时同步性分析
EEG信号瞬时同步性分析从解剖学角度,人的大脑皮层被划分成若干区域。
研究脑皮层不同区域之间功能协作的机制一直是认知和神经科学关注的重要问题之一。
人在感知和识别物体时,相关的脑区自动发生了同步化的神经活动[1,2],而且,同步现象越来越被认识到是大脑不同区域之间交换信息的重要特征。
在临床医学中,神经学科医生发现,一些难以治愈的神经性疾病,如癫痫等,是由于大脑整体或局部整合过程的不足或异常造成的,这与相关脑区的同步性有关。
因此,越来越多的学者研究脑皮层不同区域之间的同步性,以求在一些神经性疾病的治疗上取得突破。
大脑认知活动会引起EEG信号在不同时段、不同频段的同步性变化。
因此,研究EEG信号在不同时段、不同频段的同步性是揭开大脑认知过程奥秘的重要手段。
研究信号同步性的方法大致可以分为两类:非参数化方法与参数化方法。
非参数化方法有互信息、小波变换、希尔伯特变换等,是以积分变换为基础的。
该类方法假定信号的自相关函数在数据观测区以外等于零,因此估计出来的功率谱很难与信号的真实功率谱相匹配,因而是一种低分辨率的谱估计方法。
比如,用下式计算相干系数: Cxy(ω)=(Fx)(ω)(Fy)*(ω)(1)式中:(Fx)表示傅里叶变换;ω只能是离散频率,频率分辨率则不太令人满意。
相对于基于积分变换的非参数化方法,参数化方法在这方面就优越很多。
在文献中,应用多种非参数化方法对本文第二部分中提到的三组数据的同步性进行了分析。
在众多参数化方法中,B.Schack等提出的一种基于ARMA模型的分析信号瞬时同步性算法是其中的翘首。
相对于非参数化方法,该基于ARMA模型的现代谱估计方法能较好地改善谱估计的质量,并提高频率分辨率。
这里应用该算法对三组EEG数据进行分析。
1 数据和方法1.1 数据这里应用上述算法分析两个EEG通道中的三组数据的同步性。
EEG信号由安置在雄性成年老鼠左右前额皮层的两个电极获取。
所有信号都以安置在小脑的电极作为参考,并且先经过1~100 Hz的滤波器滤波后,再以200 Hz的采样率采样得到。
基于spikes-LFP相关性的相位同步化研究
声与神经 元耦合 因素 , 验 证 了耦 合 噪声 神经 元 网 络 的 同步发 放 , 这 为进 一 步得 到相 位 同步 化 的模 型 打 下基础 。 加 J .S h e n和 Wa n g 建立 了一个简单 的整合 与
发放的脉冲神经元模型_ 2 , 配合 S T D P学习型神经
网络 , 模拟 了大 鼠海 马 中位 置细胞 关 于 相 位 的神 经编码 , 数值模 拟 结果 与 实验 对 照具 有很 高 的准确 率. 最近 Wa n g和 Z h a n g利 用 随机 相位 动 力 学 的方 法, 构造 了几类 神经 网络模 型 ] . 依据 文献 [ 1 9 , 2 O ] 所建 立的模型 , 在 网络的拓扑 结构发 生变化 的情 况下 , 对具有多 个 神经 元集 群 所构 成 的 网络 在 自发 运动和刺 激作用 下的相 同步运动和神 经编码 的演化
s p i k e s 在神 经 振 荡 的特 定 相 位 处 有 规 律 地 发 放 是
S u n和 Wa n g通过 时 间延迟 来 分析 两类 耦 合 离 散 时间网络之 间的内在 同步化 和外在 同步 化 . L u
和 Wa n g 在 运用 HR神经 元模 型 的基 础 上 ,加 入 噪
步化运 动能 够促进 s p i k e时 间相关 的可 塑性 ’ 埽 j .
对于 s p i k e 依 赖于时 间的可塑性具有 促进作 用. 高 发
放率细胞的 s p i k e s 会集中在 g a m m a 频段 中较窄的相
位 范围 内( 导 致高 S p i k e s . L F P相 关性 ) , 但 是低 发放 率 细胞的 s p i k e s 会 集 中在 t h e t a频 段 中较 宽 的相位
经颅交流电刺激(tACS):使大脑节律同步以提高认知能力
经颅交流电刺激(tACS):使大脑节律同步以提高认知能力展开全文认知功能障碍在许多神经精神障碍中很常见,严重影响生活质量。
同步电生理节律是塑造脑网络之间交流的核心机制,这些网络与神经精神障碍的认知能力有关。
本文回顾了一种名为经颅交流电刺激(tACS)的新兴神经调节技术,该技术通过调节节律网络的同步特性,在迅速改善人类认知的各个领域方面显示出早期效果。
未来的非侵入性神经调节研究有望改进大脑网络的活动模式,改善认知,为认知障碍患者开发无药物、基于环路的疗法奠定基础。
1 神经精神病学中的认知障碍认知领域的缺陷,如选择性注意、工作记忆和执行控制,是各种临床情况的症状性表现。
注意力缺陷疾病包括多动症(ADHD),精神分裂症,自闭症谱系障碍(ASD),以及焦虑和强迫症谱系障碍(OCD)。
工作记忆和执行功能改变在ADHD中表现为计划不周,在ASD中表现为缺乏灵活性,在重度抑郁障碍(MDD)中表现为决策和行动启动障碍,在强迫症和双相情感障碍中表现为动作抑制问题。
这些缺陷与其他缺陷的结合也很常见,例如精神分裂症。
鉴于认知障碍会导致现实世界中的残疾,是功能恢复的核心预测因子,了解导致这种障碍的机制并开发有效的干预措施是神经精神病学的关键。
虽然药物干预在神经精神康复方面相当成功,但它们在改善认知症状方面的益处有限。
因此,迫切需要针对认知功能障碍的创新干预方案。
本文聚焦经颅交流电刺激(tACS)这种非侵入性神经调节技术。
过去十年已经证明,tACS可以通过调节认知网络的节律性功能架构来改善各种认知功能。
特定的tACS刺激方案,可以通过处理脑区间的相位同步和跨频相位-振幅耦合(PAC)来改善认知功能。
本文简要回顾了节律性脑网络同步化在认知中的作用及其在精神障碍中的病变。
讨论了tACS方法学和假定的作用机制,并强调了几个提高严谨性和重复性的研究设计因素。
最后,回顾了tACS如何调节健康人的同步模式改善各种认知功能,这也涉及到精神疾病的临床应用。
用户评论方面级情感分析研究
用户评论方面级情感分析研究陈虹,杨燕+,杜圣东西南交通大学信息科学与技术学院,成都611756+通信作者E-mail:***************.cn 摘要:方面级情感分析是自然语言处理的热门研究方向之一,相比于传统的情感分析技术,基于方面的情感分析是细粒度的,能够判断句子中多个目标的情感倾向,能更加准确地挖掘用户对目标的情感极性。
针对以往研究忽略目标单独建模的问题,提出了一种基于双向长短期记忆神经网络(BiLSTM )的交互注意力神经网络模型(Bi-IAN )。
该模型通过BiLSTM 对目标和上下文分别进行建模,获得目标和上下文的隐藏表示,提取其中的语义信息。
接下来利用交互注意模块学习上下文和目标之间的注意力,分别生成目标和上下文的表示,捕捉目标和上下文之内和之间的相关性,并重构评价对象和上下文的表示,最终通过非线性层得到分类结果。
在数据集SemEval 2014任务4和Chinese review datasets 上的实验训练显示,在正确率和F 1-score 上,比现有的基准情感分析模型有更好的效果。
关键词:方面级情感分析;深度学习;循环神经网络(RNN );注意力机制文献标志码:A中图分类号:TP391.1Research on Aspect-Level Sentiment Analysis of User ReviewsCHEN Hong,YANG Yan +,DU ShengdongSchool of Information Science and Technology,Southwest Jiaotong University,Chengdu 611756,ChinaAbstract:Aspect-based sentiment analysis has become one of the hot research directions of natural language pared with the traditional sentiment analysis technology,aspect-based sentiment analysis is aimed at specific targets in sentences,and can judge the sentiment tendency of multiple targets in a sentence,and more accurately mine the sentiment polarity of the target.It is a fine-grained sentiment analysis technology.Aiming at the fact that the previous research ignored the problem of separate modeling of targets,an interactive attention network model based on bidirectional long short-term memory (Bi-IAN)is proposed.The model uses bidirectional long short-term memory (BiLSTM)to model the targets and the context respectively,to obtain hidden representation and extract the semantic information.Next,the attention vector between the context and the targets is learnt through interactive learning,and then the representation of the target and the context are generated.The relevance within and between the target and the context is captured,the representation of the target and context is reconstructed,and finally the model gets the classification result through the non-linear layer.Experimental training on the dataset SemEval 2014task 4and Chinese review datasets shows that the model proposed has better results than the existing benchmark sentiment analysis model in terms of accuracy and F 1-score.Key words:aspect-level sentiment analysis;deep learning;recurrent neural network (RNN);attention mechanism计算机科学与探索1673-9418/2021/15(03)-0478-08doi:10.3778/j.issn.1673-9418.2007011基金项目:国家自然科学基金(61976247);国家科技支撑计划(2015BAH19F02)。
静息态功能脑连接的空间动态分析及分类研究
静息态功能脑网络分析[1]使用基于血液氧合水平(Blood Oxygenation Level Dependent,BOLD)的功能磁共振成像技术,是研究大脑功能的一种重要方法[2]。
研究表明,神经精神疾病患者的临床表现与其大脑功能网络连接异常是相关的[3]。
脑网络与机器学习相结合的方法已经被广泛应用到脑疾病的诊断[4]中,如精神分裂症[5]、阿尔兹海默症[6]、癫痫症[7]等。
因此,静息态功能脑网络分析方法在脑疾病的分析和诊断中非常重要。
在传统的脑网络分析中,隐含的假设是大脑功能连接在整个静息态功能磁共振扫描过程中是恒定不变的[8]。
然而,无论是在经验上还是通过实验都证明了大脑功能连接随时间推移而发生动态变化[9]。
Wee等使用滑动窗口的方法构建了静息态时间动态网络,并应用于早期轻度认知障碍病人的识别中[10]。
静息态功能脑连接的空间动态分析及分类研究高晋1,赵云芃2,Godfred Kim Mensah1,李欣芸1,刘志芬3,陈俊杰1,郭浩11.太原理工大学信息与计算机学院,太原0300242.太原理工大学艺术学院,山西晋中0306003.山西医科大学第一医院精神卫生科,太原030000摘要:现有的精神疾病分类模型仅采用脑网络的静态指标作为特征,忽略了脑网络的空间动态信息,导致分类性能不高。
为克服这一局限性,提升分类模型的性能,提出了基于功能脑连接空间动态的分类方法。
通过高维模板对脑连接进行空间动态分析,提取脑连接空间动态特征。
利用统计分析进行特征选择,构建基于静息态功能脑连接的分类模型。
通过对抑郁症患者与正常被试的分类实验结果表明,脑连接空间动态特征的分类准确率(83.0%)比传统采用脑网络的静态指标特征的分类准确率(77.8%)高5.2个百分点。
关键词:空间动态;功能磁共振成像;支持向量机;抑郁症文献标志码:A中图分类号:TP181doi:10.3778/j.issn.1002-8331.1909-0351Research on Spatial Dynamics Analysis and Classification of Resting-State Functional Brain ConnectionsGAO Jin1,ZHAO Yunpeng2,Godfred Kim Mensah1,LI Xinyun1,LIU Zhifen3,CHEN Junjie1,GUO Hao11.College of Information and Computer,Taiyuan University of Technology,Taiyuan030024,China2.College of Art,Taiyuan University of Technology,Jinzhong,Shanxi030600,China3.Department of Mental Health,First Hospital of Shanxi Medical University,Taiyuan030000,ChinaAbstract:The existing classification model of mental diseases uses the static index of brain network as the characteristic while ignoring the spatial dynamic information of brain network,which will result in an inferior classification perfor-mance.To overcome this limitation and improve the performance of the classification model,a classification method based on the spatial dynamic of resting-state functional brain connections is proposed.The spatial dynamic characteristics of brain connections are extracted by analyzing the brain connections with high-dimensional templates.By selecting char-acteristics through the statistical analysis,a classification model based on resting-state functional brain connections can be constructed.The conducted experiments distinguish between depression patients and normal subjects and the results show that the classification accuracy of model utilized spatial dynamic characteristics(83.0%)is5.2percentage points higher than that with static index(77.8%).Key words:spatial dynamics;functional magnetic resonance imaging;support vector machine;depression基金项目:国家自然科学基金(61672374,61741212,61876124,61873178);山西省教育厅高等学校科技创新研究项目(2016139);山西省科技厅重点研发计划项目(201803D31043);教育部赛尔网络下一代互联网技术创新项目(NGII20170712)。
基于词向量的SVM集成学习社交网络抑郁倾向检测方法
基于词向量的SVM集成学习社交网络抑郁倾向检测方法1. 引言1.1 背景介绍社交网络已成为人们日常生活中不可或缺的一部分,人们在社交网络上分享生活点滴、交流心情感受,与朋友亲人保持联系。
随着社交网络的普及和使用,越来越多的人在社交网络上表现出抑郁倾向。
抑郁是一种常见的心理健康问题,严重影响患者的生活质量和社交交往。
通过社交网络对抑郁倾向进行及早发现和干预具有重要意义。
主要是使用词向量技术和支持向量机(SVM)等机器学习方法,对社交网络用户的言论和行为进行分析,从中挖掘出可能存在的抑郁倾向特征。
通过对这些特征进行识别和分类,可以帮助检测社交网络用户的抑郁倾向,及早发现患者并给予帮助。
借助SVM集成学习方法,可以提高抑郁倾向检测的准确性和稳定性,增强模型的泛化能力。
本研究旨在通过基于词向量的SVM集成学习方法,有效检测社交网络用户的抑郁倾向,为心理健康领域的研究和实践提供有益参考。
希望通过本研究的开展,能够为社会大众提供更好的心理健康服务,并为相关政策和干预措施的制定提供科学支持。
1.2 研究意义抑郁症是一种常见且严重的心理疾病,给患者的生活、工作和社交带来了极大的困扰。
随着社交网络的普及和人们在网络上的大量活动,研究人员开始探索利用社交网络数据来进行抑郁倾向的检测。
这种方法不仅可以帮助识别患有抑郁症的个体,还可以为心理健康领域的研究和干预提供重要线索。
2. 正文2.1 词向量技术简介词向量技术是自然语言处理领域中一种广泛应用的技术,它通过将词语表示为连续向量来实现文本的向量化表示。
词向量技术的提出最早可以追溯到基于神经网络的词向量模型,如Word2Vec和GloVe 等。
这些模型通过上下文预测词语的方式,将具有相似语义的词语映射到接近的向量空间中。
在词向量表示中,词语之间的语义关系可以通过向量之间的相似度来衡量,使得机器能够更好地理解和处理自然语言文本。
词向量技术在文本分类、实体识别、句法分析等任务中取得了显著的成果。
贵州大学2013届毕业研究生优秀学位论文公示
专业名称 教学
论文题目
答辩结果 3优 5优 7优 5优 5优 5优 5优 5优 4优1良 4优1良 3优2良 3优 3优 3优 3优 3优 3优 3优 3优 3优 2优1良 5优 5优 3优 5优
博士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 硕士 博士
植物营养学 黔薏苡1号营养特征与调控研究
5优 5优
5优
硕士 硕士
硕士
野生动植物 小蓬竹[Drepanostachyum 保护与利用 luodianense (Yi et R.S 贵州山羊品种GFI1B和RERG 动物遗传育 Wang) Keng f.]遗传多样性 罗卫星 陈 志 动物科学学院 种与繁殖 基因表达、多克隆抗体制 备及多态性与生长性状的 “金英黄归汤”对小鼠乳 王鲁 李圆方 动物科学学院 基础兽医 腺上皮TLR4信号转导的影 刘济明 王敏 林学院 周英 张敏 生命科学学院 药物化学 微生物学 植物学 响 太子参特征图谱的研究与 质量综合评价体系的建立 谢瓦氏曲霉间型变种有性 发育调控基因flbA的克隆及 功能分析 烟草毛状根与AM真菌双重
郑元宁 陈文佼 许鹿 杨婵
周姗姗 孙鹏辉 陆卫群 郑晓茹 钟佳萍 任俊龙 翦继志 郑淑君 赵少群 丁洋洋 李卫国 王睿
余贵忠 郑华品 冷传莉 刘 珒 徐晓光 张阳阳 李宏权 谢俊兴 张国安 王培洲 隆正文 罗翠柏 向淑文 丁召 谢泉 李睿 刘珂 高廷红
论我国消费者后悔权的必 要与制度构建 法律硕士 清代黔东南契约习惯法与 (非法学) 国家法的冲突与调适—— 法律硕士 以清水江文书为基础资料 非法经营罪的扩大化问题 (非法学) 探析 马克思主义 马克思与大卫•古丁实践科 基本原理 学观比较研究 Classical Oscillator Model 理论物理 on Canonical, LieAlgebraic Deformation and 变分原理及变分不等式的 基础数学 几何形式及推广 微电子学与 间歇式源中断方式生长 固体电子学 InGaAs量子点的生长工艺 微电子学与 研究 液态硅锗凝固过程中微观 固体电子学 结构的模拟
基于ProMPs和PI^2的机器人学习方法
388
武汉科技大学学报
2019 年 第 5 期
0的高斯噪声。
显 然 ,一 条 观 测 轨 迹 的 概 率 可 表 达 为 :
T
∏ p(y1:T|ω)= N(yt|Ψtω,Σy) t=1
(3)
假设有 M 条示范轨迹,通过基函数的线性拟
合可以得到 M 组权值:W ={ω1,…,ωm ,…,ωM }。 不失一般性,定义 ω 服从参数为θ 的概 率 分
在实际的机器 人 系 统 中,任 何 动 作 都 存 在 观 测和 执 行 的 噪 声,因 此,为 了 获 得 更 好 的 学 习 效 果,本文提出 一 种 新 的 机 器 人 学 习 方 法。首 先 使 用 ProMPs模型在多条示范轨迹中找到一条概率 最大的轨迹进行模仿学习[7-9],然后在这一 条 轨 迹 的基础上运 用 贝 叶 斯 估 计 算 法 进 [10] 行 新 任 务 学
基于 ProMPs和 PI2 的机器人学习方法
傅 剑,曹 策,申思远
(武汉理工大学自动化学院,湖北 武汉,430070)
摘 要 :基 于 传 统 运 动 基 元 模 型 的 机 器 人 学 习 方 法 存 在 学 习 速 度 慢 、学 习 结 果 精 度 低 等 问 题 ,为 此 本 文 提 出 一 种 融合贝叶斯估计算法的概 率 运 动 基 元 (ProMPs)表 达 和 模 仿 学 习 框 架,同 时 还 利 用 了 基 于 核 典 型 相 关 分 析 (KCCA)的改进型路径积分 PI2 策略进行轨迹 优 化。ProMPs结 合 贝 叶 斯 推 断,为 机 器 人 实 现 有 别 于 示 范 任 务的新任务提供了一个可行解搜索起点,而利用附加泛函指标约束的 PI2 算法能让机器人获得平滑 的 过 点 轨 迹。通过 UR5机器人实验平台和 V-REP 仿真软件对本文 方 法 进 行 过 点 试 验 验 证,结 果 表 明,所 提 出 的 贝 叶 斯 ProMPs-PI2 学习方法能快速而精准地完成机器人从示范任务到 陌 生 任 务 的 泛 化 学 习,实 现 机 器 人 新 技 能 的获取。 关 键 词 :机 器 人 学 习 ;概 率 运 动 基 元 ;路 径 积 分 ;PI2 ;贝 叶 斯 估 计 ;轨 迹 优 化 中图分类号:TP242.6 文献标志码:A 文章编号:1674-3644(2019)05-0387-07
大脑皮层神经元连接网络中同步振荡规律分析
大脑皮层神经元连接网络中同步振荡规律分析简介:大脑皮层是神经系统中最高级的结构之一,它负责接收和处理来自周围环境的感觉信息,并控制运动和认知功能。
一个关键的组成部分是神经元连接网络,这些网络以复杂而精确的方式相互连接,形成大脑功能区域。
其中,同步振荡是一种重要的信息传递机制,它有助于神经元之间的协同活动,促进信息的传递和整合。
本文将探讨大脑皮层神经元连接网络中的同步振荡规律以及其可能的功能意义。
主体:1. 同步振荡的背景同步振荡是指当多个神经元在特定频率上的活动同步时,它们之间会发生相位一致性。
同步振荡在大脑皮层中普遍存在,并发生在多个频率范围内。
研究表明,灵活的同步振荡可以帮助不同功能区域之间的信息传递,并在感觉、运动、记忆等认知任务中发挥重要作用。
2. 大脑神经元连接网络的结构大脑皮层中的神经元连接组成了复杂的网络结构。
神经元通过突触连接,在这些连接中传递信息。
这些连接构成了一个庞大的网络,允许信息在大脑中进行传播和整合。
神经元之间的连接具有多种形式,包括兴奋性和抑制性的突触传递等。
3. 同步振荡的频率同步振荡在不同频率范围内发生,每个频率范围都可能与不同的认知功能相关。
最具代表性的同步振荡频率包括δ波(0.5-4 Hz)、θ波(4-8 Hz)、α波(8-12 Hz)、β波(12-30 Hz)和γ波(30-100 Hz)。
这些频率范围的同步振荡被认为与大脑不同层次的信息处理和整合有关。
4. 同步振荡的功能意义同步振荡在大脑皮层中扮演重要的角色。
研究表明,同步振荡可以调节神经元之间的信息传递速度和整合程度,促进跨区域之间的信息传递和协调。
此外,同步振荡还能够增强感觉、注意和学习等认知功能,并与记忆和意识状态等高级认知过程相关联。
5. 同步振荡的调控机制同步振荡的产生和调控涉及多个因素。
神经元之间的突触传递和神经递质释放被认为是同步振荡的重要机制之一。
此外,神经元内部离子通道的调节和神经元膜的电位变化也会影响同步振荡的发生。
脑网络的计算机模拟与分析方法
脑网络的计算机模拟与分析方法人类的大脑是一个复杂的网络系统,由数百亿个神经元相互连通组成。
科学家们一直在尝试探索大脑的奥秘,并通过计算机模拟和分析来解析大脑的功能和构造。
在这篇文章中,我们将探讨脑网络计算机模拟和分析的方法,以及它们如何帮助我们更好地了解大脑。
一、计算机模拟大脑网络计算机模拟是通过编写和运行计算机程序来模拟大脑网络的活动和功能。
这些程序通常基于现有的神经科学知识和数据以及计算机科学和工程技术。
有多种方法可以计算机模拟大脑网络的活动和功能。
其中一种常用的方法是基于“生物合理性”的原则,利用大量实验数据来创建计算神经元和网络模型。
这些模型可以模拟神经元之间的电活动和信息传输,并模拟特定的行为或认知功能。
例如,科学家们可以使用计算机模拟来研究记忆的物质基础,即大脑内的突触变化。
通过模拟突触内的生化和电活动,可以更好地了解记忆和学习的过程。
二、脑网络数据分析另一个用于研究大脑网络的方法是数据分析。
这种方法通常基于大量实验数据,例如脑电图和功能磁共振成像。
这些数据会提供有关大脑活动的详细信息,例如神经元之间的相互作用、信息传输和同步等。
数据分析通常涉及统计学和机器学习等方法。
这些方法可以帮助科学家们从大量数据中提取有用的信息和关系,并创建可视化图表来帮助理解和解释数据。
例如,研究者可能使用数据分析来研究大脑中癫痫的发作模式。
通过分析脑电图中的不同波形、频率和相位,研究者可以找到有关癫痫发作的特定模式和信号。
三、计算机模拟和数据分析的结合虽然计算机模拟和数据分析可以独立使用来研究大脑网络,但结合使用会更好地了解大脑的功能和构造。
其中一种常用的方法是将计算机模拟用于模拟和探索大脑网络的可能功能和结构,并使用数据分析来验证这些模型的准确性和正确性。
例如,科学家们可以使用数据分析来收集大量的神经元之间的连接数据,并通过计算机模拟来创建大脑的3D网络模型以模拟神经元之间的信息交流。
这种方法可以帮助科学家们更好地了解网络中信息传输和同步的原理,以及各区域之间的联系。
神经系统中的同步和调制
神经系统中的同步和调制神经系统是人类意识的重要组成部分,它通过神经细胞的运作,让我们体验到了周围环境的感觉,思考和行动的过程。
神经系统中的同步和调制在神经细胞间的相互作用过程中起了至关重要的作用。
本文将对神经系统中的同步和调制进行探讨。
一、神经系统的基本结构神经系统是由神经元、胶质细胞和血管组成的。
神经元是神经系统的功能单元,它们负责接收、处理和传递信息,构成了神经网络。
胶质细胞是神经系统中的支持细胞,它们协助维护神经元的正常功能。
血管则为神经系统提供了充足的氧气和营养物质。
二、神经元的结构和功能神经元由细胞体、树突、轴突和突触组成。
细胞体是神经元的中心体,负责产生和调节神经信号。
树突是神经元接收信息的部位。
轴突是神经元传递信息的部位,它们通过突触与其他神经元相连。
神经元传递信息的过程是基于电生理原理完成的。
当神经元兴奋时,会导致电位差的改变,从而在轴突上引起电信号的传递。
这些电信号通过突触向其他神经元传递,并在神经元网络中产生复杂的动态过程。
三、神经元之间的相互作用神经元之间的相互作用是神经系统中信息传递的关键。
神经元通过突触连接,形成复杂的网络结构。
当神经元兴奋时,引起电信号的传递,这些电信号将被其他神经元接收。
其他神经元在接收到这些信号后,可能会产生新的电信号,继续向其他神经元传播。
这种神经元之间的相互作用,常常需要进行同步和调制。
同步是指神经元之间的电信号具有一定的时间关系,它们共同产生复杂的动态过程。
调制是指一个神经元的电信号通过突触影响另一个神经元的兴奋状态和传递过程。
四、神经元同步的调节神经元间同步的调节对神经系统的功能起着重要的影响。
同步调节对一些神经功能具有重要的意义,如注意力和学习记忆等。
在神经系统中,同步常常通过频率调节、相位调节和幅度调节等方式来实现。
频率调节是指神经元之间的电信号以特定的频率同步传递。
当神经网络中的神经元同步产生时,它们可能会调节彼此的频率,进一步影响神经系统整体的功能状态。
长时程增强(LTP)及其与学习记忆的关系
长时程增强(LTP)及其与学习记忆的关系摘要:海马突触活性的长时程增强(1ong-term potentiation,LTP)作为突触可塑性的研究模型,认为是与学习记忆密切相关的神经突触可塑性的生物学基础。
本文综述了长时程增强及其与学习记忆的关系。
关键词:海马长时程增强学习记忆Long—term Potentiation (LTP) and the Relationship betweenLTP and Learning, MemoryAbstractLong—term potentiation(LTP)of synaptic activity in the hippocampus is the most widely researched model of synaptic plasticity, which is believed to underlie the brain function of learning and memory. The reports review1ong-term potentiation (LTP) and the relationship between LTP and learning, memory.Keyword: Hippocampus, Long—term potentiation (LTP), Learning, Memory前言在神经生物学领域中,与学习、记忆有关的突触机制一直就是人们最关注的问题之一。
早在20世纪中中期Cajal 就已经提出学习、记忆是由于突触反复被兴奋引起的传递效率的改变。
虽然这一假说在理论上成立,但早期的实验却一直未能证明这一点。
直到二十世纪六七十年代,Bliss和Lomo研究发现在海马这个被认为在学习过程中起重要作用的脑区中的兴奋性通路上给予短暂的重复刺激,将引起突触传递增强,在无损伤的动物体实验中,这种增强效应将维持数小,甚至数周[1-3],这种突触传递的增强被称作突触传递长时程增强(Long-term potentiation, LTP)。
神经科学的计算建模与理论研究
神经科学的计算建模与理论研究神经科学是一个涉及大量领域的学科,其中最重要的一个方面就是对神经系统的研究。
神经网络是神经系统的基础,它通过一系列复杂的生物化学和电活动现象来完成各种认知和行为任务。
神经网络模型就是用数学方法描述神经元和神经网络的功能机制和行为的,是研究神经系统的重要工具。
本文将主要介绍神经科学的计算建模与理论研究的相关知识。
一、神经网络建模神经网络建模是指将神经元和神经网络建立数学模型,模拟和预测其功能和行为。
神经元是神经网络的基本单位,具有输入、输出和可塑性等特征。
神经网络模型可以分为两类:传统模型和基于机器学习的模型。
传统模型使用微分方程、脉冲神经网络、格子模型等数学方法来描述神经元的行为,可用于理论和实验研究。
脉冲神经网络是神经元活动的模型之一,它根据神经元电生理实验数据不断优化,可以用于研究神经元放电模式、突触传递、电相互作用等。
格子模型主要用来研究神经网络的同步和复杂动态。
基于机器学习的神经网络模型则根据神经元生理学和行为学等数据,使用计算机算法从数据中学习和提取特征,可用于各种主题模式识别、预测和分类。
这种模型的成功需要大量的数据和强大的计算资源,但它在疾病预测、临床诊断和计算机视觉等领域有重大潜力。
二、神经信号处理神经信号处理是神经科学中的核心问题,它涉及神经元之间的信号传递和信息处理。
神经网络模型可用于研究神经元的时空特性、信号传递和信息处理机制,并可提供预测和诊断功能。
神经信号的数学模型可以采用传统的电路模型或更复杂的分布式电介质模型和动态场模型。
其中,分布式电介质模型是常用的模型,它可用于研究神经元和神经网络的电活动传递和信号传输速度、同步、幅度和相位等。
神经信号处理还可以通过脑机接口(Brain-Machine Interface, BMI)实现机器和人脑之间的通信。
这种技术可以将人脑信号转换为指令,控制外部设备或直接控制运动,在运动恢复、残疾人康复等方面有巨大应用潜力。
大脑网络的探索进程(一)——研究特点、方法与三大类型
大脑网络的探索进程(一)——研究特点、方法与三大类型方锦清【摘要】大脑网络是复杂的生命系统中一个最典型的复杂网络,是一类“网络的网络”.目前可从三个层次对大脑网络进行建模探索,即微观尺度(神经元)、中尺度(神经集群)、大尺度(脑区域),各层次之间相互影响、错综复杂,研究难度很大.笔者从网络科学观来评述大脑网络的探索进程、研究方法和主要类型.%Brain network is a typical complex network for the most complex living systems, and it belongs to "network of networks". At present, the research is focused on brain models from three levels, namely, microscopic scale (neuron), the mesoscale (neural cluster) and large scale (cortical area). Exploring brain network is very difficult because they influence each other and complicate a-mong various brain levels. The author introduced explore process, research methods and main types of brain networks.【期刊名称】《自然杂志》【年(卷),期】2012(034)006【总页数】7页(P344-349,354)【关键词】网络科学理论方法;大脑网络;结构性网络;功能性网络;效用性网络;网络的网络【作者】方锦清【作者单位】中国原子能科学研究院,北京102413【正文语种】中文大脑网络是复杂的生命系统中一个最典型的复杂网络,是一类“网络的网络”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
展 , 通过 对系 统状 态变量 的控 制 , 使 系统 达到 所需 要 的同步 . 另外 , 在 大脑神 经 系统 的生理 实验 过 程 中 ,
科学 家们 发现 大脑 中也存 在 神经元 同步 放 电的模 式_ 8 。 , 这 种放 电模 式 可能 与 大脑 的某 些 功 能相 关 , 所 以 神经 系统 的 同步研 究对 人们 了解 大脑 意义重 大. 神经 网络 系统 的 同步研 究 , 也 经历 了从 两个耦 合神 经元 到 网络层 次 的发展 , 研 究 中常见 的网络拓 扑 结 构一 般 以规则 网络 为 主 , 如链 式 , 网格式 , 环式 口 7 3 . 另外 , 还有更 符 合大 脑神 经 元解 剖 结 构 的小世 界 网络 连 接 的神 经 元系统 “ 。 1 . 但 是这些 网络 的规 则性 导致 它们 与实 际 的生物 网络具 有较 大 的差异 , 实 际 上生物 网络 的 突触连 接具 有更 大 的随机性 . 而且 目前 的大部分 研究 受工 程应 用 中动力 系统 的影 响 , 还 有个 共 同的
特征 就是 耦合 的对 称性 , 即结 点 问的耦 合作 用是 相互 的 , 但 是 实 际神 经元 网络 的 突触 连 接 是单 向的 . 本 文
的研 究将 这两 个 问题做 改进 和推 广. 既 然神 经 网络 的同步放 电可 能实 现大脑 的某 些功 能 , 那 么一 个很 自然 的 问题 就是 这 种 同 步是 如 何 达 到 的 ?对 现实 中动力 系统 的研究发 现 , 可 以通 过 对系统 中的某 些 状 态变 量进 行 外 部控 制 使 得 系统 达 到 同 步¨ 州, 但 是对 于神经 系统 这显 然不 是必要 的. 大脑具 有 自组织 性 , 神经元 之 间的突 触连 接具 有可 塑性 , 神
摘
要: 本 文 提 出 了 一 种 自适 应 的 突 触 学 习 模 型 模 拟 了 神 经 突 触 的 可 塑 性 , 通 过 这 种 学 习 规 则 在 定 义 的动
态 相关 系数 指标 下 发 现 , 可 以使 得 一 般 非 全 同 随 机 神 经 网络 达 到 同步 , 表 明该 方 法 具有 较好 的 鲁 棒 性 . 为 了 刻 域 网络 在 整体 上 的相 同 步提 出 了基 于 P o i n c a r e 截面的相位定义法 , 将 动 作 电位 峰 值 所 在 的位 置 定 义 为 P o i n c a r e截
经 系统 通过 突触学 习和适应 达到 想要 的结果 . 本 文 提 出 了 一 种 白适 应 的 突 触 学 习 规 则 来 模 拟 生 物 系 统 中
时间点依 赖 的突 触可 塑性.
收 稿 日期 : 2 O 1 4 0 5 — 0 8
基金项 目: 国 家 自然 科 学重 点 基 金项 目( 1 1 2 3 2 0 0 5 ) ; 浙 江 省 自然 科 学 基金 项 目( I Q1 4 A 0 2 0 0 0 5 ) ; 浙 江 省 教育 厅 基 金项 目( Y 2 0 1 2 2 4 4 3 1 ) 通信作者 : 严传魁( 1 9 8 2 ) , 男, 讲 师, 博士 , 从事非线性动力学研究. Ema i l :y a n c h u a n k u i @1 6 3 , C O I D .
Vol | 1 3 NO . 5 S e p .2 01 4
基 于 一 种 自适 应 突 触 学 习 的 动 态 相 关 系数 与
相 位 同步分 析
严 传 魁 , 王 如 彬
( 1 . 杭 州 师 范 大学 理 学 院 , 浙江 杭 州 3 1 O 0 3 6 ;2 . 华东 理 X - 大 学 理 学 院 认 知 神 经 动 力 学研 究所 , 上海 2 0 0 2 3 7 )
面, 进 而 定 义 同步 差 , 网络 相 位 同步 . 网络 相 位 差 计 算 结 果 显 示 , 任 意 两 个 神 经 元 之 问 的 相 位 差 随 着 时 间 变 化 趋
于 常数 , 即 网络 中任 意 两 个 神 经元 出现 相 同步 , 神 经 网络 平 均相 位 差 趋 于 常数 , 神 经 网络 出 现全 局 的 相位 同步 .
第 5 期
严 传魁 , 等: 基 于一种 自适 应 突触 学 习的动 态相关 系 数与相 位 同步分 析
5 4 9
1 模 型 介 绍
1 . 1 网 络 模 型
进 行神 经 网络 的研究 带来 的一 个很 基本 问题 是 网络 的拓 扑结 构是 怎 样 的. 链式 、 环式 、 网格 式 等 规则 网络完 全无 法体 现神 经 系统 网络结 构 的复 杂性 . 因为神经 网络 中神 经元 的 突触连 接具 有方 向性 , 并且 连接 不 具有 规则 图形 的对 称 性 . 更 接近 于 神 经 网络 的是 NW 小 世界 网络 , 实 际神 经 系统 的 突触 连 接应 该 介 于 完 全连 接和 完全 不连 接 之间 , 小世 界 网络具 有一 定 的随机 性 和不规 则性 , 所 以神 经 网络 应该 是具 有小 世界 网络特 性 的. 考 虑神 经 系统 突触连 接 的一些 特 性 , 用 一个 经过 改 造 的 NW 小 世 界 网络 来 模 拟 神 经 网络 . 在对 NW 小 世界 网络 节 点进行 随机 连接 时 由原来 的 对称性 耦 合变 成单 向性 突触 连接 , 网络 构造 步骤 如下 :
第 1 3卷 第 5期 2 O 1 4年 9月
杭 州 师范大 学 学报 ( 自然 科学版 )
J o u r n a l o f H a n g z h o u N o r ma l U n i v e r s i t y ( N a t u r a l S c i e n c e E d i t i o n )
关键词 : 动态相关系数 ; 相同步 ; 自适 应 ; 突 触学 习 ; 神 经 系 统
中 图 分 类 号 :O1 9 3 ; 03 1 3 文献 标 志 码 :A
文 章 编 号 :l 6 7 4 — 2 3 2 X( 2 0 l 4 ) 0 5 — 0 5 4 8 ~ 0 8
随着 科技 的发 展 , 人们发 现同步在工程领域应用广泛 , 较 大 的进