神经元的形态分类和识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
全国第七届研究生数学建模竞赛
题目神经元的形态分类和识别
摘要:
本文通过对神经元几何空间数据进行特征计算与提取,在此基础上对相关的任务结合特定的分类算法建立了数学模型。本文的主要工作包括以下方面:
(1):提出了一种基于“期望-标准差范围比对”的简单算法,采用附录A中的数据作为训练集,得到各个类别各个特征的期望和标准差进而得到相应的特征范围,对附录C的神经元进行特征比对,实现了对附录C的神经元类别的精确划分。
(2)利用了SVM算法,并从网站[1]上下载了更多的已知类别的神经元数据进行特征提取,输入编写的SVM 程序进行训练,对附录B中未知的神经元进行了分类。
(3)运用聚类算法对各种神经元进行了更具有一般性的聚类,并对神经元的命名提出了建议。聚类算法更好地帮助我们识别未知类别,有利于发现区别于已知类型的其它神经元
(4)利用聚类算法对不同物种的同类神经元进行了分类及特征比较,从而确定了不同物种间的同类神经元具有一定的特征差异。
(5)我们是建立在两个假设之上,即同类神经元的空间几何特征存在很大的相似性和神经元随时间的变化体现为神经元房室数量的变化。根据同类神经元房室数量的变化,得出神经元随时间流逝神经形态是怎样生长变化的。并且,得出神经元的类型判别不仅仅孤立第看待其各个特征,还要观察期特征之间的相关性,这样更有利于判定神经元的所属类别。
关键词:形态特征;期望;标准差;支持向量机;聚类
中山大学承办
一问题重述
大脑是生物体内结构和功能最复杂的组织,其中包含上千亿个神经细胞(神经元)。人类脑计划(Human Brain Project, HBP)的目的是要对全世界的神经信息学数据库建立共同的标准,多学科整合分析大量数据,加速人类对脑的认识。
神经元是大脑构造的基本单位,神经元的特性对脑的认识有着显著意义。对神经元特性的认识,最基本问题是神经元的分类。目前,关于神经元的简单分类法主要有:(1)根据突起的多少可将神经元分为多极神经元;双极神经元和单极神经元。(2)根据神经元的功能又可分为主神经元,感觉神经元,运动神经元和中间神经元等。
我们只考虑神经元的几何形态,研究如何利用神经元的空间几何特征,通过数学建模给出神经元的一个空间形态分类方法,将神经元根据几何形态比较准确地分类识别。
神经元的空间几何形态的研究是人类脑计划中一个重要项目, 包含大量神经元的几何形态数据等,现在仍然在不断增加,在那里我们可获得大量的神经元空间形态数据,例如附录A和附录C。通过获得的数据,我们主要解决以下几个问题:
(1)通过神经元几何空间数据进行神经元几何特征的选取及计算。
(2)通过已知类别的少量神经元的几何特征数据选择合适的算法进行分类。
(3)通过大量已知类别的神经元的几何特征数据选择合适的算法对未知类别的神经元进行分类。
(4)对不同物种的同类神经元选择合适的算法对其几何特征的差异进行判断。
(5)根据相关文献提出的方法,预测神经元形态的生长。
二基本假设
1)提取的33个特征能够区分神经元的类别。
2)在分类算法中,神经元的生长已经停止,即特征将不再变化。
3)给出的神经元数据是线性可分的。
4)对问题五,同种类别的神经元的集合形态特征具有很大的相似性。
5)对问题五,神经元房室数量的变化体现为其生长的变化,也即随着时间的流逝,树突和轴突不断地生长而发生变化。
三符号说明
N:一个神经元向量;
T:由m个神经元向量组成的矩阵;
E:特征值期望;
S:特征值标准差;
四神经元几何形态数据的特征提取与数据模型的建立
首先我们从网站上下载了更多的SWC格式的神经元几何空间数据,接着利用L-Measure[2]软件对每个神经元进行了33个特征的提取,最终的数据格式如下:
表1:神经元的数据结构
Soma_Surface 33571.5 45216 28577.6 30403.2
N_stems 11 10 13 12
N_bifs 150 122 171 175
N_branch 321 263 367 373
Width 1944 1827 1730 1923
Height 1412 1693 1766 1732
Depth 1638.6 1925.7 1698.4 1774
Diameter 2.63934 4.06792 3.75695 2.90775
Length 96039.8 78849.1 103228 113502
Surface 548245 512418 676400 499671
Volume 439406 390413 530778 283360
EucDistance 1588.52 1531.5 1617.49 1587.72
PathDistance 1822.94 1818 1734.79 1880.77
Branch_Order 9 9 9 11
Contraction 0.92836 0.948631 0.947193 0.942836
Fragmentation 1251 545 717 753
Partition_asymmetry 0.506922 0.444832 0.480742 0.444403
Bif_ampl_local 53.8477 44.0934 43.533 51.7272
Bif_ampl_remote 51.5732 42.9974 44.3678 52.2666
N_tips 1 1 1 1
SectionArea 63.9557 165.377 111.092 99.8725
Terminal_degree 2.5693 3.49472 3.98402 3.55838
TerminalSegment 1 1 1 1
Branch_pathlength 308.81 310.43 290.782 313.54
Parent_Daughter_Ratio 0.58654 0.6911 0.635912 0.63054
Bif_tilt_local 122.418 125.948 125.66 119.644
Bif_tilt_remote 125.771 134.6 128.265 121.592
Diam_threshold 1.37863 1.59348 1.53886 1.05599