蠓虫分类讲评
蠓虫分类
蠓虫分类问题可概括叙述如下:生物学家试图对两种蠓虫(Af与Apf)进行鉴别,依据的资料是触角和翅膀的长度,已经测得了9支Af和6支Apf的数据如下:Af:(1.24,1.27),(1.36,1.74),(1.38,1.64),(1.38,1.82),(1.38,1.90),(1.40,1.70),(1.48,1.82),(1.54,1.82),(1.56,2.08).Apf: (1.14,1.82),(1.18,1.96),(1.20,1.86),(1.26,2.00),(1.28,2.00),(1.30,1.96).现在的问题是:(i)根据如上资料,如何制定一种方法,正确地区分两类蠓虫。
(ii)对触角和翼长分别为(1.24,1.80),(1.28,1.84)与(1.40,2.04)的3个标本,用所得到的方法加以识别。
(iii)设Af是宝贵的传粉益虫,Apf是某疾病的载体,是否应该修改分类方法。
如上的问题是有代表性的,它的特点是要求依据已知资料(9支Af的数据和6支Apf的数据)制定一种分类方法,类别是已经给定的(Af或Apf)。
今后,我们将9支Af及6支Apf的数据集合称之为学习样本。
为解决上述问题,考虑一个其结构如下图所示的人工神经网络。
p1=[1.24,1.27;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48, 1.82;1.54,1.82;1.56,2.08];p2=[1.14,1.82;1.18,1.96;1.20,1.86;1.26,2.00 ;1.28,2.00;1.30,1.96];p=[p1;p2]';pr=minmax(p)goal=[ones(1,9),zeros(1,6);zeros(1,9),ones(1,6)];subplot(1,2,1)plot(p1(:,1),p1(:,2),'*',p2(:,1),p2(:,2),'o')subplot(1,2,2)net=newff(pr,[3,2],{'logsig','logsig'});net.trainParam.show = 1;net.trainParam.lr = 0.05;net.trainParam.epochs = 3000;net.trainParam.goal = 1e-10;net.trainParam.epochs = 50000;net = train(net,p,goal);x=[1.24 1.80;1.28 1.84;1.40 2.04]';y=sim(net,x)。
《奇点科学》----嗜血的小生物,蠓
《奇点科学》----嗜血的小生物,蠓
蠓是一种类似蚊子的昆虫,非常小,很少长到3毫米长。
在我国多地都有分布,有“小咬”、“墨蚊”之称,尽管它们吸取的血液不多,但对于生活在蠓栖息地(湖泊、溪流等潮湿地区)的人们来说,蠓仍然是夏季最讨厌的昆虫之一。
虽然单个不会产生很大的影响,但是每年6月,雌蠓交配完毕后,需要吸血产卵时,它们又会成群结队的聚集在一起,届时天空中就会充满嗜血的蠓群。
尽管很难用肉眼捕捉到蠓叮咬人体的瞬间,但是它们叮咬时,却会有明显的痛感,因为它们不像蚊子一样,用非常细长的嘴刺穿皮肤,刺入血管,而是用一把锯齿形的钳子口器割开皮肤吸血。
这个钳子很有力,能割破大部分动物的皮肤。
当皮肤上有伤口时,雌蠓会向伤口注射唾液,以防止血液凝固。
随后吸入少量血液(少于1微升),储存在胃中,准备产卵。
在交配季节,雌蠓分泌一种激素来吸引周围的雄蠓。
雄蠓会在激素的刺激下围着雌蠓跳舞,雌蠓会选择自己喜欢的配偶完成交配。
所以这个季节的蠓总是成群结队。
雌性受精后,开始寻找血液,吸血产卵。
只有一、两只蠓出现时,或许它们还不足以对人构成威胁,但到了夏天,天空总是会布满这样的小型吸血昆虫。
(该文部分内容采集自“杂志铺”网商品,《奇点科学》杂志。
)。
蠓虫分类解读
5 / 29
T x ( a , w ) 对于给定的样品 ,称x与 x Af 之间的距离为x距
Af 类的“距离”,与Apf 类距离定义相同。 说到距离,我们一定首先想到欧氏距离,对于平面 上的两点(x1,y1 )(x2,y2),其间的欧氏距离定义 为: 2 2
11 / 29
将Mahalanobis
距离用于判别模型,其判别
准则为: 若 d M ( x, G1 ) d M ( x, G2 ) ,则判断 x G1 若 d M ( x, G1 ) d M ( x, G2 ) ,则判断 x G2 若 d M ( x, G1 ) d M ( x, G2 ) ,则可判断 x G1 也可判断 x G2 对于蠓虫分类问题,根据所给学习样本数据, 可求得
蠓虫分类
1 问题 两类蠓虫Af和Apf已由生物学家W.L.Grogna 和W.W.Wirth 根据它们的触角长度和翼长加 以区分,9只Af蠓虫用蓝色' + ' 标记,6只Apf 用红色 ' * ' 标记,根据给出的触角长度和翼 长识别出一只标本是Af还是Apf。 1)给定一只 Af 族或Apf族的蠓虫,你如何正 确区分它属于哪一族? 2)将你的方法用于触角长和翼长分别为 (1.24,1.80),(1.28,1.84),(1.40,2.04)的三个 标本 3)设Af是传粉益虫, Apf是某种疾病的载体, 如何修改你的分类方法?
2 / 29
A 1.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 1.56
W 1.72 1.74 1.64 1.82 1.90 1.来自0 1.82 1.82 2.08
蠓虫分类
数学模型——蠓虫分类问题(摘要)2008年06月14日星期六下午 12:48这次的是美国大学生数学模型1989年的题目,这里给出简要介绍。
蠓虫分类问题摘要一、问题:已知有两种不同种类的蠓虫,他们可以由触角长和翼长加以区分。
现在我们有十五只样本的数据,我们想根据这些数据设计一种判别蠓虫种类的方法,并将其运用于三只未知类别的蠓虫上。
当然这里我们只考虑触角长和翼长对其分类的影响,而忽略其他的因素。
二、三种解决方案:1.利用二维正态分布:假设蠓虫的触角长度和翅膀长度是两个随机变量,且服从二维正态分布。
我们可以根据十五个已知的数据将它们的分布函数计算出来。
这样我们可以得到一个判断某个样本属于某一类的概率函数。
接下来只须控制一个常值,令由前面得到的概率函数算出的值超过该常值的为某类蠓虫即可。
这样我们若把那三只未知的样本代入并计算出其概率即可判断其属于哪一类蠓虫。
而且由该分布函数我们还可以通过二重积分得到一个有关误差的数值。
2.利用Fisher判别法:我们的目标是要在平面上寻找一根划分曲线使得错误损失率最小。
Fisher 证明了当两类样本的协方差阵相等时该划分曲线是直线,且该直线方程能显示给出。
我们对两类样本的协方差阵作些处理使之相等,然后再运用Fisher判别法即可得所求直线。
然后我们根据样本具体的自然比率和损失率来检验上述得到的方法并由此验证该方法的正确性。
同时调整损失率,我们可以得出当Apf 是害虫时,应对该判别方法作何处理。
3.运用神经网络分类方法:我们打算借助于神经网络的学习过程来寻找一条直线使之将已知的两类数据点分开。
在假设样本现行可分的前提下,我们采用单层感知器算法。
为此,我们先随机生成一条直线。
然后将已知的数据点逐个代入,每一次代入都需修改一次直线方程(这就是类比神经元的学习过程)。
我们的修改方法将使得该直线趋于某条稳定的直线,这条直线就是最终的结果。
然后将三个未知的点代入,观察它所在的区域即可判别属于哪一类。
最新 广东省蠓科昆虫的种类及其分布的资料梳理-精品
广东省蠓科昆虫的种类及其分布的资料梳理蠓俗称“小咬”,是吸血骚扰、传播人畜疾病的重要双翅目昆虫。
曾经从广州地区的台湾蠛蠓(Lasiohelea taiwana) 体内分离出日本乙型脑炎病毒,荒川库蠓(Culicoides arakawae) 等是南方地区牛、马蓝舌病的主要媒介。
广东省地域广,地形气候复杂,蠓虫危害严重。
先后在珠海、中山等地进行过一些调查研究,但一直没有关于种类和地理分布的系统资料。
本文总结整理多年的研究资料,系统梳理广东省蠓科昆虫的种类及其分布,为蠓类的区系研究和防治研究提供依据。
1、材料与方法1. 1 采集地点选择广东省境内的广州、珠海、深圳、中山、台山、慧东、揭阳、肇庆、徐闻、雷州、湛江、韶关、始兴等 13 个市县作为采集地。
采集以广东沿海为主,东自揭阳、彗东等粤东地区,西至湛江、徐闻等雷州半岛。
1. 2 采集方法在蠓虫活动期综合采用挥网、帐诱、灯诱、人诱等方法,大量采集蠓虫标本。
毒瓶麻醉后,于白布或白纸上挑取蠓虫,生物解剖显微镜下初步分类。
1. 3 标本制作标本经脱水、腐蚀、清洗、展开、固定等处理,制作玻片标本。
Olympus 显微镜下准确鉴定。
1. 4 资料调研查阅研究国内外研究广东省蠓科昆虫的文献资料,掌握广东省蠓类的研究记录。
2、结果2. 1 种类共计发现蠓科 4 亚科 11 属 119 种,即细蠓亚科 Leptoconopinae 细蠓属 1 种,毛蠓亚科Dasyheleleinae 毛蠓属 24 种,铗蠓亚科 Forcipomyii-nae 裸蠓属 9 种,铗蠓属 17 种,蠛蠓属 10 种,蠓亚科Ceratopogoninae 库蠓属 40 种,埃蠓属 3 种,阿蠓属 5种,短蠓属 2 种,柱蠓属 3 种,尼蠓属 1 种,贝蠓属 4种。
(1) 细蠓属 Leptoconops Skuse,1889: 海峡细蠓Leptoconops fretus Yu et Zhan;(2) 毛蠓属 DasyheleaKieffer,1911: 角翼毛蠓 Dasyhelea alula Yu; 双钩毛蠓 Dasyhelea biunguis Kieffer; 泥污毛蠓 Dasyheleaborbonica Clastrier; 怪状毛蠓 Dasyhelea chimaira Yuet Wang; 山丘毛蠓 Dasyheleadeirus Yu; 双尖毛蠓Dasyhelea dioxyria Hao et Yu; 欧洲毛蠓 Dasyhelea eu-ropaea Remm; 超越毛蠓 Dasyhelea excellentisBorkent; 宽带毛蠓Dasyhelea fasciigera Kieffer; 分叉毛蠓 Dasyhelea fulcillatus Yu; 棕色毛蠓 Dasyhelea fus-cus Yu; 灰色毛蠓 Dasyhelea grisea Coquillett; 多刺毛蠓 Dasyhelea horridus Yu; 泸定毛蠓 Dasyhelea ludin-gensis Zhang et Yu; 小孢毛蠓 Dasyhelea microsporeaHao et Yu; 西部毛蠓 Dasyhelea occasus Zhang et Yu;喜愿毛蠓 Dasyhelea paragrata Remm; 淡色毛蠓 Dasy-helea pallidicola Yu; 小刺毛蠓 Dasyhelea saetula Yu;裂叶毛蠓Dasyhelea schizothrixi Lee et Wirth; 类常毛蠓 Dasyhelea subcommunis Yu; 矛状毛蠓 Dasyheleadoratos Yu; 拟黄毛蠓 Dasyhelea subflava Yu et Hao;无偶毛蠓 Dasyhelea viduus Yu。
最新 广东省蠓科昆虫的种类及其分布的资料梳理-精品
广东省蠓科昆虫的种类及其分布的资料梳理蠓俗称“小咬”,是吸血骚扰、传播人畜疾病的重要双翅目昆虫。
曾经从广州地区的台湾蠛蠓(Lasiohelea taiwana) 体内分离出日本乙型脑炎病毒,荒川库蠓(Culicoides arakawae) 等是南方地区牛、马蓝舌病的主要媒介。
广东省地域广,地形气候复杂,蠓虫危害严重。
先后在珠海、中山等地进行过一些调查研究,但一直没有关于种类和地理分布的系统资料。
本文总结整理多年的研究资料,系统梳理广东省蠓科昆虫的种类及其分布,为蠓类的区系研究和防治研究提供依据。
1、材料与方法1. 1 采集地点选择广东省境内的广州、珠海、深圳、中山、台山、慧东、揭阳、肇庆、徐闻、雷州、湛江、韶关、始兴等 13 个市县作为采集地。
采集以广东沿海为主,东自揭阳、彗东等粤东地区,西至湛江、徐闻等雷州半岛。
1. 2 采集方法在蠓虫活动期综合采用挥网、帐诱、灯诱、人诱等方法,大量采集蠓虫标本。
毒瓶麻醉后,于白布或白纸上挑取蠓虫,生物解剖显微镜下初步分类。
1. 3 标本制作标本经脱水、腐蚀、清洗、展开、固定等处理,制作玻片标本。
Olympus 显微镜下准确鉴定。
1. 4 资料调研查阅研究国内外研究广东省蠓科昆虫的文献资料,掌握广东省蠓类的研究记录。
2、结果2. 1 种类共计发现蠓科 4 亚科 11 属 119 种,即细蠓亚科 Leptoconopinae 细蠓属 1 种,毛蠓亚科Dasyheleleinae 毛蠓属 24 种,铗蠓亚科 Forcipomyii-nae 裸蠓属 9 种,铗蠓属 17 种,蠛蠓属 10 种,蠓亚科Ceratopogoninae 库蠓属 40 种,埃蠓属 3 种,阿蠓属 5种,短蠓属 2 种,柱蠓属 3 种,尼蠓属 1 种,贝蠓属 4种。
(1) 细蠓属 Leptoconops Skuse,1889: 海峡细蠓Leptoconops fretus Yu et Zhan;(2) 毛蠓属 DasyheleaKieffer,1911: 角翼毛蠓 Dasyhelea alula Yu; 双钩毛蠓 Dasyhelea biunguis Kieffer; 泥污毛蠓 Dasyheleaborbonica Clastrier; 怪状毛蠓 Dasyhelea chimaira Yuet Wang; 山丘毛蠓 Dasyheleadeirus Yu; 双尖毛蠓Dasyhelea dioxyria Hao et Yu; 欧洲毛蠓 Dasyhelea eu-ropaea Remm; 超越毛蠓 Dasyhelea excellentisBorkent; 宽带毛蠓Dasyhelea fasciigera Kieffer; 分叉毛蠓 Dasyhelea fulcillatus Yu; 棕色毛蠓 Dasyhelea fus-cus Yu; 灰色毛蠓 Dasyhelea grisea Coquillett; 多刺毛蠓 Dasyhelea horridus Yu; 泸定毛蠓 Dasyhelea ludin-gensis Zhang et Yu; 小孢毛蠓 Dasyhelea microsporeaHao et Yu; 西部毛蠓 Dasyhelea occasus Zhang et Yu;喜愿毛蠓 Dasyhelea paragrata Remm; 淡色毛蠓 Dasy-helea pallidicola Yu; 小刺毛蠓 Dasyhelea saetula Yu;裂叶毛蠓Dasyhelea schizothrixi Lee et Wirth; 类常毛蠓 Dasyhelea subcommunis Yu; 矛状毛蠓 Dasyheleadoratos Yu; 拟黄毛蠓 Dasyhelea subflava Yu et Hao;无偶毛蠓 Dasyhelea viduus Yu。
蠓虫分类
河 北 大 学 工 商 学 院实验报告题目——蠓虫分类1. 实验问题蠓虫分类问题:生物学家试图对两类蠓虫(Af 与Apf)进行鉴别,依据的资料是蠓虫的触角和翅膀的长度,已经测得9只Af 和6只Apf 的数据,(触角长度用x 表示,翅膀长度用y 表示)具体数据为:Af 类触角和翅膀长度现需要解决三个问题:(1)如何凭借原始资料(15 对数据,被称之为学习样本)制定一种方法,正确区分两类蠓虫;(2)依据确立的方法,对题目提供的三个样本:(1.24,1.80),(1.28,1.84),(1.40,2.04)加以识别;(3)设Af 是宝贵的传粉益虫,Apf 是某种疾病的载体,是否应该修改分类方法。
2.符号说明判别函数:()g p分界线方程:123a 0x a y a ++=3.问题分析与建模3.1问题分析这是一个判别问题,建模的目标是寻找一种方法对题目提供的三个样本进行判别。
首先根据学习样本的15对数据画出散点图,图中,Af 用+ 标记,Apf 用0 标记。
编写程序huitu.m(见Matlab 求解部分),得到散点图(见下图),观察图形,可以发现,Af 的点集中在图中右下方,而 Apf 的点集中在图中左上方。
客观上存在一条直线 L 将两类点分开之间,如果确定了直线L 并将它作为 Af 和 Apf 分界线,就有了判别的方法。
确定直线 L 应依据问题所给的数据,即学习样本。
设直线的方程为123a 0x a y a ++=1.1 1.15 1.2 1.25 1.3 1.35 1.4 1.45 1.5 1.55 1.61.31.41.51.61.71.81.922.1对于平面上任意一点(p ,如果该点在直线上,将其坐标代入直线方程则使方程成为恒等式,即方程左端为零;如果点 (,)p x y 不在直线上,将其坐标代入直线方程,则方程左端不为零。
由于 Af 和 Apf 的散点都不在所求的直线上,故将问题所提供的数据代入直线方程左端所得到的表达式的值应有大于0或者小于0两种不同的结果。
蠓虫分类论文
摘要现实生活中,我们要对许多事物分类,有了新的事物,我们要将其划入已知的类别,这就需要建立相关的模型和规则。
有两种蠓虫Af和Apf巳由生物学家W.L Grogan和W.W.Wirth(1981年)根据它们的触角长度和翼长加以区分。
对已知的18组数据(6只Apf和9只Af蠓虫的触角长度和翼长,3只待分类的蠓虫数据)本文分别用距离判别模型和Bayes判别模型对蠓虫的分类问题进行了讨论,用误判概率对模型的好坏进行了讨论,回代误判率和交叉确认误判率分别为0和6.67%,得到合理的结果,并且用两种方法分别对未知的3只蠓虫分了类,模型是在总体是二维正太总体假设下建立的,所以最后还对总体的正态性做了统计检验。
关键字:判别分析距离判别 Bayes判别一、 问题重述两种蠓虫Af 和Apf 巳由生物学家W .L Grogan 和W.W.Wirth(1981年)根据它们的触角长度和翼长加以区分。
现测得6只Apf 和9只Af 蠓虫的触角长度和翼长识别的依据是蠓虫的触角和翅膀的长度的数据(见附录一),现在要根据数据,制定一种方法,正确区分两类蠓虫;并且将建立的模型将用于已知触角长和翼长三个待定的样本进行识别。
且在假设Af 是宝贵的传粉益虫,而Apf 是某种疾病的载体的情况下,对模型加以改进。
二、 模型假设1、假设两个蠓虫总体都服从二维正太分布;2、假设两总体协方差矩阵相等;3、两总体的先验概率“按比例分配”,即各自的容量与总容量的比值;4、误判后造成的损失相等。
三、 符号约定与说明1、i G :表示总体,i=1,2;2、i ∑:总体协方差,i=1,2,该符号上面打尖角符表示估计值;3、i μ:总体均值向量,i=1,2;4、2(,)i d x G :x 到i G 的马氏平方距离,i=1,2;5、()i W x :判别函数,i=1,2;6、i p :i G 的先验概率,i i n p n=,其中i n 是i G 的训练样本的容量;7、(|)i P G x :i G 的后验概率,;8、(|,)P i j R :在判别准则R 下,将来自j G 的样品误判来自于i G 的概率: 9、()i f x :总体i G 的概率密度函数;10、(|)c i j :将来自j G 的样品误判来自于i G 后带来的损失。
南方蠓虫叮咬毒性大、特奇痒
蠓,小如芝麻!咬人后:蠓虫,成虫体小,多数种类的雌蠓于交配后吸血,且咬人甚剧,故蠓俗称“小咬”,也称“蟆子”、“墨墨蚊”。
蠓与蚊子很相似,但更小,大约只有芝麻大小,外表为黑褐色。
蠓在夏秋季节最为常见,常成群的飞舞在树林、天地、草坪等潮湿的地方,早晨和黄昏时间最为活跃。
蠓通常喜欢在阴暗、有枯叶的地方繁延后代。
蠓虽然比蚊子小,但比蚊子更凶,一般一只蚊子每次会叮咬一两口,而蠓一次就会叮咬八到十口,只要露在外面的皮肤就可能遭到袭击,如手、脚、手臂、腿、脖子等。
症状:蠓同蚊子一样在叮咬人时会吸血,叮咬后伤口会发痒,之后变红、肿胀,痒的更严重。
与蚊子不同的是,蠓叮咬引起的斑块比较大,摸上去硬硬的,水肿也比较明显,局部的毛孔变大,成为一个一个向下凹陷的小点,看上去好像桔子皮一样,有时还会出现发炎、水泡。
蠓叮咬的地方很痒,一般的花露水、驱风油也不能止痒、消肿。
红肿常常需要几天才会消散,比蚊子叮咬更难愈合,消散后可有短暂的色素沉着,之后会恢复正常。
治疗:对于蠓叮咬后引起的红肿、发痒并没有太好的办法,只能试着使用一些止痒、消肿的药物,但效果往往并不好。
有时使用太多的止痒药物可引起过敏,使病情更为复杂,如果叮咬伤口出现新的感染、过敏时要及时看医生。
另外,注意不要用手搔抓,以免溃烂或出现新的感染。
防范:在进入树林、草坪等潮湿、阴暗的地方时最好穿长裤、长袖的衣服,将蠓拒之门外。
保持住所周围干爽,有充足的阳光,因为阳光照射可使其死亡。
经常修剪花草树木,清理枯叶,使蠓没有繁殖之地。
与疾病的关系:蠓叮吸人血,被叮咬处常出现局部反应和奇痒,甚至引起全身性过敏反应,更重要的是蠓可传播多种疾病。
目前已知蠓可作为18种人畜寄生虫的媒介和可携带20余种与人畜有关的病毒。
在我国,蠓与人体疾病的关系了解得尚不够清楚。
在福建和广东,曾于自然界捕获的台湾拉蠓体内分离出流行性乙型脑炎病毒,但该蠓是否可作传播媒介,尚有待证实。
被咬后的治疗及措施:被蠓咬后,应以消炎、止痒、防治继发感染为原则。
蠓虫分类之Apf与Af
蠓虫分类问题研究摘要蠓虫跟蚊子一样,雄的吸食植物汁液,雌的吸血,蠓虫也会传播疾病,被蠓虫叮咬后会出现局部反应或奇痒,甚至引起全身性过敏反应。
蠓对人的危害主要是雌檬叮刺吸血,常可致皮肤丘疹,奇痒难忍或继发感染。
人类疾病中由蟑为堤介而传播的病原体有二类:即丝虫和病毒,蠓媒性丝虫病种类繁多且广泛分布于各地。
蠓类携带的病毒有乙型脑炎病毒、辛布组病毒,畜、禽的蠓媒性疾病,包括寄生虫病和病毒性疾病:原虫病12种,蠕虫病12种,病毒病22种以上。
其中有一些是人、畜共患病的病原体,由此可见,蠓对人的危害是很大的。
因此,准确地对蠓虫进行分类至关重要。
模型一根据题中已知数据,绘制两类蠓虫触长与翅长的散点图,然后对散点图稍作处理,用一条射线将图形分成两大区域,一部分代表Apf蠓虫,另一部分代表Af蠓虫。
模型二根据散点图,假设蠓虫种类之余仅与触长有关,建立建立隶属函数,并通过最大隶属度原则,判别出触长、翅长为(1.28,1.84)的蠓虫属于Apf蠓虫,触长、翅长为(1. 40,2.04)的蠓虫属于Af 蠓虫,而触长、翅长为(1.24,1.80)的蠓虫处于模糊状态,不能确定其属于哪一类蠓虫。
模型三如果Af是宝贵的传粉益虫,而Apf是某疾病的载体,那么在这一新的条件下,新的特征不会影响根据触长和翅长来区分蠓虫是属于Apf或Af的结果,但这一新特征会影响消除蠓虫的实验方法。
Apf实害虫,若他的危害及大,为了不让他漏网,宁可把Af 误判为Apf,同理,若Af为传粉益虫,且它是一种珍稀物种,则需要重点保护,宁可把Apf误判为Af来加以保护。
由问题二知,由模型二无法判别触长、翅长为(1.24,1.80)的蠓虫属于哪一种类,因此,需对模型加以改进。
关键词:蠓虫、隶属函数、最大隶属度原则一、问题重述1.1背景知识问题选自美国大学生数学模型竞赛一个题目——蠓的分类, 其大意是:生物学家W.L Grogan 和W.W.Wirth试图将两种蠓Af和Apf进行鉴别,给出了9只Af和6只Apf蠓虫的触角长度和翅膀长度的数据,已知Af是宝贵的传粉益虫,Apf是某种疾病的载体, 要求建立一种模型,正确区分两类蠓虫。
蠓虫的分类模型
全部大于零,即 p1 f1 p2 f2 ,所以待判的三个蠓虫均属于 Apf类.
五、灵敏度分析
本模型在对问题的分析中,假设两个总体 的协方差矩阵是相等的,而实际上,两个总体 的协方差矩阵不一定相等,且两个总体的协方 差矩阵是否相等对结果有较大影响. 因此在解 决实际问题时,首先要判别两个总体的协方差 矩阵是否相等。 对本模型,我们需要进行误差 分析。
1、 回代误判率估计
设 G1, G2 为两个总体,X1, X 2 , , X m 和 Y1,Y2 , ,Yn 是分别来自 G1, G2 的训练样本,以全体训练样本作为
m+n 个新样品,逐个代入已建立的判别准则中判别其归 属,这个过程称为回判。
若属于G1 的样品被误判判为属于G1 的个数为N2 个,则误判
率估计为:
p N1 N2 / m n.
我们利用Matlab进行编程计算,所得结果为0.
2、交叉误判率估计 交叉误判率估计是每次剔除一个样品,利用其余的
m+n-1 个训练样本建立判别准则再用所建立的准则对
删除的样品进行判别。对训练样本中每个样品都做如上 分析,以其误判的比例作为误判率。 步骤:
实际生活中可能不完全成立,所以有一定局限性.
3、模型的推广 本模型还可以用别的方法如人工神经网络法进行求解,
假设条件也可以放宽,这样得出的结论才更准确.
(4) 若 d<0 ,则 x 属于A类,若 d>0 , 则 x 属于B类; (5)模型的求解:我们利用Matlab软件进行编程, 可以求出三个样本到A类与B类的距离之差分别为,
d 4.3279, 2.7137, 3.9604
三个均为负值,这说明三个样本到A类的距离要 近一点,所以这三个样本都应归于Apf类.
蠓虫分类
蠓虫分类一、问题重述生物学家试图对两类蠓虫(Af与Apf)进行鉴别,依据的资料是蠓虫的触角和翅膀的长度,已经测得9只Af和6只Apf的数据,(触角长度用x 表示,翅膀长度用y表示)具体数据为:Af 类触角和翅膀长度Apf类触角和翅膀长度现需要解决三个问题:(1)根据原始资料15 对数据(被称之为学习样本) ,制定一种方法,区分两类蠓虫;(2)依据确立的方法,对题目提供的三个样本:(1.24,1.80),(1.28,1.84),(1.40,2.04)加以识别;(3)设Af是宝贵的传粉益虫,Apf是某种疾病的载体,是否应该修改分类方法。
二、问题分析利用两类蠓虫(Af与Apf)触角和翅膀长度数据绘制散点图:由两类蠓虫触角和翅膀长度关系分布可见,两类蠓虫在触角和翅膀长度关系上有较明显差异。
所以,我们可以用马氏距离分类方法对其进行分类。
三、模型假设1、样本蠓虫的性别不会对分类造成影响。
2、这些数据是从两个不同的双变量正态种群中获取到。
3、翅膀长度和触角长度作为分类两个物种的指标,其准确性是等价的。
4、翅膀长度和触角长度足以确定蠓虫的分类。
5、假定蠓虫只存在Af和Apf两类,不存在第三类。
6、用触角长与翼长来判别蠓虫是充分的。
7、所给出的样本数据是无误差的,且两种群Af和Apf的触角的及翼长的期望值、标准差、相关系数与数据给出的样本统计量一致。
四、假设的合理性1、性别不存在影响由于单个蠓虫个体的性别不是作为数据的一部分,我们必须假设要么蠓虫是没有性别差异的,即同种蠓虫不同性别间不存在巨大差异。
2、二元正态的评价有多种不同的方法来评估二元正态种群的样本数据。
一种方法是将数据点转换到4维球面;另一种方法,是简单检查边际数据点是否是正态的。
我们选择了一种折中的方法即chi-square 法,检查概率的水平曲线。
对于每个物种,大约一半的数据点列X 落在椭圆'122(((0.5)X X---≤∑μ)μ)χ中,其中u 是种群的均值(翅膀和触角长度)的向量,∑是2× 2的种群协方差矩阵。
中国库蠓属(双翅目:蠓科)的分类研究
中国库蠓属(双翅目:蠓科)的分类研究目的:通过对中国蠓科库蠓种类进行调查与整理,修订二囊亚属中12个种类的形态描述及数据,发现新的分类单元,丰富我国库蠓物种的多样性,为库蠓分类及蠓传疾病的研究提供基础数据。
运用几何形态学方法,将传统分类的形态特征数据化,更加客观准确地对库蠓种类进行鉴别及比较分析,从而达到快速、准确鉴定吸血蠓的目的。
通过对库蠓进行亚属间、种间及单个种超微结构观察,更加清晰、直观地呈现其形态特征及差异,从而达到准确地对库蠓种类,尤其是近似种进行描述和区分。
方法:1.种类描述:检视库蠓玻片标本,在显微镜下观察其形态特征,并记录种的详细特征,如:是否有柔毛、复眼是否连接、唇基片鬃数量、大颚齿数量、小颚齿数量、触角嗅觉器分布、感觉器窝有无、翅斑分布、胫节端鬃数量、受精囊数量及雄虫尾器特征,并测量PR、AR值及翅长和翅宽等。
查阅2005-2018年以来库蠓新种文献,将新增种类进行汇总,并通过野外调查,补充完善二囊亚属Avaritia名录。
2.几何形态学研究:将所得库蠓成虫标本在实验室内进行挑选、初步分类并制成永久玻片,在显微镜下根据其形态特征进行库蠓种类的鉴定,所有待用于几何形态分析的标本在显微镜下进行拍照,采集翅图像。
将所有翅图片进行编号,运用几何形态学相关软件对其进行标点,获得翅形态数据信息,并对其进行主成分分析(Principal component analysis,PCA)及典型变量分析(Canonical variate analysis,CVA)等。
3.扫描电镜部分:选取待观察的库蠓种类,进行逐级脱水后,在Leica EM CPD300CO2全自动临界点干燥仪中进行干燥。
将干燥后的标本在显微镜下进行解剖,所要观察的结构在体视镜下用双面导电胶粘到样品台上,用高级冷溅射镀膜仪Leica EM SCD050进行喷金,最后运用钨灯丝环境扫描电子显微镜FEI Quanta 450观察其超微结构,并对其进行对比及描述。
蠓虫的分类模型
(3) 利用按比例分配方法估计两个总体的先验概率: 两类蠓虫所占比例即为:
p1=6/(6+9)=0.4; p2=9/(6+9)=0.6;
(4) m1 mean( A), m2 mean(B), s1 cov( A), s2 cov(B)
s 5*s1 8*s2 /13
(5) 计算d,其中 d 为样本 x 到总体 A,B 的马氏距离平方.
若给定一只蠓虫,如何正确地区分它 属于哪一类?
已知蠓虫类别的数据
触角 1.24 1.36 1.38 1.38 1.38 1.4 1.48 1.54 1.56
Af
翼长 1.72 1.74 1.64 1.82 1.9 1.7 1.82 1.82 2.08
触角 1.14 1.18 1.2 1.26 1.28 1.3
⑴ 从A样本开始,剔除其中一个样品,剩余的 m-1 个样
品与B中的全部样品建立判别函数; ⑵ 用建立的判别函数对剔除的样品进行判别;
(3)重复步骤①,②,直到A中的全部样品依次被删除, 又进行判别,其误判的样品个数记为 m12; (4)对B的样品重复步骤①,②,③直到B中的全部样品 依次被删除又进行判别,其误判的样品个数记为 n21 ;
通过回代误判率和交叉误判率我们可以说明本模型 是较准确的.
六、 模型的评价与推广
1、 模型的优点 本模型通过马氏距离判别法和贝叶斯判别法进行求解,
对三个未知样本进行判别,在灵敏度分析中继而对误判率 进行分析,得出的结果较准确,较具有现实意义.
Apf
翼长 1.78 1.96 1.86 2.0 2.0 1.96
未知类别的三个样本数据:
(1.24,1.8)、(1.28,1.84)、(1.4,2.04)
案例蠓虫分类
案例 蠓虫分类问题背景 两种蠓虫Af 和Apf 已由生物学家W.L.Grogon 和W.W.Wirth (1981)根据它们的触角长度、翅膀长度加以区分. 现测得6只Apf 和9只Af 的触长、翅膀长的数据如下:问题 ⑴如何根据以上数据,制定一种方法正确区分两种蠓虫?⑵将你的方法用于触长、翅长分别为()()()1.24,1.80,1.28,1.84,1.40,2.04的3个样本进行识别.该问题属于概率统计模型.问题分析与建模一、问题分析将蠓虫的触长和翅长作为分量,给出的两类蠓虫的数据构成两个不同总体的二维向量,其中Apf 类蠓虫与Af 类蠓虫构成的向量分别记为{}{}11262129,,,,,,,.G G αααβββ==由此画出两类蠓虫触长和翅长的散点图.散点图表示两类蠓虫还是有比较明显的区别. 即两类蠓虫的触长、翅长向量与x 轴(触长)的夹角有明显的区别.以两类蠓虫的触长、翅长的均值向量为基准,凡与Apf 的基准向量夹角余弦大于与Af 的基准向量夹角余弦的蠓虫归为Apf ,反之,则归为Af .二、模型建立⑴计算Apf 和Af 两类蠓虫的均值向量661111,.66i i i i ααββ====∑∑ ⑵对于待判定的蠓虫x 分别计算()()cos ,,cos ,.x x αβ其中,()cos ,x α定义为 ()cos ,.x x x ααα⋅=⑴⑶建立判别函数 ()()cos ,cos ,.d x x αβ=- ⑵相应的判别准则为:准则:()()0,Apf,0,Af.d x x d x x >∈⎧⎪⎨<∈⎪⎩ ⑶三、解模按上面分析过程,建立相应的m 文件,并对给定的三个蠓虫进行识别,得到数据如下:即三个蠓虫均属于Apf .四、结果分析对判定准则可靠性分析的常用方法是回代误判率和交叉误判率.误判率定义 若有1N 个属于1G 的样品被误判为属于2G ,2N 个属于2G 的样品被误判为属于1,G 两类物品的总数是P ,则定义误判率为12.N N P+ ⑷⑴回代误判率 设12,G G 为两个总体,12,,,m X X X 和12,,,n Y Y Y 是分别来自12,G G 的训练样本,以这些训练样本作为m n +个新样品,逐个代入已建立的判定准则以确定其归属,整个过程称为回代. 若有1N 个属于1G 的样品被误判为属于2G ,2N 个属于2G 的样品被误判为属于1,G 则误判率的估计值为 12.N N p m n+=+显示结果为零,即没有误判.⑵交叉误判率交叉误判率是每次剔除一个样品,利用其余的训练样本建立判别准则,再用所建立的准则对删除的样品进行判定,对训练样本中每个样品都作如上分析,以其误判的比例作为误判率. 具体过程如下:①从总体为1G 的训练样本开始,剔除其中每一个样品,剩余的1m -个样品与2G 中的全部样品建立判别函数;②用建立的判别函数对剔除的样品进行判别;③重复上述步骤,直到1G 中的全部样品依次被剔除、判别,其误判的总数记为12m ; ④对2G 的样品重复步骤①②③,直到2G 中的样品全部被剔除、判别,其误判的个数记为21,m交叉误判率的估计值为 1221.m m p m n +=+ ⑸程序如下:计算结果为即两类不同类别的蠓虫都没有被误判.。
蠓虫分类之Apf与Af
蠓虫分类问题研究摘要蠓虫跟蚊子一样,雄的吸食植物汁液,雌的吸血,蠓虫也会传播疾病,被蠓虫叮咬后会出现局部反应或奇痒,甚至引起全身性过敏反应。
蠓对人的危害主要是雌檬叮刺吸血,常可致皮肤丘疹,奇痒难忍或继发感染。
人类疾病中由蟑为堤介而传播的病原体有二类:即丝虫和病毒,蠓媒性丝虫病种类繁多且广泛分布于各地。
蠓类携带的病毒有乙型脑炎病毒、辛布组病毒,畜、禽的蠓媒性疾病,包括寄生虫病和病毒性疾病:原虫病12种,蠕虫病12种,病毒病22种以上。
其中有一些是人、畜共患病的病原体,由此可见,蠓对人的危害是很大的。
因此,准确地对蠓虫进行分类至关重要。
模型一根据题中已知数据,绘制两类蠓虫触长与翅长的散点图,然后对散点图稍作处理,用一条射线将图形分成两大区域,一部分代表Apf蠓虫,另一部分代表Af蠓虫。
模型二根据散点图,假设蠓虫种类之余仅与触长有关,建立建立隶属函数,并通过最大隶属度原则,判别出触长、翅长为(1.28,1.84)的蠓虫属于Apf蠓虫,触长、翅长为(1. 40,2.04)的蠓虫属于Af 蠓虫,而触长、翅长为(1.24,1.80)的蠓虫处于模糊状态,不能确定其属于哪一类蠓虫。
模型三如果Af是宝贵的传粉益虫,而Apf是某疾病的载体,那么在这一新的条件下,新的特征不会影响根据触长和翅长来区分蠓虫是属于Apf或Af的结果,但这一新特征会影响消除蠓虫的实验方法。
Apf实害虫,若他的危害及大,为了不让他漏网,宁可把Af 误判为Apf,同理,若Af为传粉益虫,且它是一种珍稀物种,则需要重点保护,宁可把Apf误判为Af来加以保护。
由问题二知,由模型二无法判别触长、翅长为(1.24,1.80)的蠓虫属于哪一种类,因此,需对模型加以改进。
关键词:蠓虫、隶属函数、最大隶属度原则一、问题重述1.1背景知识问题选自美国大学生数学模型竞赛一个题目——蠓的分类, 其大意是:生物学家W.L Grogan 和W.W.Wirth试图将两种蠓Af和Apf进行鉴别,给出了9只Af和6只Apf蠓虫的触角长度和翅膀长度的数据,已知Af是宝贵的传粉益虫,Apf是某种疾病的载体, 要求建立一种模型,正确区分两类蠓虫。
蠓的分类问题
蠓的分类问题摘要:早在1981年,两类蠓虫Af和Apf已由生物学家W.L.Grogna和W.W.Wirth根据它们的触角长度和翼长加以区分。
根据翼长和触角长来识别一只标本是Af还是Afp是重要的。
本文采用判别分析法讨论蠓的分类问题。
针对问题一,采用Mahalanobis 距离判别法,Fisher判别法,Bayes判别法来区别给定的蠓是Af类或Afp类。
根据交叉确认估计法求得三种方法的误判率以及运用三种方法,得到问题二的最终判断结果如下表:问题三需要考虑各总体的先验概率和错判损失,故本文采用Bayes判别法,使得所带来的平均错判损失最小。
最终判断结果为:[1代表x=(1.24,1.80);2代表x=(1.28,1.84);3代表x=(1.40,2.04)]文章中涉及的三种判别分析方法是相当成熟的,用它们讨论蠓的分类问题非常恰当。
本文建立的模型便于修正,而且随着样品数量的增加,精度提高的很快,样本的期望值,标准差和相关函数也很容易重新计算。
关键字:Mahalanobis 距离判别法 Fisher判别法 Bayes判别法误判率错判损失先验概率一、问题重述两种蠓Af和Apf己由生物学家W.L.Grongan和W.W.Wirth(1981年)根据它们的触角长度和翼长加以区分(见图89A-1),6只Af蠓用“●”标记,9只Apf蠓用“○”标记。
问题一:给定一只Af或者Apf族的蠓,你如何正确地区分它属于哪一族?问题二:将你的方法用于触角长和翼长分别为(1.24,1.80)、(1.28,1.84)、(1.40,2.04)的三个标本。
问题三:设Af是宝贵的传粉益虫,Apf是某种疾病的载体,是否应该修改你的分类方法,若需修改,怎么改?二、模型假设与符号说明2.1模型假设1、两种蠓虫的触角长和翼长服从二元正态分布。
2、所给的样本数据是无误差的。
2.2符号说明2.2.1 问题一、二的符号说明Afx:Af族的均值向量Apfx:Apf族的均值向量AfS:Af族的协方差矩阵ApfS:Apf族的协方差矩阵X: 待判样本空间1G:Af族的总体2G:Apf族的总体2.2.2 文题三的符号说明:P总的误判概率;:L总的误判损失;(1/2):c把Apf误判为Af所引起的误判损失;(2/1):c把Af误判为Apf所引起的误判损失;1():f x类别Af的密度函数;2():f x类别Apf的密度函数;1:P类别Af的先验概率;2:P类别Apf的先验概率;三、问题分析3.1问题一、二的分析问题一要求根据某个个体的指标(触角长、翼长)值来判断该个体所属的类别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、论文评价标准 1.写作格式规范,语言流畅,没有错别字. 2.所有问题均做解答,模型合理,结果正确, 即回代误判率,交叉误判率为零. 3.论文有创新:新的指标体系;通过建立 模型事实求是地分析评价模型的优劣;先 验概率对判别结果的灵敏度分析等.
三、建立模糊集与灵敏度分析 建立模糊集合的关键在于两类蠓虫的差距拉开
若p1/p2<0.1148,则蠓虫x1从 Apf Af 若p1/p2<0.2574,则蠓虫x2从 Apf Af 若p1/p2<0.1380,则蠓虫x3从 Apf Af
问题3. Af是宝贵的传粉益虫,Apf是某种疾病的 载体,是否应该修改分类方法.
问题3的解决就转化为如何确定p1,p2,使得尽 可能地保护Af,最大可能地杀灭Apf
0.06
0.07
0.08
0.09
图1. 原始数据散点图
图2. 两类蠓虫模糊集散点图
Bayes判别的灵敏度分析 对于两个正态总体,当他们的协方差矩阵相等时, Bayes判别与马氏距离判别相比多了先验概率的信 息,如果先验概率有了变化,就会影响到最后判别 的结果. 由 p1 p2 1 p1 p2 1 p1 f1 p2 f 2 p1 / p2 e mp
④ 建立模糊矩阵 B (bij )152
bij (aij hij / h)./ hij
其中, ij wij wij h
j 1
原始数据
2
15
i 1
模糊集合 0.0449 0.0390 0.0468 0.0454 0.0475 0.0518 0.0593 0.0707 0.0787 0.0680 0.0634 0.0771 0.0780 0.1676 0.1837 0.1705 0.1798 0.1778 0.1714 0.1503 0.1408 0.1272 0.1481 0.1570 0.1324 0.1387
1.5400
1.5600
1.8200
2.0800
0.0838
0.0710
0.1333
0.1598
2.1
0.19
apf af
0.18 0.17
apf af
2 1.9
0.16 0.15 0.14
1.8 1.7
0.13
1.6 1.1 1.2 1.3 1.4 1.5 1.6
ห้องสมุดไป่ตู้
0.12 0.03
0.04
0.05
1.1400 1.1800 1.2000 1.2600 1.2800 1.3000 1.2400 1.3600 1.3800 1.3800 1.3800 1.4000 1.4800
1.7800 1.9600 1.8600 2.0000 2.0000 1.9600 1.7200 1.7400 1.6400 1.8200 1.9000 1.7000 1.8200
1.1400 1.1800 1.2000 1.2600 1.2800 1.3000 1.2400 1.3600 1.3800 1.3800 1.3800 1.4000 1.4800 1.5400 1.5600 1.7800 1.9600 1.8600 2.0000 2.0000 1.9600 1.7200 1.7400 1.6400 1.8200 1.9000 1.7000 1.8200 1.8200 2.0800
5. 表是三线表,上下两线要粗
6. 公式编辑器选择好,且公式居中 7. 千万不要使用自动编号 8. 程序全部放在附件中,且附件与正文分开,另 起一页. 9. 凡是有公式编辑器,都要点击格式段 落去掉两个勾
10.参考文献格式要规范
11. 首行缩进2字符 12. 正文字号要统一 13. 模型的推广是指从特殊到一般,原来6个apf, 9个af现在分别为m,n的判别公式
其中
mp m1 -m2 inv(S)x'-0.5m1inv(S)m'+0.5m2 inv(S)m2' 1
m1,m2分别为两类蠓虫的均值向量.
对于题中给出的三个未知蠓虫,我们计算出临界 值如表1所示
表1 先验概率临界值
未知 蠓虫
x1
0.1148695935662
x2
x3
p1/p2
0.25747129121515 0.13804044560414
wij aij ./ A 15aij / aij
i 1 15
③ 计算矩阵W的行和hi,列和lj,总和h
hi wij , l j wij , h w j , i 1, 2,...,15, j 1, 2
j 1 i 1 i 1 j 1 2 15 15 2
无论触长,还是翅长没有做 到楚汉分明
建立模糊集和的步骤:
① 计算已知蠓虫的均值向量 设 A (aij )152 为apf与af两类蠓虫组成的矩阵, 其中前6行为apf蠓虫,其余为af蠓虫.
1 15 A aij 15 i 1
② 计算各蠓虫与均值向量的比值矩阵 W (wij )152
蠓虫分类的模型讲评
一、论文存在的主要问题 二、论文评价标准
三、建立模糊集与灵敏度分析
1. 摘要单独一页,主要写每个问题依据何种理论, 利用什么方法,建立什么模型,得到的结果与结 论,以及模型的闪光点。 2. 要建立论文的文档结构模式,即有大纲,方法 演示:点击格式段落大纲级别(选择) 3. 中文宋体,英文与数字用Times New Roman 4. 表与图要有编号与名称,且表上、图下