蠓虫分类
蠓虫分类解读
5 / 29
T x ( a , w ) 对于给定的样品 ,称x与 x Af 之间的距离为x距
Af 类的“距离”,与Apf 类距离定义相同。 说到距离,我们一定首先想到欧氏距离,对于平面 上的两点(x1,y1 )(x2,y2),其间的欧氏距离定义 为: 2 2
11 / 29
将Mahalanobis
距离用于判别模型,其判别
准则为: 若 d M ( x, G1 ) d M ( x, G2 ) ,则判断 x G1 若 d M ( x, G1 ) d M ( x, G2 ) ,则判断 x G2 若 d M ( x, G1 ) d M ( x, G2 ) ,则可判断 x G1 也可判断 x G2 对于蠓虫分类问题,根据所给学习样本数据, 可求得
蠓虫分类
1 问题 两类蠓虫Af和Apf已由生物学家W.L.Grogna 和W.W.Wirth 根据它们的触角长度和翼长加 以区分,9只Af蠓虫用蓝色' + ' 标记,6只Apf 用红色 ' * ' 标记,根据给出的触角长度和翼 长识别出一只标本是Af还是Apf。 1)给定一只 Af 族或Apf族的蠓虫,你如何正 确区分它属于哪一族? 2)将你的方法用于触角长和翼长分别为 (1.24,1.80),(1.28,1.84),(1.40,2.04)的三个 标本 3)设Af是传粉益虫, Apf是某种疾病的载体, 如何修改你的分类方法?
2 / 29
A 1.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 1.56
W 1.72 1.74 1.64 1.82 1.90 1.来自0 1.82 1.82 2.08
蠓虫分类
蠓虫的分类问题(方红城曹鹏杨科)摘要在现实生活中,要对许多事物进行分类,有了新的事物,要将其划入已知的类别,就需要建立相关的模型和规则。
人工神经网络(Artifical Neural Network,ANN)是一种模拟人脑信息处理方法的非线性系统,它的独特性在于它是一种黑箱理论,具有较强的处理非线性问题的能力,比较适合于一些信息复杂、知识背景不清楚和推理规则不明确问题的建模,如本文中关于蠓虫类别判断的建模。
通过给定的训练样本进行机器训练,建立输出与输入变量之间的函数关系,建立非线性过程的模拟模型。
本文利用神经网络来进行蠓虫类别的判断。
根据蠓虫的触角长度和翼长加以区分,对已知的15组数据(两种蠓虫的触角长度和翼长)以及3只待分类的蠓虫运用BP(Back-Propogation)神经网络模型对蠓虫的分类问题进行了讨论,得到三只蠓是均属于Af 类的结果。
人工神经网络例如本论文中关于蠓虫类别判断的建模。
关键词:神经网络 BP算法1 问题的重述两种蠓虫Af和Apf已有生物学家..W L Grogan和..W W Wirth根据它们的触角长度和翼长加以区分(见附图),9只Af蠓虫用星形标记,6只Apf蠓虫用圆圈标记。
根据给出的触角长度和翼长识别一只标本是Af还是Apf是重要的问题:若给定一只Af或者Apf族的蠓虫,如何正确地区分它属于哪一族?将建立的模型用于触角长和翼长分别为(1.24,1.80),(1.28,1.84),(1.40,2.04)的三个标本,分别给出它们所属类别。
若设Af是宝贵的传粉益虫,Apf是某种疾病的载体,是否可以修改你的分类方法,若需修改,怎么改?Af 1 2 3 4 5 6 7 8 9触角长度 1.24 1.36 1.38 1.38 1.38 1.4 1.48 1.54 1.56翼长 1.72 1.74 1.64 1.82 1.9 1.7 1.82 1.82 2.08Apf 1 2 3 4 5 6触角长度 1.14 1.18 1.20 1.26 1.28 1.30翼长 1.78 1.96 1.86 2.00 2.00 1.962问题的分析如上的问题是有代表性的,它的特点是要求依据已知资料(9 只Af 的数据和6 只Apf 的数据)制定一种分类方法,类别是已经给定的(Af 或Apf)。
最新 广东省蠓科昆虫的种类及其分布的资料梳理-精品
广东省蠓科昆虫的种类及其分布的资料梳理蠓俗称“小咬”,是吸血骚扰、传播人畜疾病的重要双翅目昆虫。
曾经从广州地区的台湾蠛蠓(Lasiohelea taiwana) 体内分离出日本乙型脑炎病毒,荒川库蠓(Culicoides arakawae) 等是南方地区牛、马蓝舌病的主要媒介。
广东省地域广,地形气候复杂,蠓虫危害严重。
先后在珠海、中山等地进行过一些调查研究,但一直没有关于种类和地理分布的系统资料。
本文总结整理多年的研究资料,系统梳理广东省蠓科昆虫的种类及其分布,为蠓类的区系研究和防治研究提供依据。
1、材料与方法1. 1 采集地点选择广东省境内的广州、珠海、深圳、中山、台山、慧东、揭阳、肇庆、徐闻、雷州、湛江、韶关、始兴等 13 个市县作为采集地。
采集以广东沿海为主,东自揭阳、彗东等粤东地区,西至湛江、徐闻等雷州半岛。
1. 2 采集方法在蠓虫活动期综合采用挥网、帐诱、灯诱、人诱等方法,大量采集蠓虫标本。
毒瓶麻醉后,于白布或白纸上挑取蠓虫,生物解剖显微镜下初步分类。
1. 3 标本制作标本经脱水、腐蚀、清洗、展开、固定等处理,制作玻片标本。
Olympus 显微镜下准确鉴定。
1. 4 资料调研查阅研究国内外研究广东省蠓科昆虫的文献资料,掌握广东省蠓类的研究记录。
2、结果2. 1 种类共计发现蠓科 4 亚科 11 属 119 种,即细蠓亚科 Leptoconopinae 细蠓属 1 种,毛蠓亚科Dasyheleleinae 毛蠓属 24 种,铗蠓亚科 Forcipomyii-nae 裸蠓属 9 种,铗蠓属 17 种,蠛蠓属 10 种,蠓亚科Ceratopogoninae 库蠓属 40 种,埃蠓属 3 种,阿蠓属 5种,短蠓属 2 种,柱蠓属 3 种,尼蠓属 1 种,贝蠓属 4种。
(1) 细蠓属 Leptoconops Skuse,1889: 海峡细蠓Leptoconops fretus Yu et Zhan;(2) 毛蠓属 DasyheleaKieffer,1911: 角翼毛蠓 Dasyhelea alula Yu; 双钩毛蠓 Dasyhelea biunguis Kieffer; 泥污毛蠓 Dasyheleaborbonica Clastrier; 怪状毛蠓 Dasyhelea chimaira Yuet Wang; 山丘毛蠓 Dasyheleadeirus Yu; 双尖毛蠓Dasyhelea dioxyria Hao et Yu; 欧洲毛蠓 Dasyhelea eu-ropaea Remm; 超越毛蠓 Dasyhelea excellentisBorkent; 宽带毛蠓Dasyhelea fasciigera Kieffer; 分叉毛蠓 Dasyhelea fulcillatus Yu; 棕色毛蠓 Dasyhelea fus-cus Yu; 灰色毛蠓 Dasyhelea grisea Coquillett; 多刺毛蠓 Dasyhelea horridus Yu; 泸定毛蠓 Dasyhelea ludin-gensis Zhang et Yu; 小孢毛蠓 Dasyhelea microsporeaHao et Yu; 西部毛蠓 Dasyhelea occasus Zhang et Yu;喜愿毛蠓 Dasyhelea paragrata Remm; 淡色毛蠓 Dasy-helea pallidicola Yu; 小刺毛蠓 Dasyhelea saetula Yu;裂叶毛蠓Dasyhelea schizothrixi Lee et Wirth; 类常毛蠓 Dasyhelea subcommunis Yu; 矛状毛蠓 Dasyheleadoratos Yu; 拟黄毛蠓 Dasyhelea subflava Yu et Hao;无偶毛蠓 Dasyhelea viduus Yu。
蠓的分类
蠓的分类
生物学家发现了两类蚊子(或飞蠓)。
他们测量了这两类蚊子每个个体的翼长和触角长,把翼长作为纵坐标,触角长作为横坐标,那么每个蚊子的翼长和触角长决定了坐标平面的一个点。
他们一共测量了15个蚊子的数据,其中6个蚊子属于Apf 类,用黑点“.”表示;9个蚊子属Af 类,用小圆圈“ 。
”表示。
如果抓到三只新的蚊子,它们的触角长和翼长分别为(1.24,1.80 ), (1.28, 1.84)和 (1.40, 2.04),它们应分别属于哪一个种类?
要求:
1.利用两种不同的方法来进行处理,其中要求给出方法对应的判别准确率。
2.设计编程的要给出相应的过程。
3.小组可以进行讨论,但最后上交的材料对应的写作部分应该自己独立进行完成,我们将根据最后上交的材料给大家评定成绩。
4.上交时间初步定为第四周周一,由班长收齐并上交。
1.1
1.4 1.5 1.61.31.2
2.1
1.8
1.71.9
2.0
Af Apf。
褐飞虱
中文名称:褐飞虱英文名称:Brown rice planthopper中文别名:褐稻虱,俗称蛔虫、软壳蛔、蚰虫、蠓虫拉丁学名:Nilaparvata lugens(Stal)分布区域:1、终年繁殖区:北纬19℃以南的海南省南部。
2、少量越冬区:北纬19-25℃之间,又以北纬12℃左右以南为常年稳定越冬区。
3、不能越冬区:北纬25℃以北的广大稻区。
形态特征:成虫有长翅型和短翅型两种。
长翅型体长4—5毫米,黄褐、黑褐色,有油状光泽,颜面部有3条凸起的纵脊,中脊不间断,雌虫腹部较长,末端呈圆锥形,雄虫腹部较短而瘦,末端近似喇叭筒状。
短翅型成虫翅短,余均似长翅型。
卵产于稻株叶鞘组织中,卵帽外露,2~3粒至20粒为一卵块;卵块中卵粒前端单行排列,后端挤成双行,卵粒细长,微弯曲,若虫有5个龄期,形均似成虫。
l龄灰白色,2龄淡黄褐色,无翅芽,后胸后缘平直,腹背面中央均有一淡色粗“T”形斑纹;3龄体褐至黑褐色,翅芽显现,第3节背上各出现一对白色蜡粉的三角形斑纹,似2条白色横线。
4—5龄时体斑纹均似3龄,但体形增大,斑纹更明显,与短翅型成虫的区别是短翅型左右翅靠近,翅端圆,翅斑明显,腹背无白色横条纹。
为害作物:水稻为害症状:成虫和若虫群集稻株茎基部刺吸汁液,并产卵于叶鞘组织中,致叶鞘受损出现黄褐色伤痕。
轻者,水稻下部叶片枯黄,影响千粒重;重者,生长受阻,叶黄株矮,茎上褐色卵条痕累累,甚至死苗,毁秆倒状,形成枯孕穗或半枯穗量损失很大。
分类属性:同翅目飞虱科发病特点:褐飞虱是一种迁飞性害虫,每年发生代数,自北而南递增。
越冬北界随各年冬季气温高低而摆动于北纬21—25℃间,常年在北纬25℃以北的稻区不能越冬,因此我国广大稻区的初次虫源均随春夏、暖湿气流,由南目剑匕逐代逐区迁入。
长翅型成虫具趋光性,闷热夜晚扑灯更多;成、若虫一般栖息于阴湿的稻丛下部;成虫喜产卵在抽穗扬花期的水稻上,产卵期长,有明显的世代重叠现象。
卵,多产子叶鞘中央肥厚部分,少数产在稻茎、穗颈和叶片基部中脉内,每头雌虫一般产卵300—700粒,短翅型成虫产卵量比长翅型多。
蠓虫分类
河 北 大 学 工 商 学 院实验报告题目——蠓虫分类1. 实验问题蠓虫分类问题:生物学家试图对两类蠓虫(Af 与Apf)进行鉴别,依据的资料是蠓虫的触角和翅膀的长度,已经测得9只Af 和6只Apf 的数据,(触角长度用x 表示,翅膀长度用y 表示)具体数据为:Af 类触角和翅膀长度现需要解决三个问题:(1)如何凭借原始资料(15 对数据,被称之为学习样本)制定一种方法,正确区分两类蠓虫;(2)依据确立的方法,对题目提供的三个样本:(1.24,1.80),(1.28,1.84),(1.40,2.04)加以识别;(3)设Af 是宝贵的传粉益虫,Apf 是某种疾病的载体,是否应该修改分类方法。
2.符号说明判别函数:()g p分界线方程:123a 0x a y a ++=3.问题分析与建模3.1问题分析这是一个判别问题,建模的目标是寻找一种方法对题目提供的三个样本进行判别。
首先根据学习样本的15对数据画出散点图,图中,Af 用+ 标记,Apf 用0 标记。
编写程序huitu.m(见Matlab 求解部分),得到散点图(见下图),观察图形,可以发现,Af 的点集中在图中右下方,而 Apf 的点集中在图中左上方。
客观上存在一条直线 L 将两类点分开之间,如果确定了直线L 并将它作为 Af 和 Apf 分界线,就有了判别的方法。
确定直线 L 应依据问题所给的数据,即学习样本。
设直线的方程为123a 0x a y a ++=1.1 1.15 1.2 1.25 1.3 1.35 1.4 1.45 1.5 1.55 1.61.31.41.51.61.71.81.922.1对于平面上任意一点(p ,如果该点在直线上,将其坐标代入直线方程则使方程成为恒等式,即方程左端为零;如果点 (,)p x y 不在直线上,将其坐标代入直线方程,则方程左端不为零。
由于 Af 和 Apf 的散点都不在所求的直线上,故将问题所提供的数据代入直线方程左端所得到的表达式的值应有大于0或者小于0两种不同的结果。
数学建模例题
建模课程设计-考试题目1. 蠓虫的分类实验目的: 学习利用向量夹角余弦建模方法进行生物种类的判别, 熟悉回代误判率与交叉误判率的计算, 熟练掌握Matlab关于向量的内积, 范数, 均值的计算, 提高综合编程能力.问题描述两种蠓虫Af和Apf已由生物学家根据触角长度和翅长加以区分, 现测得6只Apf和9只Af蠓虫的触长, 翅长的数据如下:Apf: (1.14,1.78), (1.18,1.96), (1.20, 1.86), (1.26, 2.00), (1.28, 2.00), (1.30, 1.96)Af: (1.24, 1.72), (1.36, 1.74), (1.38,1.64), (1.38,1.82), (1.38, 1.90), (1.40, 1.70), (1.48, 1.82), (1.54, 1.82), (1.56, 2.08)问题1. 如何依据以上数据, 制定一种方法, 正确区分两类蠓虫.2. 将你的方法用于触长, 翅长分别为(1.24, 1.80), (1.28, 1.84), (1.40, 2.04) 的3个样本进行识别.3. 设Af 是宝贵的传粉益虫, Apf是某种疾病的载体, 是否应该修改分类方法.4. 衡量两个向量之间的接近程度还有哪些方法, 据此建立新的判别方法, 并与上述方法进行比较, 由此你有何发现?2. 最速落径实验目的1. 熟悉用计算机模拟解决物理中的极小值问题2. 进一步熟悉多元函数求极值问题实验内容及要求问题提出: 如下图所示:图1设A, B 是不在一条铅垂线上的两点, 在连接A, B 两点的所有光滑曲线中, 找出一条曲线, 使得初速度为零的质点, 在重力作用下, 自A 点下滑到B 点所需的时间最短.分析: 由A 到B 的曲线如果是直线AB, 质点沿直线AB 的运动是匀加速的,0,A B v v ==平均速度()/22A B v v v =+=, 所需总时间为T =问题1: 对从A 到B 的曲线, 如果是a) 圆弧, b) 抛物线, 计算所需的时间, 圆弧和抛物线的选择不是唯一的, 你可任选一条, 看哪种方案所需时间少些. 时间与曲线的选择有关吗?问题3: 作图, 将模拟出来的最速落径曲线和理论曲线arccos(1)x y =-相比较, 比较模拟效果如何.问题4: 理论推导最速落径曲线方程: arccos(1)x y =-提示: 根据费马定律, 光在媒质中总是走最省时间的路线, 是否可以让质点模拟光的行为, 按照光的折射定律运行, 这样走出的轨迹就是最速路径.3. 投资的收益与风险实验目的: 学会利用线性规划建立数学模型的方法, 利用Matlab 在给定风险的条件下求解最大收益的投资方案, 建立风险与收益的函数关系.实验内容及要求1. 问题描述: 市场上有n 种资产(如股票, 债券等等), , (1,2,,)i S i n =供投资者选择, 某公司有数额为M 的一笔相当大的资金可用作一个时期的投资, 公司财务人员对这n 种资产进行了评估, 估算出在这一时期内购买i S 的平均收益率为i r , 并预测出购买i S 的风险损失率为i q , 考虑到投资越分散, 总的风险就越小, 公司确定, 总体风险可用所投资的i S 中最大的一个风险来度量.购买i S 要付交易费, 费率为i P , 并且当购买额不超过给定值i u 时, 交易费按购买额i u 计算, (不买无需付费), 另外, 假定同期银行存款利率是0r , 既无交易费又无风险0(5%)r = (1) 已知4n =时的相关数据如表1:表1M 息, 使净收益尽可能大, 而总体风险尽可能小.(2) 试就一般情况对以上问题进行讨论, 并利用下表的数据进行计算2. 问题的分析与模型的建立建立一个确定投资比例的向量模型, 使资产组合的净收益尽可能大, 而总体风险尽可能小.设01234,,,,x x x x x 分别是银行存款和投资于1234,,,s s s s 的投资比例系数, 由于银行存款既无交易费又没有风险, 故000,0p q == 总体风险可用所投资的i S 中最大的一个风险来度量, 于是投资组合总体风险为04max{}i i i F x q ≤≤=由于题设给出M 为相当大的一笔资金, 为了简化模型, 认为该公司投资每一项资产都超过给定的定值i u , 于是资产组合的平均收益率为40()i i i i R x r p ==-∑为了使平均收益率尽可能大, 而总体风险尽可能小, 采取固定总体风险的一个上界q , 使得总体收益取得最大, 运用Matlab 软件, 对总体风险的上界从[0,3], 取步长为0.01, 计算301种不同风险时的总体收益的最大值及相应的投资比例系数. 问题:1. 绘制投资方案的净收益率与风险损失率的关系曲线, 并分析之. 对该曲线给出函数描述.2. 计算风险为0.1,0.2,,2.5时的投资比例系数与收益.3. 建立一般情况下的投资组合模型, 并利用2中数据进行计算.4. 湖泊水质富营养化的综合评价实验目的: 学习利用距离函数建模的方法,掌握客观性圈中的变异系数法以及综合评价的基本方法,熟练掌握Matlab 处理矩阵的各种方法。
最新 广东省蠓科昆虫的种类及其分布的资料梳理-精品
广东省蠓科昆虫的种类及其分布的资料梳理蠓俗称“小咬”,是吸血骚扰、传播人畜疾病的重要双翅目昆虫。
曾经从广州地区的台湾蠛蠓(Lasiohelea taiwana) 体内分离出日本乙型脑炎病毒,荒川库蠓(Culicoides arakawae) 等是南方地区牛、马蓝舌病的主要媒介。
广东省地域广,地形气候复杂,蠓虫危害严重。
先后在珠海、中山等地进行过一些调查研究,但一直没有关于种类和地理分布的系统资料。
本文总结整理多年的研究资料,系统梳理广东省蠓科昆虫的种类及其分布,为蠓类的区系研究和防治研究提供依据。
1、材料与方法1. 1 采集地点选择广东省境内的广州、珠海、深圳、中山、台山、慧东、揭阳、肇庆、徐闻、雷州、湛江、韶关、始兴等 13 个市县作为采集地。
采集以广东沿海为主,东自揭阳、彗东等粤东地区,西至湛江、徐闻等雷州半岛。
1. 2 采集方法在蠓虫活动期综合采用挥网、帐诱、灯诱、人诱等方法,大量采集蠓虫标本。
毒瓶麻醉后,于白布或白纸上挑取蠓虫,生物解剖显微镜下初步分类。
1. 3 标本制作标本经脱水、腐蚀、清洗、展开、固定等处理,制作玻片标本。
Olympus 显微镜下准确鉴定。
1. 4 资料调研查阅研究国内外研究广东省蠓科昆虫的文献资料,掌握广东省蠓类的研究记录。
2、结果2. 1 种类共计发现蠓科 4 亚科 11 属 119 种,即细蠓亚科 Leptoconopinae 细蠓属 1 种,毛蠓亚科Dasyheleleinae 毛蠓属 24 种,铗蠓亚科 Forcipomyii-nae 裸蠓属 9 种,铗蠓属 17 种,蠛蠓属 10 种,蠓亚科Ceratopogoninae 库蠓属 40 种,埃蠓属 3 种,阿蠓属 5种,短蠓属 2 种,柱蠓属 3 种,尼蠓属 1 种,贝蠓属 4种。
(1) 细蠓属 Leptoconops Skuse,1889: 海峡细蠓Leptoconops fretus Yu et Zhan;(2) 毛蠓属 DasyheleaKieffer,1911: 角翼毛蠓 Dasyhelea alula Yu; 双钩毛蠓 Dasyhelea biunguis Kieffer; 泥污毛蠓 Dasyheleaborbonica Clastrier; 怪状毛蠓 Dasyhelea chimaira Yuet Wang; 山丘毛蠓 Dasyheleadeirus Yu; 双尖毛蠓Dasyhelea dioxyria Hao et Yu; 欧洲毛蠓 Dasyhelea eu-ropaea Remm; 超越毛蠓 Dasyhelea excellentisBorkent; 宽带毛蠓Dasyhelea fasciigera Kieffer; 分叉毛蠓 Dasyhelea fulcillatus Yu; 棕色毛蠓 Dasyhelea fus-cus Yu; 灰色毛蠓 Dasyhelea grisea Coquillett; 多刺毛蠓 Dasyhelea horridus Yu; 泸定毛蠓 Dasyhelea ludin-gensis Zhang et Yu; 小孢毛蠓 Dasyhelea microsporeaHao et Yu; 西部毛蠓 Dasyhelea occasus Zhang et Yu;喜愿毛蠓 Dasyhelea paragrata Remm; 淡色毛蠓 Dasy-helea pallidicola Yu; 小刺毛蠓 Dasyhelea saetula Yu;裂叶毛蠓Dasyhelea schizothrixi Lee et Wirth; 类常毛蠓 Dasyhelea subcommunis Yu; 矛状毛蠓 Dasyheleadoratos Yu; 拟黄毛蠓 Dasyhelea subflava Yu et Hao;无偶毛蠓 Dasyhelea viduus Yu。
蠓虫分类之Apf与Af
蠓虫分类问题研究摘要蠓虫跟蚊子一样,雄的吸食植物汁液,雌的吸血,蠓虫也会传播疾病,被蠓虫叮咬后会出现局部反应或奇痒,甚至引起全身性过敏反应。
蠓对人的危害主要是雌檬叮刺吸血,常可致皮肤丘疹,奇痒难忍或继发感染。
人类疾病中由蟑为堤介而传播的病原体有二类:即丝虫和病毒,蠓媒性丝虫病种类繁多且广泛分布于各地。
蠓类携带的病毒有乙型脑炎病毒、辛布组病毒,畜、禽的蠓媒性疾病,包括寄生虫病和病毒性疾病:原虫病12种,蠕虫病12种,病毒病22种以上。
其中有一些是人、畜共患病的病原体,由此可见,蠓对人的危害是很大的。
因此,准确地对蠓虫进行分类至关重要。
模型一根据题中已知数据,绘制两类蠓虫触长与翅长的散点图,然后对散点图稍作处理,用一条射线将图形分成两大区域,一部分代表Apf蠓虫,另一部分代表Af蠓虫。
模型二根据散点图,假设蠓虫种类之余仅与触长有关,建立建立隶属函数,并通过最大隶属度原则,判别出触长、翅长为(1.28,1.84)的蠓虫属于Apf蠓虫,触长、翅长为(1. 40,2.04)的蠓虫属于Af 蠓虫,而触长、翅长为(1.24,1.80)的蠓虫处于模糊状态,不能确定其属于哪一类蠓虫。
模型三如果Af是宝贵的传粉益虫,而Apf是某疾病的载体,那么在这一新的条件下,新的特征不会影响根据触长和翅长来区分蠓虫是属于Apf或Af的结果,但这一新特征会影响消除蠓虫的实验方法。
Apf实害虫,若他的危害及大,为了不让他漏网,宁可把Af 误判为Apf,同理,若Af为传粉益虫,且它是一种珍稀物种,则需要重点保护,宁可把Apf误判为Af来加以保护。
由问题二知,由模型二无法判别触长、翅长为(1.24,1.80)的蠓虫属于哪一种类,因此,需对模型加以改进。
关键词:蠓虫、隶属函数、最大隶属度原则一、问题重述1.1背景知识问题选自美国大学生数学模型竞赛一个题目——蠓的分类, 其大意是:生物学家W.L Grogan 和W.W.Wirth试图将两种蠓Af和Apf进行鉴别,给出了9只Af和6只Apf蠓虫的触角长度和翅膀长度的数据,已知Af是宝贵的传粉益虫,Apf是某种疾病的载体, 要求建立一种模型,正确区分两类蠓虫。
蠓虫的分类
其中
(a1i , w1i ) , i 1, 2,39为属于Af 的样品,
T
(a2i , w2i )T , i 1, 26为属于Ap f 的样品。
对于给定的样品 x (a, w)T,称x与 x Af之间的距离为 x距Af类的“距离”,与Apf类距离定义相同。 说到距离,我们一定首先想到欧氏距离,对于 平面上的两点(x1,y1 )(x2,y2),其间的欧氏距离 定义为:
设任给一蠓虫 马氏距离分别为:
x (a, w)T ,则它到Af与Apf的
d M ( x, Af ) (171.40a 2 99.47w2 165.89aw 185.11a 125.79w 245.41)1/ 2 d M ( x, Apf ) (467.63a 2 263.79w2 502.36aw 175.27a 402.26w 245.06)1/ 2
距离判别模型中,把每个样品x= (a,w)T视为 二维空间中的一个点,我们可算得代表Af的9 个点的集合与代表Apf的6个点的集合各自的 中心: 1 9 1 9 T T xAf (a1 , w1 ) ( a1i , w1i ) ; 9 i 1 9 i 1 1 6 1 6 T T xApf (a2 , w2 ) ( a2i , w2i ) ; 6 i 1 6 i 1
因此,一个合理的判别准则应该考虑到每个总体 出现的可能性大小(即先验概率分布) 一般来说,将一个随机样品应该首先考虑判如有较 大可能出现的总体之中,设这g个总体出现的先验 概率分别为 q1 , q2 qg ,显然有
qi 0(i 1, 2 g )且 qi 1
i 1 g
蠓虫的分类
蠓虫的分类【摘要】已知有两种不同种类的蠓虫,他们可以由触角长和翼长加以区分。
现在我们有十五只样本的数据,我们想根据这些数据设计一种判别蠓虫种类的方法,并将其运用于三只未知类别的蠓虫上。
当然这里我们只考虑触角长和翼长对其分类的影响,而忽略其他的因素。
问题一: 有两种解决方案:1.在图中找出分界直线,建立判别函数,把需要判断的蠓虫的相关分别代如判别函数求值,根据值的特点得出结论;2.利用Fisher判别法检验,此方法可以用spss实现。
问题二: 两种模型求解结果都是:3只蠓虫都属于第一类(Af).问题三: 把标准作适当的倾斜,使得把等待判断的样品判断为Af的条件更极严格,宁可把益虫判断为害虫,也不要把害虫当作益虫。
【关键字】分界直线判别分析检验回代误判率一、问题的提出本问题是有关分类的问题,题中给出了两类蠓虫(Af和Apf)的翼长和触角长的坐标图:(见附录二)经摘录得具体数值为:要求建立模型,通过对两类蠓虫的特征提取,判断题中所给的三只蠓虫的所属类别,并针对一些特殊的问题给予解决的方案.二、模型的假设及符号说明【模型假设】1.假设判断两类蠓虫的类别时,可以只从翼的长度和触角长两个方面来考虑;2.题中所给的数据具有足够强的代表性,不是从大量样本中取出的特例。
【符号说明】模型一:T:判别函数的函数值;k:直线的斜率;b:直线在纵坐标上的截距;(x,y):蠓虫的信息,具体形式是(翼长,触角长).模型二:P:回代误判率;n1:第一类蠓虫的数量;n2: 第二类蠓虫的数量;n12: 原属于第一类的被误判为第二类的数量;n21:原属于第二类的被误判为第三类的数量;F1:第一类蠓虫的Fisher判别函数值;F2:第二类蠓虫的Fisher判别函数值;三、模型的建立与检验【模型一】1.模型的建立并求解观察图形,可以看出Af点集中在区域的左上方,而Apf集中在区域的右下方。
客观上存在一条直线把两类点分开,如果这条直线确定,就有了判别的方法。
【精选】数学建模案例分析
数学建模案例分析模型1 蠓虫分类问题背景 两种蠓虫和已由生物学家W.L.Grogon 和W.W.Wirth (1981)根据Af Apf 它们的触角长度、翅膀长度加以区分. 现测得只和只的触长、翅膀长的数据6Apf 9Af 如下:Apf()1.14,1.78()1.18,1.96()1.20,1.86()1.26,2.00()1.28,2.00()1.30,1.96Af()1.24,1.72()1.36,1.74()1.38,1.64()1.38,1.82()1.38,1.90()1.40,1.70()1.49,1.82()1.54,1.82()1.56,2.08问题 ⑴如何根据以上数据,制定一种方法正确区分两种蠓虫?⑵将你的方法用于触长、翅长分别为的个样本()()()1.24,1.80,1.28,1.84,1.40,2.043进行识别.如何考虑?该问题属于统计模型范畴!(属于黑洞问题)1.首先对已有数据进行分析.(测试)画出相应的散点图什么启发?从图中可以看出,两类蠓虫有明显的差别.问题是该如何识别.法1 用最小二乘法得到回归线:结果不理想.法2 用斜率的平均值构造直线结果?图中不同类别的蠓虫的区别还是比较明显的.如何做进一步的识别?用此方法对给定的三个蠓虫进行识别,若点在直线的上方,则判定为Apf,否则定为Af.由此建立识别函数dist.m. 对给定的样本进行识别,如果样本点在直线上方,则将该蠓虫识别为Apf(标示为1),否则识别为Af(标示为0).clear,clcApf1=[1.14,1.18,1.20 1.26 1.28 1.30];Apf2=[1.78 1.96 1.86 2.00 2.00 1.96];Af1=[1.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 1.56]; Af2=[1.72 1.74 1.64 1.82 1.90 1.70 1.82 1.82 2.08]; x=[Apf1,Af1];y=[Apf2,Af2];n=length(x);k=sum(y./x)/n;A=[1.24,1.80;1.28,1.84;1.40,2.04];n=size(A,1);p=[];for i=1:nd=A(i,2)-k*A(i,1);if d>0p=[p,1];elsep=[p,0];endenddisp(p)结果为1 1 1即:三个新样本的判定结果均为Apf!这样的判定是否有效?(模型解释)为解释判别法的有效性,引入交叉误判率.交叉误判率是每次剔除一个样品,利用其余的训练样本建立判别准则,根据建立的判别准则对删除的样品进行判定,以其误判的比例作为误判率. 具体过程如下:①从总体为的训练样本开始,剔除其中每一个样品,剩余的个样品与中的1G 1m -2G 全部样品建立判别函数;②用建立的判别函数对剔除的样品进行判别;③重复上述步骤,直到中的全部样品依次被剔除、判别,其误判的总数记为;1G 12m ④对的样品重复步骤①②③,直到中的样品全部被剔除、判别,其误判的个数2G 2G 记为21,m 交叉误判率的估计值为1221ˆ.m m pm n+=+程序为clear,clcApf1=[1.14,1.18,1.20 1.26 1.28 1.30];Apf2=[1.78 1.96 1.86 2.00 2.00 1.96];Af1=[1.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 1.56]; Af2=[1.72 1.74 1.64 1.82 1.90 1.70 1.82 1.82 2.08]; x=[Apf1,Af1];y=[Apf2,Af2];m1=length(Apf1);m2=length(Af1);n=length(x);k=sum(y./x)/n;A=[x',y'];p1=[];p2=[];for i=1:m1b=A(i,:);B=A;B(i,:)=[];b1=B(:,1);b2=B(:,2);k=sum(b2./b1)/(n-1);d=b(2)-k*b(1);if d>0p1=[p1,1];elsep1=[p1,0];endendfor i=m1+1:nb=A(i,:);B=A;B(i,:)=[];b1=B(:,1);b2=B(:,2);k=sum(b2./b1)/(n-1);d=b(2)-k*b(1);if d>0p2=[p2,1];elsep2=[p2,0];endenddisp(p1),disp(p2)结果为1 1 1 1 1 10 0 0 0 0 0 0 0 0结论:在这样的判定法则下,交叉误判率为零,说明方法还是有效的.模型2 饮酒驾车问题一、问题背景据报道,2003年全国道路交通死亡人数为10.4372万,其中因饮酒驾车造成的占有相当的比例.针对这种严重的道路交通情况,国际质量监督检查检疫局2004年5月31日发布了新的《车辆驾驶人员血液、呼气酒精含量阀值与检验》国家标准,新标准规定:车辆驾驶人员血液中的酒精含量大于或等于毫克/百毫升、小于毫克/百毫升为饮酒驾车;2080血液中的酒精含量大于或等于毫克/百毫升为醉酒驾车.大李在中午点喝了一瓶啤酒,8012下午点检查时符合新的驾车标准,紧接着他在吃晚饭时又喝了一瓶啤酒,为保险起见他6呆到凌晨点才驾车回家,又一次遭遇检查时却被定为饮酒驾车,这让他既懊恼又困惑,2为什么喝同样多的酒,两次检查结果却会不一样?请你参考下面给出的数据(或自己收集资料)建立饮酒后血液中酒精含量的数学模型,并讨论以下问题:1.对大李的情况做出解释;2.在喝了瓶啤酒或者半斤低度白酒后多长时间内驾车就会违反上述标准,在以下情3况下回答:⑴酒是自很短时间内喝的;⑵酒是在较长一段时间(比如小时)内喝的.23.怎样估计血液中的酒精含量在什么时间内最高?4.根据你的模型论证;如果天天喝酒,是否还能开车?5.根据你的论证并结合新的国家标准写一篇短文,给想喝一点酒的司机如何驾车的忠告.参考数据⑴人的体液占人的体重左右,其中血液只占体重的7%左右.而药物(包括65%70%:酒精)在血液中的含量与在体液中的含量大致相同.⑵体重在的某人在短时间内喝下瓶啤酒后,隔一定时间测量他的血液中酒精含70kg 2量(毫克/百毫升),得到数据如下:时间/小时0.250.50.751 1.252 2.53 3.544.55酒精含量306875828277686858515041时间/小时678910111213141516酒精含量3835282518151210774(酒精含量单位:毫克/百毫升)二、问题分析显然,该问题是微分方程模型.饮酒后,酒精先从肠胃吸收进入血液与体液中,然后从血液与体液向外排泄.由此建立二室模型:大李在喝酒以后,酒精先从吸收室(肠胃)进入中心室(血液也体液),然后从中心室向体外排除.设在时刻时,吸收室的酒精含量为,中心室的酒精含量为,酒精t ()1x t ()2x t 从吸收室进入中心室的速率系数为,分别表示在时刻时两室的酒精含量1k ()()12,y t y t t (毫克/百毫升),为中心室的酒精向外排泄的速率系数.在适度饮酒没有酒精中毒的条2k 件下,都是常量,与饮酒量无关.12,k k假定中心室的容积(百毫升)是常量,在时刻时中心室的酒精含量为,而吸V 0t =0收室的酒精含量为,酒精从吸收室进入中心室的速率与吸收室的酒精含量成正比;大02g 李第二次喝一瓶啤酒是在第一次检查后的两小时后.三、建模与解模1.模型建立由已知条件得到吸收室酒精含量应满足的微分方程为,()111d d x k x t t=-做学相应的初始条件是;而中心室酒精含量应满足的微分方程为()1002x g =()()21122d d x k x t k x t t=-相应的初始条件为.()20x t =由此建立问题的数学模型:()()()()()11121122102,,02,00.x k x t x k x t k x t x g x ⎧=-⎪=-⎨⎪==⎩2.解模调用MatLab 下的求解函数,输入下面语句syms x1 x2 k1 k2 g0[x1,x2]=dsolve('Dx1=-k1*x1','Dx2=k1*x1-k2*x2','x1(0)=2*g0','x2(0)=0');x=simple([x1,x2]);该微分方程组的解为()()()12110012122e ,2e e .k t k t k t x t g g k x t k k ---⎧=⎪⎨=-⎪-⎩中心室的酒精含量(百毫升)()()()()21210122e e e e V k t k t k t k t g k y t k k k ----=---:其中,上式即为短时间内喝完两瓶啤酒后中心室酒精含量率所对应()()0112122V g k k k k k k =≠-的数学模型.为得到模型中的未知参数,采用非线性拟合方法.编写求解程序:k0=[2,1,80];fun=inline('k(3)*(exp(-k(2)*t)-exp(-k(1)*t))','k','t');[k,r]=nlinfit(t,x,fun,k0);disp(k)hold onx1=k(3)*(exp(-k(2)*t)-exp(-k(1)*t));plot(t,x1)此时相应的值为k 2.00790.1855 114.4325图形为图形表明,拟合效果不错.再画出相应的残差图:残差分析表明模型比较理想.将计算结果代入表达式,得到在时刻时中心室酒精含量(百毫升)的函数表达式t .()()0.1855 2.00792114.4325e e t t y t --=- 模型应用若大李仅喝一瓶酒,此时,因此相应的模型为12k k '=()()0.1855 2.0079257.2163e e t t y t --=-再将代入得6t =()()0.18556 2.0079626114.4325e e 18.799320y -⨯-⨯=-≈<即大李此时符合驾车标准.假设大李在晚上点迅速喝完一瓶啤酒,以和分别代表在时刻时吸收室及8()1z t ()2z t t 中心室的含酒量(代表晚上点),则,由此得到微分方程:0t =8()()10108z g x =+一)题()()()()()()()()()1112112210122d ,d d ,d 08,08.z t k z t t z t k z t k z t tz g x z x ⎧=-⎪⎪⎪⎪=-⎨⎪=+⎪⎪=⎪⎩而由前面计算结果知:.将其代入到前面微分方()()()12188801102128e ,8e e k k k g k x g x k k ---==--程的初值问题中,则有()()()()()()()()1211112112281008801212d ,d d ,d 0e ,0e e .k k k z t k z t t z t k z t k z t t z g g g k z k k ---⎧=-⎪⎪⎪=-⎪⎨⎪=+⎪⎪=-⎪-⎩在MatLab 下,编写相应的求解程序:clear,clcsyms z1 z2 k1 k2 g0[z1,z2]=dsolve('Dz1=-k1*z1','Dz2=k1*z1-k2*z2', ...,'z1(0)=g0*(1+exp(-8*k1))','z2(0)=(k1*g0/(k1-k2))*(exp(-8*k2)-exp(-8*k1))');z=simple([z1,z2]);此时问题的解为()()()1122118108802121e e ,1e e 1e e .k k t k k t k k tz g g z k k ------⎧=+⎪⎨⎡⎤=+-+⎪⎣⎦-⎩记,()()()()()2211221188880121e e 1e e 1e e 1e e V k k t k k t k k t k k tg z k k k --------⎡⎤⎡⎤'=+-++-+⎣⎦⎣⎦-:最后代入得到在时刻时大李中心室的酒精含量函数122.0079,0.1855,57.2163k k k '===t .()()1.48400.185516.0632 2.007957.21631e e 1e e t tz ----⎡⎤=+-+⎣⎦取,即有6t = z=57.2163*((1+exp(-1.4840))*exp(-0.1855*6)-(1+exp(-16.0632))*exp(-2.0079*6))返回值23.0618即此时中心室的酒精含量率大于规定标准,属于饮酒驾车.用同样的方法可以讨论其它问题,在此不一一叙述.。
蠓虫的分类模型
(3) 利用按比例分配方法估计两个总体的先验概率: 两类蠓虫所占比例即为:
p1=6/(6+9)=0.4; p2=9/(6+9)=0.6;
(4) m1 mean( A), m2 mean(B), s1 cov( A), s2 cov(B)
s 5*s1 8*s2 /13
(5) 计算d,其中 d 为样本 x 到总体 A,B 的马氏距离平方.
若给定一只蠓虫,如何正确地区分它 属于哪一类?
已知蠓虫类别的数据
触角 1.24 1.36 1.38 1.38 1.38 1.4 1.48 1.54 1.56
Af
翼长 1.72 1.74 1.64 1.82 1.9 1.7 1.82 1.82 2.08
触角 1.14 1.18 1.2 1.26 1.28 1.3
⑴ 从A样本开始,剔除其中一个样品,剩余的 m-1 个样
品与B中的全部样品建立判别函数; ⑵ 用建立的判别函数对剔除的样品进行判别;
(3)重复步骤①,②,直到A中的全部样品依次被删除, 又进行判别,其误判的样品个数记为 m12; (4)对B的样品重复步骤①,②,③直到B中的全部样品 依次被删除又进行判别,其误判的样品个数记为 n21 ;
通过回代误判率和交叉误判率我们可以说明本模型 是较准确的.
六、 模型的评价与推广
1、 模型的优点 本模型通过马氏距离判别法和贝叶斯判别法进行求解,
对三个未知样本进行判别,在灵敏度分析中继而对误判率 进行分析,得出的结果较准确,较具有现实意义.
Apf
翼长 1.78 1.96 1.86 2.0 2.0 1.96
未知类别的三个样本数据:
(1.24,1.8)、(1.28,1.84)、(1.4,2.04)
蠓虫分类
1.2600 2.0000
1.2800 2.00001 Nhomakorabea3000 1.9600
>> p=[p1;p2]'
p =
Columns 1 through 13
1.2400 1.3600 1.3800 1.3800 1.3800 1.4000 1.4800 1.5400 1.5600 1.1400 1.1800 1.2000 1.2600
9 2
>> size(p2)
ans =
6 2
>> size(p)
ans =
2 15
>> pr=minmax(p)
pr =
1.1400 1.5600
1.2700 2.0800
>> goal=[ones(1,9),zeros(1,6);zeros(1,9),ones(1,6)]
goal =
1 1 1 1 1 1 1 1 1 0 0 0 0 0 0
STANDARD BACKPROP
NEURON: Index = 0 Type = I, X = 100, Y = 100, Out = 1.38000000006
NEURON: Index = 1 Type = I, X = 100, Y = 200, Out = 1.90000000006
NEURON: Index = 2 Type = H, X = 300, Y = 100
p=[p1;p2]';%p1和p2分别作为数据p的两个行
pr=minmax(p);%取出每行的最小值和最大值
goal=[ones(1,9),zeros(1,6);zeros(1,9),ones(1,6)];%产生一个两行15列的数据,对应数据p的期望输出.第一行先有9个1,再有6个0;第二行现有9个0,再有6个1. 10两位输出表示9只Af, 01输出表示6只APf
蠓虫的分类模型
全部大于零,即 p1 f1 p2 f2 ,所以待判的三个蠓虫均属于 Apf类.
五、灵敏度分析
本模型在对问题的分析中,假设两个总体 的协方差矩阵是相等的,而实际上,两个总体 的协方差矩阵不一定相等,且两个总体的协方 差矩阵是否相等对结果有较大影响. 因此在解 决实际问题时,首先要判别两个总体的协方差 矩阵是否相等。 对本模型,我们需要进行误差 分析。
1、 回代误判率估计
设 G1, G2 为两个总体,X1, X 2 , , X m 和 Y1,Y2 , ,Yn 是分别来自 G1, G2 的训练样本,以全体训练样本作为
m+n 个新样品,逐个代入已建立的判别准则中判别其归 属,这个过程称为回判。
若属于G1 的样品被误判判为属于G1 的个数为N2 个,则误判
率估计为:
p N1 N2 / m n.
我们利用Matlab进行编程计算,所得结果为0.
2、交叉误判率估计 交叉误判率估计是每次剔除一个样品,利用其余的
m+n-1 个训练样本建立判别准则再用所建立的准则对
删除的样品进行判别。对训练样本中每个样品都做如上 分析,以其误判的比例作为误判率。 步骤:
实际生活中可能不完全成立,所以有一定局限性.
3、模型的推广 本模型还可以用别的方法如人工神经网络法进行求解,
假设条件也可以放宽,这样得出的结论才更准确.
(4) 若 d<0 ,则 x 属于A类,若 d>0 , 则 x 属于B类; (5)模型的求解:我们利用Matlab软件进行编程, 可以求出三个样本到A类与B类的距离之差分别为,
d 4.3279, 2.7137, 3.9604
三个均为负值,这说明三个样本到A类的距离要 近一点,所以这三个样本都应归于Apf类.
蠓虫分类之Apf与Af
蠓虫分类问题研究摘要蠓虫跟蚊子一样,雄的吸食植物汁液,雌的吸血,蠓虫也会传播疾病,被蠓虫叮咬后会出现局部反应或奇痒,甚至引起全身性过敏反应。
蠓对人的危害主要是雌檬叮刺吸血,常可致皮肤丘疹,奇痒难忍或继发感染。
人类疾病中由蟑为堤介而传播的病原体有二类:即丝虫和病毒,蠓媒性丝虫病种类繁多且广泛分布于各地。
蠓类携带的病毒有乙型脑炎病毒、辛布组病毒,畜、禽的蠓媒性疾病,包括寄生虫病和病毒性疾病:原虫病12种,蠕虫病12种,病毒病22种以上。
其中有一些是人、畜共患病的病原体,由此可见,蠓对人的危害是很大的。
因此,准确地对蠓虫进行分类至关重要。
模型一根据题中已知数据,绘制两类蠓虫触长与翅长的散点图,然后对散点图稍作处理,用一条射线将图形分成两大区域,一部分代表Apf蠓虫,另一部分代表Af蠓虫。
模型二根据散点图,假设蠓虫种类之余仅与触长有关,建立建立隶属函数,并通过最大隶属度原则,判别出触长、翅长为(1.28,1.84)的蠓虫属于Apf蠓虫,触长、翅长为(1. 40,2.04)的蠓虫属于Af 蠓虫,而触长、翅长为(1.24,1.80)的蠓虫处于模糊状态,不能确定其属于哪一类蠓虫。
模型三如果Af是宝贵的传粉益虫,而Apf是某疾病的载体,那么在这一新的条件下,新的特征不会影响根据触长和翅长来区分蠓虫是属于Apf或Af的结果,但这一新特征会影响消除蠓虫的实验方法。
Apf实害虫,若他的危害及大,为了不让他漏网,宁可把Af 误判为Apf,同理,若Af为传粉益虫,且它是一种珍稀物种,则需要重点保护,宁可把Apf误判为Af来加以保护。
由问题二知,由模型二无法判别触长、翅长为(1.24,1.80)的蠓虫属于哪一种类,因此,需对模型加以改进。
关键词:蠓虫、隶属函数、最大隶属度原则一、问题重述1.1背景知识问题选自美国大学生数学模型竞赛一个题目——蠓的分类, 其大意是:生物学家W.L Grogan 和W.W.Wirth试图将两种蠓Af和Apf进行鉴别,给出了9只Af和6只Apf蠓虫的触角长度和翅膀长度的数据,已知Af是宝贵的传粉益虫,Apf是某种疾病的载体, 要求建立一种模型,正确区分两类蠓虫。
蠓的分类问题
蠓的分类问题摘要:早在1981年,两类蠓虫Af和Apf已由生物学家W.L.Grogna和W.W.Wirth根据它们的触角长度和翼长加以区分。
根据翼长和触角长来识别一只标本是Af还是Afp是重要的。
本文采用判别分析法讨论蠓的分类问题。
针对问题一,采用Mahalanobis 距离判别法,Fisher判别法,Bayes判别法来区别给定的蠓是Af类或Afp类。
根据交叉确认估计法求得三种方法的误判率以及运用三种方法,得到问题二的最终判断结果如下表:问题三需要考虑各总体的先验概率和错判损失,故本文采用Bayes判别法,使得所带来的平均错判损失最小。
最终判断结果为:[1代表x=(1.24,1.80);2代表x=(1.28,1.84);3代表x=(1.40,2.04)]文章中涉及的三种判别分析方法是相当成熟的,用它们讨论蠓的分类问题非常恰当。
本文建立的模型便于修正,而且随着样品数量的增加,精度提高的很快,样本的期望值,标准差和相关函数也很容易重新计算。
关键字:Mahalanobis 距离判别法 Fisher判别法 Bayes判别法误判率错判损失先验概率一、问题重述两种蠓Af和Apf己由生物学家W.L.Grongan和W.W.Wirth(1981年)根据它们的触角长度和翼长加以区分(见图89A-1),6只Af蠓用“●”标记,9只Apf蠓用“○”标记。
问题一:给定一只Af或者Apf族的蠓,你如何正确地区分它属于哪一族?问题二:将你的方法用于触角长和翼长分别为(1.24,1.80)、(1.28,1.84)、(1.40,2.04)的三个标本。
问题三:设Af是宝贵的传粉益虫,Apf是某种疾病的载体,是否应该修改你的分类方法,若需修改,怎么改?二、模型假设与符号说明2.1模型假设1、两种蠓虫的触角长和翼长服从二元正态分布。
2、所给的样本数据是无误差的。
2.2符号说明2.2.1 问题一、二的符号说明Afx:Af族的均值向量Apfx:Apf族的均值向量AfS:Af族的协方差矩阵ApfS:Apf族的协方差矩阵X: 待判样本空间1G:Af族的总体2G:Apf族的总体2.2.2 文题三的符号说明:P总的误判概率;:L总的误判损失;(1/2):c把Apf误判为Af所引起的误判损失;(2/1):c把Af误判为Apf所引起的误判损失;1():f x类别Af的密度函数;2():f x类别Apf的密度函数;1:P类别Af的先验概率;2:P类别Apf的先验概率;三、问题分析3.1问题一、二的分析问题一要求根据某个个体的指标(触角长、翼长)值来判断该个体所属的类别。
《奇点科学》----嗜血的小生物,蠓
《奇点科学》----嗜血的小生物,蠓
蠓是一种类似蚊子的昆虫,非常小,很少长到3毫米长。
在我国多地都有分布,有“小咬”、“墨蚊”之称,尽管它们吸取的血液不多,但对于生活在蠓栖息地(湖泊、溪流等潮湿地区)的人们来说,蠓仍然是夏季最讨厌的昆虫之一。
虽然单个不会产生很大的影响,但是每年6月,雌蠓交配完毕后,需要吸血产卵时,它们又会成群结队的聚集在一起,届时天空中就会充满嗜血的蠓群。
尽管很难用肉眼捕捉到蠓叮咬人体的瞬间,但是它们叮咬时,却会有明显的痛感,因为它们不像蚊子一样,用非常细长的嘴刺穿皮肤,刺入血管,而是用一把锯齿形的钳子口器割开皮肤吸血。
这个钳子很有力,能割破大部分动物的皮肤。
当皮肤上有伤口时,雌蠓会向伤口注射唾液,以防止血液凝固。
随后吸入少量血液(少于1微升),储存在胃中,准备产卵。
在交配季节,雌蠓分泌一种激素来吸引周围的雄蠓。
雄蠓会在激素的刺激下围着雌蠓跳舞,雌蠓会选择自己喜欢的配偶完成交配。
所以这个季节的蠓总是成群结队。
雌性受精后,开始寻找血液,吸血产卵。
只有一、两只蠓出现时,或许它们还不足以对人构成威胁,但到了夏天,天空总是会布满这样的小型吸血昆虫。
(该文部分内容采集自“杂志铺”网商品,《奇点科学》杂志。
)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蠓虫分类问题可概括叙述如下:生物学家试图对两种蠓虫(Af与Apf)进行鉴别,依据的资料是触角和翅膀的长度,已经测得了9支Af和6支Apf的数据如下:Af:
(1.24,1.27),(1.36,1.74),(1.38,1.64),(1.38,1.82),(1.38,1.90),(1.40,1.70),(1.48,1.82),(1.54,1.82),(1.56,2.08).
Apf: (1.14,1.82),(1.18,1.96),(1.20,1.86),(1.26,2.00),(1.28,2.00),(1.30,1.96).
现在的问题是:
(i)根据如上资料,如何制定一种方法,正确地区分两类蠓虫。
(ii)对触角和翼长分别为(1.24,1.80),(1.28,1.84)与(1.40,2.04)的3个标本,用所得到的方法加以识别。
(iii)设Af是宝贵的传粉益虫,Apf是某疾病的载体,是否应该修改分类方法。
如上的问题是有代表性的,它的特点是要求依据已知资料(9支Af的数据和6支Apf的数据)制定一种分类方法,类别是已经给定的(Af或Apf)。
今后,我们将9支Af及6支Apf的数据集合称之为学习样本。
为解决上述问题,考虑一个其结构如下图所示的人工神经网络。
p1=[1.24,1.27;1.36,1.74;1.38,1.64;1.38,1.82;1.38,1.90;1.40,1.70;1.48, 1.82;1.54,1.82;1.56,2.08];
p2=[1.14,1.82;1.18,1.96;1.20,1.86;1.26,2.00 ;1.28,2.00;1.30,1.96];
p=[p1;p2]';
pr=minmax(p)
goal=[ones(1,9),zeros(1,6);zeros(1,9),ones(1,6)];
subplot(1,2,1)
plot(p1(:,1),p1(:,2),'*',p2(:,1),p2(:,2),'o')
subplot(1,2,2)
net=newff(pr,[3,2],{'logsig','logsig'});
net.trainParam.show = 1;
net.trainParam.lr = 0.05;
net.trainParam.epochs = 3000;
net.trainParam.goal = 1e-10;
net.trainParam.epochs = 50000;
net = train(net,p,goal);
x=[1.24 1.80;1.28 1.84;1.40 2.04]';
y=sim(net,x)。