用身高和体重数据进行性别分类的实验报告

合集下载

身材检测分析报告

身材检测分析报告

身材检测分析报告1. 引言身材是指一个人的体形轮廓和身体结构的特征。

在现代社会中,人们越来越关注身材的健康与美观。

身材检测分析报告旨在通过测量和分析个体的身体数据,对其身材进行评估和分析,并提供相应的改善建议。

2. 身材测量方法2.1 体重测量体重是身材分析中最基础的指标之一。

常见的体重测量方法包括使用体重秤测量、计算BMI指数等。

2.2 身高测量身高也是身材分析中重要的指标之一。

常见的身高测量方法包括使用身高尺测量、坐姿身高测量等。

2.3 体脂率测量体脂率是衡量身体脂肪含量的指标。

通过使用皮脂测量仪或体脂秤等设备,可以快速测量出个体的体脂率。

2.4 腰围测量腰围是判断中心性肥胖的指标之一。

使用软尺或测量带,将尺子水平围绕腹部最突出的部位进行测量,得到腰围数据。

2.5 臀围测量臀围是判断脂肪在下半身分布情况的指标之一。

使用软尺或测量带,将尺子水平围绕臀部最突出的部位进行测量,得到臀围数据。

3. 身材分析通过以上测量方法获取的数据,可以进行身材分析,包括以下几个方面:3.1 BMI分析根据体重和身高数据计算出的BMI指数可以用于评估个体的体重情况。

BMI指数根据数值的范围,可以判断是否偏瘦、正常、超重、肥胖等。

3.2 体脂率分析体脂率是评估个体体脂肪含量的指标。

对于同样的体重,体脂率高的个体体脂肪含量较高,可能存在肥胖情况。

体脂率分析可以判断个体是否健康。

3.3 腰臀比分析腰臀比是判断脂肪在身体上分布情况的指标。

通过计算腰围和臀围的比值,可以评估脂肪在中心性和外周性部位的分布情况。

3.4 身材比例分析通过综合上述测量数据的分析,可以评估个体各个身体部位的比例是否协调。

身材比例分析可以指导个体针对性地进行身体塑形运动或锻炼。

4. 身材改善建议根据身材分析的结果,可提供相应的身材改善建议,包括以下几个方面:4.1 饮食建议根据个体的身材分析结果,制定合理的饮食计划。

对于BMI偏高者,建议控制热量摄入,减少高热量食物的摄入量。

用身高与体重数据进行性别分类的实验报告

用身高与体重数据进行性别分类的实验报告
(2)自行给出一个决策表,采用最小风险的Bayes决策重复上面的实验。
3、实验原理
已知样本服从正态分布,
(1)
所以可以用最大似然估计来估计μ和Σ两个参数
样本类分为男生 和女生 两类,利用最大似然估计分别估计出男生样本的 , ,和女生样本的 , ,然后将数据带入(1)公式分别计算两者的类条件概率密度 和 ,然后根据贝叶斯公式
det11=det(thegema11);det12=det(thgema12);
p(11)=1/((2*pi)*(det11^0.5))*exp(-1/2*((a-u11)'/thegema11)*(a-u11));
p(12)=1/((2*pi)*(det12^0.5))*exp(-1/2*((a-u12)'/thgema12)*(a-u12));
pz=p(11)*pw1+p(12)*pw2;
p11=(p(11)*pw1)/pz;p12=(p(12)*pw2)/pz;
g=p11-p12;
if(g>0)%%%Ñù±¾¼¯Ç°15¸öÈËÊÇÄÐÉú
male1=male1+1;
else
eห้องสมุดไป่ตู้ror11=error11+1;
end
end
male1
error11
det11=det(thegema11);det12=det(thgema12);
p(11)=1/((2*pi)*(det11^0.5))*exp(-1/2*((a-u11)'/thegema11)*(a-u11));
p(12)=1/((2*pi)*(det12^0.5))*exp(-1/2*((a-u12)'/thgema12)*(a-u12));

Python与机器学习-- 身高与体重数据分析(分类器)I

Python与机器学习--  身高与体重数据分析(分类器)I
linewidths=1,cmap=plt.cm.Paired)
逻辑回归:三、数据可视化:分类
Car 情报局
xcord11 = []; xcord12 = []; ycord1 = []; xcord21 = []; xcord22 = []; ycord2 = []; n = len(Y)
for i in range(n): if int(Y.values[i]) == 1: xcord11.append(X.values[i,0]); xcord12.append(X.values[i,1]); ycord1.append(Y.values[i]); else: xcord21.append(X.values[i,0]); xcord22.append(X.values[i,1]); ycord2.append(Y.values[i]);
逻辑回归:三、数据可视化:观察
import matplotlib.pyplot as plt X = df[['Height', 'Weight']] Y = df[['Gender']]
Car 情报局
plt.figure() plt.scatter(df[['Height']],df[['Weight']],c=Y,s=80,edgecolors='black',
逻辑回归:三、数据可视化:分类
Car 情报局
plt.figure()
plt.scatter(xcord11, xcord12, c='red', s=80, edgecolors='black', linewidths=1, marker='s')

有品身体测量报告

有品身体测量报告

有品身体测量报告尊敬的客户:感谢您选择购买有品身体测量仪并使用我们提供的服务。

在此,我们为您提供一份详细的身体测量报告,帮助您了解自己的身体状况,制定更科学的健身计划和饮食方案。

报告结果如下:一、基本信息:姓名:XXX性别:男/女年龄:XX岁身高:XXXcm体重:XXXkg二、身材评估:根据您提供的身高和体重数据,我们得出您的BMI(Body Mass Index)为XX, 属于XX分类。

由此,我们可以推断您的健康指数:BMI < 18.5:过轻18.5 ≤ BMI < 24:正常24 ≤ BMI < 28:过重BMI ≥ 28:肥胖从身材评估的结果来看,您的身材评估指数为XX,属于XX分类。

从数据上来看,您的身材呈现出XX特征,需要针对性地采取对策,比如加强运动或者改变饮食习惯,推荐您在使用产品的同时注意身体健康。

三、肌肉评估:根据您的肌肉数据测量,我们得出您的身体肌肉量为XXXkg,超过平均值XX%。

从肌肉评估的结果来看,您的肌肉量属于XX分类。

高肌肉量可以帮助您在健身过程中更好地锻炼肌肉和塑造曲线。

四、基础代谢:根据您的身体数据,我们得出您的基础代谢值为XXX千卡/日,高于平均值XX%。

基础代谢是指在不进行任何体力活动时每日基本生命活动所需要的能力。

从基础代谢的结果来看,您的身体在休息状态时需要的卡路里更多,意味着您需要多进行锻炼以增加能量消耗。

五、骨骼评估:根据您的数据测量,我们得出您的骨量为XXXkg,超过平均值XX%。

此外,我们也对您进行了骨密度的检查,结果显示您的骨密度处于正常水平。

六、身体脂肪评估:您的身体脂肪率为XX%,属于XX分类。

从身体脂肪率的结果来看,我们可以评估您身体脂肪与非脂肪成分之比,然后根据需要使用特定的饮食和运动计划来减少体脂肪或者增加肌肉质量等。

七、身体年龄评估:根据您的身体数据测量,身体年龄为XX岁,超过实际年龄XX岁。

总结:通过本次测量,我们得出了您的身体各项指标,为您制定健身计划提供了更加全面的基础数据。

模式识别大作业

模式识别大作业

作业1 用身高和/或体重数据进行性别分类(一)基本要求:用和的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。

调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。

具体做法:1.应用单个特征进行实验:以(a)身高或者(b)体重数据作为特征,在正态分布假设下利用最大似然法或者贝叶斯估计法估计分布密度参数,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到测试样本,考察测试错误情况。

在分类器设计时可以考察采用不同先验概率(如对, 对, 对等)进行实验,考察对决策规则和错误率的影响。

图1-先验概率:分布曲线图2-先验概率:分布曲线图3--先验概率:分布曲线图4不同先验概率的曲线有图可以看出先验概率对决策规则和错误率有很大的影响。

程序:和2.应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关(在正态分布下一定独立),在正态分布假设下估计概率密度,建立最小错误率Bayes 分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。

比较相关假设和不相关假设下结果的差异。

在分类器设计时可以考察采用不同先验概率(如vs. , vs. , vs. 等)进行实验,考察对决策和错误率的影响。

训练样本female来测试图1先验概率vs. 图2先验概率vs.图3先验概率vs. 图4不同先验概率对测试样本1进行试验得图对测试样本2进行试验有图可以看出先验概率对决策规则和错误率有很大的影响。

程序和3.自行给出一个决策表,采用最小风险的Bayes决策重复上面的某个或全部实验。

W1W2W10W20close all;clear all;X=120::200; %设置采样范围及精度pw1=;pw2=; %设置先验概率sample1=textread('') %读入样本samplew1=zeros(1,length(sample1(:,1)));u1=mean(sample1(:,1));m1=std(sample1(:,1));y1=normpdf(X,u1,m1); %类条件概率分布figure(1);subplot(2,1,1);plot(X,y1);title('F身高类条件概率分布曲线');sample2=textread('') %读入样本samplew2=zeros(1,length(sample2(:,1)));u2=mean(sample2(:,1));m2=std(sample2(:,1));y2=normpdf(X,u2,m2); %类条件概率分布subplot(2,1,2);plot(X,y2);title('M身高类条件概率分布曲线');P1=pw1*y1./(pw1*y1+pw2*y2);P2=pw2*y2./(pw1*y1+pw2*y2);figure(2);subplot(2,1,1);plot(X,P1);title('F身高后验概率分布曲线');subplot(2,1,2);plot(X,P2);title('M身高后验概率分布曲线');P11=pw1*y1;P22=pw2*y2;figure(3);subplot(3,1,1);plot(X,P11);subplot(3,1,2);plot(X,P22);subplot(3,1,3);plot(X,P11,X,P22);sample=textread('all ') %读入样本[result]=bayes(sample1(:,1),sample2(:,1),pw1,pw2);%bayes分类器function [result] =bayes(sample1(:,1),sample2(:,1),pw1,pw2);error1=0;error2=0;u1=mean(sample1(:,1));m1=std(sample1(:,1));y1=normpdf(X,u1,m1); %类条件概率分布u2=mean(sample2(:,1));m2=std(sample2(:,1));y2=normpdf(X,u2,m2); %类条件概率分布P1=pw1*y1./(pw1*y1+pw2*y2);P2=pw2*y2./(pw1*y1+pw2*y2);for i = 1:50if P1(i)>P2(i)result(i)=0;pe(i)=P2(i);elseresult(i)=1;pe(i)=P1(i);endendfor i=1:50if result(k)==0error1=error1+1;else result(k)=1error2=error2+1;endendratio = error1+error2/length(sample); %识别率,百分比形式sprintf('正确识别率为%.2f%%.',ratio)作业2 用身高/体重数据进行性别分类(二)基本要求:试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分离器进行比较。

模式识别——用身高和或体重数据进行性别分类

模式识别——用身高和或体重数据进行性别分类

用身高和/或体重数据进行性别分类1、【实验目的】(1)掌握最小错误率Bayes 分类器的决策规则 (2)掌握Parzen 窗法 (3)掌握Fisher 线性判别方法 (4)熟练运用matlab 的相关知识。

2、【实验原理】(1)、最小错误率Bayes 分类器的决策规则如果在特征空间中观察到某一个(随机)向量x = ( x 1 , x 2 ,…, x d )T,已知类别状态的先验概率为:()i P w 和类别的条件概率密度为(|)1,2,3...i P x w i c =,根据Bayes 公式得到状态的后验概率 有:1(|)()(|)(|)()i i i cjjj p P P p P ωωωωω==∑x x x基本决策规则:如果1,...,(|)max (|)i j j cP P ωω==x x ,则i ω∈x ,将 x 归属后验概率最大的类别 。

(2)、掌握Parzen 窗法对于被估计点X :其估计概率密度的基本公式(x)Nk NN Np V =,设区域 R N 是以 h N 为棱长的 d 维超立方体,则立方体的体积为dNN V h =;选择一个窗函数(u)ϕ,落入该立方体的样本数为x x 1()iNNN h i k ϕ-==∑,点 x 的概率密度:x x 111(x)()Ni NNk NNN V h i Np V Nϕ-===∑其中核函数:x x 1i K(x,x )()i NNV h ϕ-=,满足的条件:i (1) K(x,x )0≥;i (2) K(x,x )dx 1=⎰。

(3)、Fisher 线性判别方法Fisher 线性判别分析的基本思想:通过寻找一个投影方向(线性变换,线性组合),将高维问题降低到一维问题来解决,并且要求变换后的一维数据具有如下性质:同类样本尽可能聚集在一起,不同类的样本尽可能地远。

Fisher 线性判别分析,就是通过给定的训练数据,确定投影方向W 和阈值y0,即确定线性判别函数,然后根据这个线性判别函数,对测试数据进行测试,得到测试数据的类别。

人体测量实验报告

人体测量实验报告

人体测量实验报告
一.实验内容
时间:2011-11-28
地点:网络
实验对象:全球最性感内衣模特TOP10
实验原理:根据对模特的身高和三围的测量,与新时尚公式:
标准臀围(cm)=身高(cm)×0.54
标准胸围(cm)=身高(cm)×0.53
标准腰围(cm)=身高(cm)×0.37的比较,得出结论
实验步骤:1.依次测出模特身高、三围;
2.数据整理;
3.得出实验结论,完成实验报告;
二测量方法:
1.测量工具:网络,记录纸,笔;
2.测量时需要真实资料,以减少错误;
3.查询国籍
五实验运用
警示女孩不要过度减肥,不要追求骨感,除非你要做名模。

六实验结论:模特很高很瘦,普通女孩不应该以此作为身材标准。

学生身体素质测评报告

学生身体素质测评报告

学生身体素质测评报告一、引言如今,学生身体素质逐渐受到社会的关注。

身体素质是一个人在体能、体型、协调性等方面的综合表现,它不仅对个人的身体健康发展有着重要影响,还与学习成绩、心理健康等方面密切相关。

本文旨在通过对学生身体素质的测评结果进行分析,以提供一些改进学生身体素质的建议。

二、方法本次测评采用了国家标准体育测试项目,包括身高、体重、肺活量、柔韧性、爆发力等项目。

参与测评的学生年龄在15-18岁之间,来自不同高中及年级。

测评数据基于多次测量结果取平均值。

三、身高与体重身高与体重是体型发育的重要指标,也是身体素质的基础。

据本次测评结果显示,参加测评的学生平均身高为170cm,平均体重为60kg。

与相应的年龄段标准相比,学生的身高体重处于正常范围内,说明学生体型发育良好。

然而,个别学生存在身高偏矮或偏胖的情况。

身高偏矮可能影响学生的运动能力和自信心,建议这部分学生加强适当的拉伸运动和骨骼发育促进食物的摄入,以促进身高的增长。

同时,对于体重偏胖的学生应注意均衡饮食,控制摄入的热量,并加强有氧运动,以促进体重的减轻。

四、肺活量肺活量是呼吸系统功能的重要指标,也是体能素质的关键之一。

根据本次测评结果显示,学生的平均肺活量为3000ml。

尽管这个数值在正常范围内,但与国家标准相比还有提高的空间。

对于肺活量较低的学生,可以通过定期进行有氧运动,如跑步、游泳等,增强肺活量的弹性。

此外,合理的呼吸训练也能有效提高肺活量。

例如,深呼吸和练习吹气等。

五、柔韧性柔韧性是身体活动范围的表现,也是保持身体灵活性的关键。

据本次测评结果显示,学生柔韧性的平均得分为80,超过了国家标准范围。

这显示学生对柔韧性的发展给予了一定的重视。

然而,我们仍然鼓励学生进一步提高柔韧性。

灵活的身体能够减少运动伤害,而柔顺的肌肉和韧带也对促进血液循环和维持正常体态有益。

学生可以进行一些柔韧性训练,如瑜伽、拉伸和舞蹈等。

六、爆发力爆发力是身体瞬间发力的能力,是运动技能的基础之一。

小胖说统计之临床试验中的描述性统计分析

小胖说统计之临床试验中的描述性统计分析

小胖说统计之临床试验中的描述性统计分析The purpose of the field of statistics is to characterize a population based on the information contained in a sample taken from that population。

上述论述中,包含的三个要素是population、samples和characterization。

那么具体怎么characterization呢?无非有两种,一种就是我们所谓的descriptive statistics(描述性统计分析),一种是inferential statistics(推断性统计分析)。

具体到我们的临床试验中,描述性统计分析占到了我们最后统计分析报告的绝大部分,这是因为除了你事先有检验假设的一些终点的分析会用到推断性统计分析外,你几乎所有的人口学和基线变量的总结、疗效数据的总结、安全性数据的总结都要用到描述性统计分析。

而具体的描述性统计分析,又根据不同的数据类型有不同的描述方式,对于连续性变量来说,我们最常用到的是均数、标准差、中位数、最小值和最大值;对于分类型变量来说,主要用到的是频数表的方式即频数及百分比;对于time to event数据来说,我们则最主要基于Kaplan-Meier来进行统计描述。

此外,除了用表格的形式对临床试验数据进行描述性总结之外,我们还会用到一些figures来进行统计描述,最常见的如Line Plot,Bar Chart,Box Plot,K-M curve等。

我们在统计分析计划或研究方案中的统计分析部分,特别是在统计分析的一般原则中一般会对描述性统计分析常有以下类似的描述:对于连续型变量,将列出未缺失的受试者个数、均数、标准差、中位数、最小值和最大值。

对于分类变量,将以频数表的形式(频数和百分数)列出。

而有些比较详细的统计分析计划会对各描述性统计分析统计量的小数位数加以规定,从而使table更加标准化,当然小数位数的规定也不是绝对统一的标准,以下的例子的描述供大家参考:对于连续型变量,将列出未缺失的受试者个数、均数、标准差、中位数、最小值和最大值。

模式识别实验一报告

模式识别实验一报告

用身高体重数据进行性别分类实验一一.题目要求:1.用dataset1.txt 作为训练样本,用dataset2.txt 作为测试样本,采用身高和体重数据为特征,在正态分布假设下估计概率密度(只用训练样本),建立最小错误率贝叶斯分类器,写出所用的密度估计方法和得到的决策规则,将该分类器分别应用到训练集和测试集,考察训练错误率和测试错误率。

将分类器应用到dataset3 上,考察测试错误率的情况。

(在分类器设计时可以尝试采用不同先验概率,考查对决策和错误率的影响。

)2.自行给出一个决策表,采用最小风险贝叶斯决策重复上面的实验。

二.数据文件:1.dataset1.txt----- 328 个同学的身高、体重、性别数据(78 个女生、250 个男生)(datasetf1:女生、datasetm1:男生)2.dataset2.txt -----124 个同学的数据(40 女、84 男)3.dataset3.txt----- 90 个同学的数据(16 女,74 男)三.题目分析:要估计正态分布下的概率密度函数,假设身高随机变量为X,体重随机变量为Y,二维随机变量(X,Y)的联合概率密度函数是:p x,y=1122⁡{−121−ρ2[x−μ12ς12−2ρx−μ1y−μ2ς1ς2+(y−μ2)2ς22]}其中−∞<x,y<+∞;−∞<μ1,μ2<+∞;ς1,ς2>0;−1≤ρ≤1.并其μ1,μ2分别是X与Y的均值,ς12,ς22,分别是X与Y的方差,ρ是X与Y的相关系数。

运用最大似然估计求取概率密度函数,设样本集中包含N个样本,即X={x1,x2,…x N},其中x k是列向量。

根据教材中公式,令μ=(μ1,μ2)T,则μ=1 Nx kNk=1;协方差矩阵=ς12ρς1ς2ρς1ς2ς22,那么=1N(x kNk=1−μ)(x k−μ)T。

采用最小错误率贝叶斯分类器,设一个身高体重二维向量为x,女生类为ω1,男生类为ω2,决策规则如下:x∈ω1,当Pω1x)>P(ω2|x)ω2,当Pω2x)>P(ω1|x)。

用身高和体重数据进行性别分类的实验报告

用身高和体重数据进行性别分类的实验报告

用身高和体重数据进行性别分类的实验报告实验目的:本实验旨在通过身高和体重数据,利用机器学习算法对个体的性别进行分类。

实验步骤:1. 数据收集:收集了一组个体的身高和体重数据,包括男性和女性样本。

在收集数据时,确保样本的性别信息是准确的。

2. 数据预处理:对收集到的数据进行预处理工作,包括数据清洗、缺失值处理和异常值处理等。

确保数据的准确性和完整性。

3. 特征提取:从身高和体重数据中提取特征,作为输入特征向量。

可以使用常见的特征提取方法,如BMI指数等。

4. 数据划分:将数据集划分为训练集和测试集,一般采用70%的数据作为训练集,30%的数据作为测试集。

5. 模型选择:选择合适的机器学习算法进行性别分类。

常见的算法包括逻辑回归、支持向量机、决策树等。

6. 模型训练:使用训练集对选定的机器学习算法进行训练,并调整模型的参数。

7. 模型评估:使用测试集对训练好的模型进行评估,计算分类准确率、精确率、召回率等指标,评估模型的性能。

8. 结果分析:分析实验结果,对模型的性能进行评估和比较,得出结论。

实验结果:根据实验数据和模型训练结果,得出以下结论:1. 使用身高和体重数据可以较好地对个体的性别进行分类,模型的分类准确率达到了XX%。

2. 在本实验中,选择了逻辑回归算法进行性别分类,其性能表现良好。

3. 身高和体重这两个特征对性别分类有较好的区分能力,可以作为性别分类的重要特征。

实验总结:通过本实验,我们验证了使用身高和体重数据进行性别分类的可行性。

在实验过程中,我们收集了一组身高和体重数据,并进行了数据预处理、特征提取、模型训练和评估等步骤。

实验结果表明,使用逻辑回归算法可以较好地对个体的性别进行分类。

这个实验为进一步研究个体性别分类提供了一种方法和思路。

大学生性别统计报告范文

大学生性别统计报告范文

大学生性别统计报告范文引言性别统计是对大学生群体进行了解和分析的重要工作。

通过分析大学生性别比例以及不同性别学生在各方面的表现,可以为高校提供更好的教学管理和学生服务。

本报告将通过对某大学2019级本科生的性别统计及分析,为高校提供有关性别平等和学生发展的参考意见。

一、性别比例分析表1展示了某大学2019级本科生性别比例。

性别人数男生1500女生2000总计3500通过表1可以看出,某大学2019级本科生中,女生的人数为2000人,占总人数的57.14%,男生的人数为1500人,占总人数的42.86%。

可以发现,在这所大学中,女生的数量略多于男生。

二、性别分析1. 学科分布某大学的本科生主要开设有理科、工科、文科等专业,不同学科的性别比例如表2所示。

学科男生女生工科800 500文科200 1200由表2可知,理科是男生的主要选择,有500名男生和300名女生选择了理科专业。

而女生更倾向于选择文科专业,有1200名女生选择了文科,仅有200名男生选择了该专业。

而工科专业的男女比例相对较为均衡。

2. 学习成绩为了了解大学生的学业表现,我们分别对男女生在学习成绩上进行了分析。

表3展示了某大学2019级本科生的学习成绩分布情况。

学生性别高分(90分以上)中等分数(70-89分)低分(70分以下)男生400 800 300女生600 1200 200通过表3可以看出,女生在学习成绩上的表现较好。

在高分范围(90分以上)内,女生占比60%,男生占比40%。

中等分数(70-89分)的男女生比例相对平衡,而低分(70分以下)的男生比例略高于女生。

3. 社团参与和就业状况表4展示了某大学2019级本科生的社团参与和就业状况。

性别参与社团人数就业人数男生700 900由表4可知,女生更积极地参与社团活动,参与社团的女生人数(1200人)明显多于男生(700人)。

在就业方面,女生的就业率(80%)也高于男生(64.29%)。

多元统计分析实验报告

多元统计分析实验报告

多元统计分析实验报告多元统计分析实验报告引言:多元统计分析是一种研究多个变量之间关系的方法,通过对多个变量进行综合分析,可以揭示出变量之间的相互作用和影响,帮助我们更好地理解数据背后的规律和现象。

本实验旨在通过对一组数据进行多元统计分析,探索变量之间的关系,并对实验结果进行解读。

实验设计:本实验选取了一组包含多个变量的数据集,其中包括性别、年龄、教育程度、收入水平、婚姻状况等变量。

通过对这些变量进行多元统计分析,我们希望了解这些变量之间是否存在相关性,并进一步探究各个变量对于整体数据集的影响。

数据收集与处理:首先,我们收集了一份包含上述变量的样本数据,共计1000个样本。

接下来,我们对数据进行了清洗和处理,包括去除异常值、缺失值的处理等。

经过处理后,我们得到了一份完整的数据集,可以进行后续的多元统计分析。

多元统计分析方法:在本实验中,我们使用了多元统计分析中的主成分分析和聚类分析两种方法。

主成分分析是一种通过将原始变量转化为一组新的综合变量,来降低数据维度并保留尽可能多的信息的方法。

聚类分析则是一种通过对样本进行分类,使得同一类别内的样本相似性较高,不同类别之间的差异性较大的方法。

实验结果与分析:经过主成分分析,我们得到了一组主成分,它们分别代表了原始变量的不同方面。

通过对主成分的解释,我们可以发现性别、年龄和教育程度等变量对于整体数据集的解释性较高,而收入水平和婚姻状况等变量的解释性较低。

这说明性别、年龄和教育程度等因素在整体数据中起着较为重要的作用。

接下来,我们进行了聚类分析,将样本分为若干个类别。

通过观察不同类别的样本特征,我们可以发现在同一类别内,样本的性别、年龄和教育程度等变量较为相似,而收入水平和婚姻状况等变量的差异较大。

这说明性别、年龄和教育程度等因素在样本分类中起到了重要的作用,而收入水平和婚姻状况等因素则对样本分类的影响较小。

结论与展望:通过本次实验的多元统计分析,我们可以得出以下结论:性别、年龄和教育程度等因素在整体数据集中起着较为重要的作用,并且对样本分类也具有一定的影响。

分类汇总实验报告

分类汇总实验报告

一、实验目的1. 熟悉Excel中分类汇总功能的操作方法。

2. 学会使用分类汇总对数据进行多级排序和筛选。

3. 掌握如何利用分类汇总功能进行数据分析和处理。

二、实验环境1. 操作系统:Windows 102. 软件环境:Microsoft Excel 2016三、实验内容1. 数据准备在Excel中创建一个数据表格,包含以下列:姓名、性别、年龄、分数、班级。

2. 分类汇总(1)按性别进行分类汇总① 选择数据表格中的任意单元格。

② 点击“数据”选项卡,在“排序与筛选”组中,选择“分类汇总”。

③ 在弹出的“分类汇总”对话框中,设置“分类字段”为“性别”,“汇总方式”为“计数”,“选定汇总项”为“姓名”。

④ 点击“确定”按钮,完成按性别分类汇总。

(2)按年龄进行分类汇总① 在“分类汇总”对话框中,将“分类字段”改为“年龄”,“汇总方式”改为“求和”,“选定汇总项”改为“分数”。

② 点击“确定”按钮,完成按年龄分类汇总。

(3)多级排序与筛选① 在“分类汇总”对话框中,点击“选项”按钮。

② 在弹出的“分类汇总选项”对话框中,勾选“替换当前分类汇总”、“汇总结果显示在数据下方”和“每组数据分页”。

③ 设置“排序依据”为“年龄”,选择“升序”。

④ 点击“确定”按钮,完成多级排序与筛选。

(4)筛选特定条件的数据① 在“分类汇总”对话框中,点击“选项”按钮。

② 在弹出的“分类汇总选项”对话框中,勾选“汇总结果显示在数据下方”。

③ 点击“确定”按钮,返回“分类汇总”对话框。

④ 点击“确定”按钮,完成筛选特定条件的数据。

四、实验结果与分析1. 按性别分类汇总结果显示,男生和女生的人数分别为10人和8人。

2. 按年龄分类汇总结果显示,18岁以下的学生共有12人,18-20岁的学生共有18人,20-22岁的学生共有10人。

3. 多级排序与筛选结果显示,年龄为18-20岁的学生中,分数最高的是张三,分数为95分。

4. 筛选特定条件的数据结果显示,年龄为18-20岁的学生中,分数在90分以上的有6人。

研究报告身高作文

研究报告身高作文

研究报告身高作文As researchers, studying the topic of height in relation to various aspects of life is both fascinating and enlightening. 作为研究者,研究身高与生活各方面的关系是既迷人又启发人的。

First and foremost, height has been linked to social status and success in many cultures around the world. Taller individuals often have advantages in terms of job opportunities and salary potential. 在许多文化中,身高与社会地位和成功有关。

身材较高的人通常在就业机会和薪资潜力方面具有优势。

On the flip side, there is also the issue of height discrimination, where individuals who are shorter may face stigma and prejudice in various aspects of their lives. 然而,也存在身高歧视的问题,身材较矮的人可能会在生活的各个方面遭受污名和偏见。

Furthermore, the influence of height can also be seen in personal relationships, as studies have shown that taller individuals are often perceived as more attractive and confident by others. 此外,身高也会影响个人关系,研究表明,身高较高的人常常被认为更有吸引力和自信。

身体维度实验报告模板

身体维度实验报告模板

身体维度实验报告模板
实验目的
说明实验的目的和意义,以及预期的结果。

实验材料和仪器
列出所使用的实验材料和仪器的名称和规格。

实验步骤
逐步描述实验的操作步骤,确保实验的可重复性。

数据收集和处理
描述实验过程中收集的数据,并说明所使用的统计和分析方法。

结果与讨论
将实验数据整理成表格或图表,并进行分析和讨论。

可以使用文字解释图表中的趋势、差异或相关性,并讨论实验结果是否符合预期。

实验误差和不确定度
讨论实验过程中可能出现的误差和不确定度,并给出其原因和影响。

实验结论
总结实验结果并回答实验目的中提出的问题。

实验反思与改进
评估实验的有效性和可改进性,提出可能的改进措施和建议。

参考文献
列出所参考的文献和资料(包括书籍、期刊文章、网页等),确保实验报告的学术性和可信性。

附录
提供实验中使用的原始数据、程序代码、图表等。

以上为身体维度实验报告模板的框架。

根据具体的实验内容,可以适当调整和补充每个部分的内容。

在撰写实验报告时,要注意语言简明扼要、逻辑清晰、条理分明,同时注意遵守学术规范和报告格式要求。

测试标准体重

测试标准体重

测试标准体重标准体重是指一个人在一定身高范围内所应具备的理想体重,它是根据人体的身高、年龄、性别等因素综合考虑得出的一个参考数值。

通过测试标准体重,可以帮助人们了解自己的健康状况,及时调整饮食和运动方式,保持身体的健康和良好状态。

首先,我们需要了解如何计算标准体重。

通常情况下,可以使用身高减去100再减去10%作为标准体重的计算公式。

例如,一个身高为170厘米的成年男性,其标准体重大约为(170-100)0.9=63公斤。

而对于女性来说,身高减去100再减去15%即可得出标准体重。

但需要注意的是,这只是一个大致的计算方法,具体的标准体重还需要根据个人的实际情况进行调整。

其次,我们需要了解标准体重的意义。

标准体重是一个相对的参考值,它并不是说所有人都要严格按照这个数值来衡量自己的身体健康。

但是,通过测试标准体重,可以帮助人们了解自己的体重是否偏轻或偏重,从而及时采取相应的调整措施。

过重或过轻都会对身体健康造成一定的影响,因此及时调整体重是非常重要的。

接着,我们来谈谈如何测试标准体重。

首先,我们可以通过体重秤来测量自己的体重,然后结合身高和年龄等因素,使用上文提到的计算公式来得出标准体重的参考数值。

其次,我们还可以通过身体成分分析仪来测量自己的体脂率、肌肉量等指标,从而更全面地了解自己的身体状况。

除此之外,我们还可以寻求专业医生或营养师的帮助,进行更深入的身体检测和评估。

最后,我们需要明确测试标准体重的意义。

通过测试标准体重,可以帮助人们更好地了解自己的身体状况,及时调整饮食和运动方式,保持身体的健康和良好状态。

但需要注意的是,标准体重只是一个参考值,具体的身体健康状况还需要综合考虑多个因素来进行评估。

因此,在测试标准体重的过程中,我们需要保持客观、科学的态度,不要盲目追求一个固定的数字,而是要根据自己的实际情况进行调整和改善。

总之,测试标准体重是非常重要的,它可以帮助人们更好地了解自己的身体状况,及时调整饮食和运动方式,保持身体的健康和良好状态。

男女生体重计算标准

男女生体重计算标准

男女生体重计算标准体重是一个人身体健康的重要指标,对于男女生来说,合适的体重不仅能够保持身体健康,还能够提升形象和自信心。

那么,如何计算男女生的体重标准呢?下面我们将详细介绍男女生体重计算标准,帮助大家更好地了解自己的体重状况。

首先,我们来看看成年男性的体重计算标准。

一般来说,成年男性的体重标准是根据身高来确定的。

常用的计算方法是身高(厘米)减去100,再减去10%~15%作为体重的范围。

例如,一个成年男性的身高是175厘米,那么他的体重范围大约在(175-100)(1-0.15)=60~70公斤之间。

当然,这只是一个大致的计算方法,实际体重还需要根据个人的体质、骨骼密度等因素进行调整。

接下来,我们来看看成年女性的体重计算标准。

与男性不同,女性的体重标准也是根据身高来确定的。

常用的计算方法是身高(厘米)减去105,再减去10%~15%作为体重的范围。

例如,一个成年女性的身高是160厘米,那么她的体重范围大约在(160-105)(1-0.15)=43~48公斤之间。

同样,这也只是一个大致的计算方法,实际体重还需要根据个人的体质、骨骼密度等因素进行调整。

除了身高之外,年龄和体型也会对体重标准产生影响。

年龄越大,基础代谢率会逐渐下降,因此同样的身高体重标准会有所调整。

此外,体型也是影响体重标准的重要因素,肌肉型体型和脂肪型体型的体重标准也会有所不同。

在计算体重标准的过程中,我们还需要注意到一个问题,那就是BMI指数。

BMI指数是体重(公斤)除以身高(米)的平方,是一个衡量体重是否合适的指标。

一般来说,BMI指数在18.5~23.9之间属于正常范围,低于18.5属于偏瘦,高于24属于偏胖,高于28属于肥胖。

因此,除了根据身高进行体重计算外,我们还可以通过BMI指数来判断自己的体重状况。

总的来说,男女生体重计算标准是根据身高来确定的,但在实际应用中还需要考虑年龄、体型和BMI指数等因素。

希望大家在关注体重的同时,也能够注重身体健康,保持良好的生活习惯和饮食习惯,让自己拥有更健康、更美好的生活。

对大学生体重控制实践报告

对大学生体重控制实践报告

对大学生体重控制实践报告一、引言随着生活水平的提高和社会发展的进步,人们的生活方式发生了巨大的变化。

尤其是在大学校园中,学生面临着沉重的学业压力和应酬,很多人的体重逐渐超过了正常范围。

因此,本次实践围绕大学生体重控制进行了一系列的调查和探索,旨在为大学生提供科学、合理的体重管理方法。

二、调查和分析我们首先对100名大学生进行了体重和身高的测量,并进行了问卷调查,以了解他们的饮食习惯和运动情况。

1. 调查结果调查结果显示,超过50%的大学生超重或肥胖,其中女生占比较多。

此外,我们也发现大多数大学生的日常饮食主要以快餐和外卖为主,蔬菜、水果和全谷物的摄入量较少。

而运动方面,绝大多数的学生缺乏定期的运动锻炼。

2. 影响因素分析通过分析调查结果,我们发现大学生体重问题的形成主要是由以下几个方面的因素造成的:- 饮食结构不合理:大学生过多地摄入高热量、高脂肪的食物,而蔬菜和水果的摄入量较少,导致能量平衡失调,从而引发体重问题。

- 运动缺乏:大学生学业繁重,很多人都没有时间和机会进行运动锻炼,导致身体缺乏运动量,脂肪积累,体重增加。

- 心理压力:大学生面临着来自学业和社交压力的双重冲击,很多人会因为焦虑、抑郁等情绪而选择暴饮暴食,导致体重急剧增加。

三、实践方案基于以上调查和分析结果,我们制定了以下的实践方案,以帮助大学生科学地控制体重。

1. 饮食调整- 合理安排三餐:保证早餐的摄入量,既能提供身体所需的营养,又能控制午晚餐的食量。

- 增加蔬菜和水果的摄入:每餐饭菜中应包含丰富的蔬菜,水果应作为零食的首选。

- 减少高热量、高脂肪食物的摄入:少吃油炸食品、甜食和零食,选择低糖低盐的食品。

2. 运动锻炼- 定期锻炼:每周至少进行3-5次的有氧运动,如慢跑、游泳、健身操等。

- 多样化运动方式:尝试不同的运动项目,如瑜伽、踏板舞等,以保持兴趣和积极性。

- 利用碎片时间运动:在上下楼梯时选择走楼梯,午休时可以散步放松。

体重与身高标准

体重与身高标准

体重与身高标准体重与身高是人体健康状况的两个重要指标,合理的体重与身高比例对于保持身体健康至关重要。

本文将就体重与身高标准进行详细介绍,希望能够帮助大家更好地了解自己的身体状况,并且采取科学的方法进行调整。

首先,我们来讨论一下体重与身高的关系。

体重与身高的关系可以通过身体质量指数(BMI)来进行评估。

BMI是通过体重(公斤)除以身高(米)的平方得出的一个数值,它可以帮助我们判断一个人的体重是否偏轻、正常、超重或者肥胖。

根据世界卫生组织的标准,BMI在18.5以下为偏瘦,18.5-23.9为正常,24-27.9为超重,28以上为肥胖。

因此,通过BMI可以比较准确地判断一个人的体重是否合理。

其次,我们来看一下身高与体重的匹配标准。

一般来说,身高与体重的匹配标准是根据个体差异来进行评估的。

同样的BMI数值,在不同的身高下可能会有不同的体重范围。

比如说,对于一个身高较高的人来说,相同的BMI数值对应的体重范围可能会更大一些;而对于一个身高较矮的人来说,相同的BMI数值对应的体重范围可能会更小一些。

因此,在评估体重与身高的匹配标准时,需要综合考虑个体的身体特点。

另外,需要强调的是,体重与身高的标准并不是唯一的评估标准。

除了BMI之外,还有其他一些指标可以帮助我们更全面地了解身体健康状况,比如腰围、体脂率等。

这些指标可以帮助我们更加全面地了解自己的身体状况,并且采取针对性的健康管理措施。

最后,我们来谈一谈如何保持合理的体重与身高比例。

保持合理的体重与身高比例需要综合考虑饮食、运动、生活习惯等多个方面的因素。

首先,要保持均衡的饮食,摄入适量的蛋白质、碳水化合物、脂肪、维生素、矿物质等营养物质,避免过度摄入高热量、高脂肪、高糖分的食物。

其次,要保持适量的运动,增加体能消耗,改善体脂肪率,增强肌肉力量。

另外,要养成良好的生活习惯,保持规律的作息时间,避免熬夜、过度劳累等不良习惯。

综上所述,体重与身高标准是评估身体健康状况的重要指标,合理的体重与身高比例对于保持身体健康至关重要。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用身高和体重数据进行性别分类的实验报告(二)一、 基本要求1、试验非参数估计,体会与参数估计在适用情况、估计结果方面的异同。

2、试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分类器进行比较。

3、体会留一法估计错误率的方法和结果。

二、具体做法1、在第一次实验中,挑选一次用身高作为特征,并且先验概率分别为男生0.5,女生0.5的情况。

改用Parzen 窗法或者k n 近邻法估计概率密度函数,得出贝叶斯分类器,对测试样本进行测试,比较与参数估计基础上得到的分类器和分类性能的差别。

2、同时采用身高和体重数据作为特征,用Fisher 线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。

将训练样本和求得的决策边界画到图上,同时把以往用Bayes 方法求得的分类器也画到图上,比较结果的异同。

3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与在测试集上得到的错误率进行比较。

三、原理简述及程序框图1、挑选身高(身高与体重)为特征,选择先验概率为男生0.5女生0.5的一组用Parzen 窗法来求概率密度函数,再用贝叶斯分类器进行分类。

以身高为例本次实验我们组选用的是正态函数窗,即21()2u u φ⎧⎫=-⎨⎬⎩⎭,窗宽为N h h =h 是调节的参量,N 是样本个数) dN NV h =,(d 表示维度)。

因为区域是一维的,所以体积为N n V h =。

Parzen 公式为()ˆN P x =111N i i N N x x N V h φ=⎛⎫- ⎪⎝⎭∑。

故女生的条件概率密度为11111111N ii n x x p N VN h φ=⎛⎫-=⎪⎝⎭∑男生的条件概率密度为21112222Nii nx xpN VN hφ=⎛⎫-= ⎪⎝⎭∑根据贝叶斯决策规则()()()()()1122g x p x w p w p x w p w=-知如果11*2*(1),p p p p xω>-∈,否则,2xω∈。

流程图如下:2、要求是同时采用身高和体重数据作为特征,用Fisher线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。

将训练样本和求得的决策边界画到图上,同时把以往用Bayes方法求得的分类器也画到图上,比较结果的异同。

说明,取男生和女生的先验概率分别为0.5,0.5。

在设计贝叶斯分类器时,首先求各类样本均值向量,及2,1,1==∑∈ixNmixiiω,然后求各个样本的来内离散度矩阵,及()()2,1,=--=∑∈imxmxs Tiwxiii,再求出样本的总类内离散度,及()()2211spspsωωω+=,根据公式()211mms-=-*ωω求出把二维X空间投影到一维Y空间的最好的投影方向。

再求出一维Y空间中各类样本均值2,1,1'==∑∈i y N m iy ii ω,其中x y **=ω,本次实验的分界阈值我们用如下方法得到:2122110''N N m N m N y ++=,最后,将测试样本中的值代入,求出y ,并将其与y0来进行比较来分类。

根据课本对Fisher 线性判别法的介绍,得到的算法流程图如下:3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与在测试集上得到的错误率进行比较。

这里我们选择Fisher 线性判别法,用留一法来估计它在训练集上的错误率,并将结果与Fisher线性判别法对测试集进行判别时得到的错误率进行比较。

具体流程图如下:四、实验结果及分析总结1、得到结果如下表以身高作为特征h=4估计方法女生先验概率男生先验概率男生错误个数女生错误个数总错误男生错误率女生错误率总错误率以身高与体重作为特征h=7分析:通过比较可知,在用最大似然估计这种参数估计方法和Parzen这种非参数估计方法来进行分类时,最大似然估计判别的错误率低。

2、得到结果如下(1)、用Fisher线性判别方法求分类器,将分类器应用到训练和测试样本上,比较其错误率判别对象男生错误个数女生错误个数总错误男生错误率女生错误率总错误率测试样本27 2 29 10.8% 4% 9.67%训练样本8 4 12 16% 8% 12%试训练样本时,其错误率较高,测试结果不好。

(2)、将训练样本和求得的决策边界画到图上先验概略为0.5,0.5从图中我们可以直观的比较出对训练样本Fisher判别比最大似然Bayes判别效果更好。

3、留一法测试结果如下:分析:用留一法在训练样本机上估计错误率时,错误率小于它在测试样本集上得到的错误率,且留一法在测试样本集上女生错误个数远低于男生错误个数。

五、体会这次实验,我们组用了接近三天的时间,首先,我们对题目要求进行认真分析,在确保对题目完全理解的基础上,开始一步一步分析,求解。

对每个小题,及其每一问,我们都经过查书,查资料,编代码这几个步骤,仔细分析每一步算法,得出流程图。

经过第一次作业的编程,本次编程我们都觉得轻松了很多,但还会出现一些细节上的错误,不过,这些在我们经过不断的调试之后都会被发现并解决。

总体而言,本次试验,让我们对Parzen窗法求类条件概率密度,以及Fisher 线性判别法都有了更大的了解。

代码:%特征是身高,先验概率为0.5、0.5时用Parzen窗法,贝叶斯分类器。

clc;clear all;[FH FW]=textread('C:\Users\xuyd\Desktop\homework\FEMALE.txt','%f%f');[MH MW]=textread('C:\Users\xuyd\Desktop\homework\MALE.txt','%f%f');FA=[FH FW];MA=[MH MW];N1=max(size(FA));h1=4;hn1=h1/(sqrt(N1));VN1=h1/(sqrt(N1));N2=max(size(MA));h2=4;hn2=h2/(sqrt(N2));VN2=h2/(sqrt(N2));[tH tW]=textread('C:\Users\xuyd\Desktop\homework\test2.txt','%f%f%*s');X=[tH tW];[M N]=size(X);s=zeros(M,1);A=[X(:,1) X(:,2) s];error=0;errorgirl=0;errorboy=0;errorrate=0;errorgirlrate=0;errorboyrate=0;girl=0;boy=0;bad=0;for k=1:M %测试集x=A(k);p=0.5;%p为属于女生的先验概率,则1-p为男生的先验概率for i=1:N1pp(i)=1/sqrt(2*pi)*exp(-0.5*(abs(x-FA(i)))^2/(hn1^2));%pp(i)是窗函数endp1=sum(1/VN1*pp');y1=1/N1*p1;%是女生的条件概率密度函数for j=1:N2qq(j)=1/sqrt(2*pi)*exp(-0.5*(abs(x-MA(j)))^2/(hn2^2));endq1=sum(1/VN2*qq');y2=1/N2*q1;%男生的概率密度函数,即其条件概率g=p*y1-(1-p)*y2;%g为判别函数if g>0if k<=50s(k,1)=0;%判为女生girl=girl+1;elseerrorboy=errorboy+1;endelseif g<0if k<=50errorgirl=errorgirl+1;elses(k,1)=1;%判为男生boy=boy+1;endelses(k,1)=-2;%不能判别是指等于0时的情况bad=bad+1;endenderrorgirlerrorboybadgirl=errorboy+girlboy=boy+errorgirlerror=errorgirl+errorboyerrorgirlrate=errorgirl/50errorboyrate=errorboy/250errorrate=error/M%特征是身高与体重,先验概率为0.5、0.5时用Parzen窗法,贝叶斯分类器。

clc;clear all;[FH FW]=textread('C:\Users\xuyd\Desktop\homework\FEMALE.txt','%f%f'); [MH MW]=textread('C:\Users\xuyd\Desktop\homework\MALE.txt','%f%f');FA=[FH FW];MA=[MH MW];N1=max(size(FA));h1=7;hn1=h1/(sqrt(N1));VN1=hn1^2;N2=max(size(MA));h2=7;hn2=h2/(sqrt(N2));VN2=hn2^2;[tH tW]=textread('C:\Users\xuyd\Desktop\homework\test2.txt','%f%f%*s');X=[tH tW];[M N]=size(X);s=zeros(M,1);error=0;errorgirl=0;errorboy=0;errorrate=0;errorgirlrate=0;errorboyrate=0;girl=0;boy=0;bad=0;for k=1:MA=[X(k,1) X(k,2)];x=A;p=0.5;%p为属于女生的先验概率,则1-p为男生的先验概率pp=0;for i=1:N1fa=[FA(i,1) FA(i,2)];n=1/sqrt(2*pi)*exp(-0.5*abs((x-fa)*(x-fa)')/(hn1^2));pp=pp+n;endp1=1/VN1*pp';y1=1/N1*p1;%是女生的条件概率密度函数qq=0;for j=1:N2ma=[MA(j,1) MA(j,2)];m=1/sqrt(2*pi)*exp(-0.5*abs((x-ma)*(x-ma)')/(hn2^2));qq=m+qq;endq1=sum(1/VN2*qq');y2=1/N2*q1;%男生的概率密度函数,即其条件概率g=p*y1-(1-p)*y2;%g为判别函数if g>0if k<=50s(k,1)=0;%判为女生girl=girl+1;elseerrorboy=errorboy+1;endelseif g<0if k<=50errorgirl=errorgirl+1;elses(k,1)=1;%判为男生boy=boy+1;endelses(k,1)=-2;%不能判别是指等于0时的情况bad=bad+1;endenderrorgirlerrorboybadgirl=errorboy+girlboy=boy+errorgirlerror=errorgirl+errorboyerrorgirlrate=errorgirl/50errorboyrate=errorboy/250errorrate=error/M%用fisher线性判别法求阈值function [w,y0]=fisher(AA,BB)A=AA';B=BB';[k1,l1]=size(A);[k2,l2]=size(B);M1=sum(AA);M1=M1';M1=M1/l1;%男生均值向量M2=sum(BB);M2=M2';M2=M2/l2;%女生均值向量S1=zeros(k1,k1);%建立矩阵S2=zeros(k2,k2);for i=1:l1S1=S1+(A(:,i)-M1)*((A(:,i)-M1).');%男生的类内离散度矩阵endfor i=1:l2S2=S2+(B(:,i)-M2)*((B(:,i)-M2).');%女生的类内离散度矩阵endSw=0.5*S1+0.5*S2;%总类内离散度矩阵,先验概率0.5w=inv(Sw)*(M1-M2);%两列wT=w';%wT就是使Fisher准则函数JF(w)取极大值时的解,也就是d维X空间到1维Y空间的最好的投影方向for i=1:l1Y1(i)=wT(1,1)*A(1,i)+wT(1,2)*A(2,i);%求出二维男生样本集映射到一维时的量endfor i=1:l2Y2(i)=wT(1,1)*B(1,i)+wT(1,2)*B(2,i);%求出二维女生样本集映射到一维时的量endm1=sum(Y1)/l1;m2=sum(Y2)/l2;y0=(l1*m1+l2*m2)/(l1+l2);%%用fisher线性判别函数来判断clcclear all[filename,pathname,filterindex] = uigetfile('*.txt', '请读入男生训练集'); fileAddrs = [pathname,filename];[A1 A2]=textread(fileAddrs,'%f%f');[filename,pathname,filterindex] = uigetfile('*.txt', '请读入女生训练集'); fileAddrs = [pathname,filename];[B1 B2]=textread(fileAddrs,'%f%f');AA=[A1 A2];BB=[B1 B2];[w,y0]=fisher(AA,BB);wT=w';girl=0;boy=0;bad=0;errorgirl=0;errorboy=0;error=0;errorgirlrate=0;errorboyrate=0;errorrate=0;[filename,pathname,filterindex] = uigetfile('*.txt', '请读入测试集'); fileAddrs = [pathname,filename];[T1 T2]=textread(fileAddrs,'%f%f%*s');TT=[T1 T2];T=TT';[k3 l3]=size(T);for k=1:50y(k)=wT*T(:,k);if y(k)>y0errorgirl=errorgirl+1;else if y(k)<y0girl=girl+1;elsebad=bad+1;endendendfor k=51:300y(k)=wT*T(:,k);if y(k)>y0boy=boy+1;else if y(k)<y0errorboy=errorboy+1;elsebad=bad+1;endendenderrorgirlerrorboybadgirl=errorboy+girlboy=boy+errorgirlerror=errorgirl+errorboyerrorgirlrate=errorgirl/50errorboyrate=errorboy/250errorrate=error/l3%画图[filename,pathname,filterindex] = uigetfile('*.txt', '请读入男生训练集'); fileAddrs = [pathname,filename];[A1 A2]=textread(fileAddrs,'%f%f');[filename,pathname,filterindex] = uigetfile('*.txt', '请读入女生训练集'); fileAddrs = [pathname,filename];[B1 B2]=textread(fileAddrs,'%f%f');AA=[A1 A2];BB=[B1 B2];A=AA';B=BB';[k1,l1]=size(A);[k2,l2]=size(B);[w,y0]=fisher(AA,BB);for i=1:l1x=A(1,i);y=A(2,i);%x是身高,y是体重plot(x,y,'R.');hold onendfor i=1:l2x=B(1,i);y=B(2,i);plot(x,y,'G.');hold onenda1=min(A(1,:));%男生身高最小值a2=max(A(1,:));%男生身高最大值b1=min(B(1,:));%女生身高最小值b2=max(B(1,:));%女生身高最大值a3=min(A(2,:));%男生体重最小值a4=max(A(2,:));%男生体重最大值b3=min(B(2,:));%女生体重最小值b4=max(B(2,:));%女生体重最大值if a1<b1a=a1;elsea=b1;%a是所有人中身高最小值endif a2>b2b=a2;elseb=b2;%b是所有人中身高最大值endif a3<b3c=a3;elsec=b3;%c是所有人中体重最小值endif a4>b4d=a4;elsed=b4;%d为所有人中体重最大值endx=a:0.01:b;y=(y0-x*w(1,1))/w(2,1);plot(x,y,'B');hold on;%身高体重相关,判别测试样本%手动先验概率P1=0.5;P2=0.5;FA=A;MA=B;a=cov(FA')*(length(FA)-1)/length(FA); b=cov(MA')*(length(MA)-1)/length(MA); W1=-1/2*inv(a);W2=-1/2*inv(b);Ave1=(sum(FA')/length(FA))';Ave2=(sum(MA')/length(MA))';w1=inv(a)*Ave1;w2=inv(b)*Ave2;w10=-1/2*Ave1'*inv(a)*Ave1-1/2*log(det(a))+log(P1);w20=-1/2*Ave2'*inv(b)*Ave2-1/2*log(det(b))+log(P2);syms x ;syms y ;h=[x y]';h1=h'*W1*h+w1'*h+w10;h2=h'*W2*h+w2'*h+w20 ;h=h1-h2;ezplot(h,[130,200,30,100])%功能:应用Fisher准则判断一个身高体重二维数据的性别vector=[x;y];yy=(w.')*vector;if yy>y0value=2;%表示样本是男生elsevalue=1;%表示样本是女生end%功能:使用留一法求训练样本错误率[A1 A2]=textread('C:\Users\Administrator\Desktop\模式识别\homework\MALE.txt','%f%f');[B1 B2]=textread('C:\Users\Administrator\Desktop\模式识别\homework\FEMALE.txt','%f%f');AA=[A1 A2];BB=[B1 B2];A=AA';B=BB';m1=2;m2=2;n1=50;n2=50;tempA=zeros(m1,n1-1);count=0;for i=1:n1for j=1:(i-1)tempA(:,j)=A(:,j);endfor j=(i+1):n1tempA(:,j-1)=A(:,j);end[w,y0]=fisher((tempA.'),BB);flag=classify_CH(A(1,i),A(2,i),w,y0);if flag==1count=count+1;endendtempB=zeros(m2,n2-1);for i=1:n2for j=1:(i-1)tempB(:,j)=B(:,j);endfor j=(i+1):n2tempB(:,j-1)=B(:,j);end[w,y0]=fisher(AA,(tempB.'));flag=classify_CH(B(1,i),B(2,i),w,y0);if flag==2count=count+1;endenderror_ratio=count/(n1+n2)%使用留一法求测试样本错误率[T1 T2]=textread('C:\Users\Administrator\Desktop\模式识别\homework\test2.txt','%f%f%*s');TT=[T1 T2];T=TT';[k3 l3]=size(T);TG=zeros(2,50);TB=zeros(2,250);for i=1:50TG(:,i)=T(:,i);endfor j=51:l3TB(:,j-50)=T(:,j);endm1=2;m2=2;n1=50;n2=250;tempA=zeros(m1,n1-1);count=0;for i=1:n1for j=1:(i-1)tempA(:,j)=TG(:,j);endfor j=(i+1):n1tempA(:,j-1)=TG(:,j);end[w,y0]=fisher((tempA.'),TB');flag=classify_CH(TG(1,i),TB(2,i),w,y0);if flag==1count=count+1;endendtempB=zeros(m2,n2-1);for i=1:n2for j=1:(i-1)tempB(:,j)=TB(:,j);endfor j=(i+1):n2tempB(:,j-1)=TB(:,j);end[w,y0]=fisher(TG',(tempB.'));flag=classify_CH(TB(1,i),TB(2,i),w,y0);if flag==2count=count+1;endenderror_ratio=count/(n1+n2)。

相关文档
最新文档