生物医学数据分析Matlab——刘青萍
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 用于绘制二维垂直条形图,用垂直条形显 示向量或矩阵中的值 -bar(y) 为每一个y中的元素画一个条状 -bar(x,y) 在指定的横坐标x上画出y,其中x为严格当 增的向量。若y为矩阵,则bar把矩阵分解成 几个行向量,在指定的横坐标处分别画出
-bar(x,y,width) 设置条形的相对宽度和控制在一组内条形的 间距。默认值为0.8,同一组内条形有很小 的间距。若设置width为1,则同一组内的条 形相互接触。
-bar(x,y,style)
style定义条的形状类型,可取’group’和’stack’
x=1:10 y=rand(10,2) bar(x,y,’stack’)
下表为160名正常成年女子的血清甘油三脂 (mmol/L)测量结果,试编制频数表,并画出直方图。
• 频数表和直方图
在进行统计分析或计算特定统计量之前,需要对样本数据的分布首 先有个整体了解,通常采用频数表或直方图形式来描述。
• cumsum(A)
-返回一个矩阵,其第i列是矩阵A的第i列的累加和向量 A=[2 3 4;7 8 6;4 5 9]
• size函数:显示矩阵的维数 A=[2 3 4 5;6 4 8 3] • zeros(m,n):产生m*n的全0矩阵 zeros(2,3) • length(A):数组A的行数或列数的最大值 A=[2 3 4 5;6 4 8 3] • round(x):四舍五入取整 round(4.67)
sum函数
• sum(A)
-返回向量A各元素之和 A=[2 3 4 7 8 6 4 5 9]
• sum(A)
-返回一个行向量,向量的第i个元素是矩阵A的第i列元素和 A=[2 3 4;7 8 6;4 5 9]
cumsum函数
• cumsum(X)
-返回向量X累加和向量 A=[2 3 4 7 8 6 4 5 9]
dห้องสมุดไป่ตู้sp函数
• 显示特定的值或信息 disp(repmat('nihao ',4,3)) disp('matlab程序设计') disp([repmat(' 2 ',size(A))])
disp([repmat('
',size(A)), strcat(num2str(A),'-')])
bar命令
极差
• 是一种简单的变异程度的度量 -极差=最大值-最小值 -极差很少被单独用来度量变异程度,因为 仅凭两个观察值,极易受到异常值的影响。 A=[4 7 23 36 8 9 12 43 76]
R=max(A)-min(A)
组距分组
• 组距分组是数值型数据分组的基本形式。 将全部变量值依次划分为若干个区间,并 将这一区间的变量值作为一组。 -组距=极差/组数 -组数的确定是为了显示数据的分布特征和 规律。 A=[4 7 23 36 8 9 12 43 76] R=max(A)-min(A) g_int=R/3 g_bins=[4:g_int:76]
由采样数据x编制频数表应遵循的步骤如下。
(1) 求极差: Range max( x) min( x) (2) 确定组距:极差/组段数。组段数以10~15组为宜, 分组过多计算繁琐,而过少分布特征又难以显现。 (3) 按组段进行计数,统计频数。
SamData=[0.91 1.23 1.37 1.25 1.17 1.20 0.90 1.24 1.04 1.49... ……………… 1.77 0.96 0.94 1.07 0.97 0.83 0.85 0.65 0.99 1.06]; save Data1 SamData %%%储存数据到Data1.mat文件,便于以后调用。 xmax=max(SamData);%%%求最大值 xmin=min(SamData);%%%求最小值 R=xmax-xmin; %%%求极距 g_int=round(R/12*10)/10; %%%组段为12段,求组距,保留小数点后1位。 g_bins=[0.5:g_int:1.7]'; %%%组段的边界 xcount=zeros(size(g_bins)); for k=1:length(g_bins)-1 xcount(k)=sum(SamData>=g_bins(k)&SamData<g_bins(k+1));%%%各组段内计数 end xcount(end)=sum(SamData>=g_bins(end));%%%最后一组段计数 Total=sum(xcount);%%%计数总和 f=xcount./Total; %%%频率 xccum=cumsum(xcount); fcum=cumsum(f);%%%累计频率
频数
频数也称“次数”, 对总数据按某种标 准进行分组,统计 出各个组内含个体 的个数。
累积频数
将各类别的频数逐 级累加起来。
max函数
• max(A)
-返回一个行向量,向量的第i个元素是矩阵 A的第i列上 的最大值 A=[2 3 4;7 8 6;4 5 9]
• [Y,U]=max(A)
-返回向量Y和U,Y向量记录A的每列的最大值,U向量记 录每列最大值的行号 A=[2 3 4 7 8 9 4 5 6 3 7]
disp(' 表3-3 160名正常成年女子的血清甘油三脂/mmol*L-1 频数分布表 ' ) disp('------------------------------------------------------------') disp(' 组段 频数 累计频数 频率(%) 累积频率(%) ') disp('------------------------------------------------------------') disp([repmat(' ',size(g_bins)),strcat(num2str(g_bins,'%.1f'), '-'),... repmat(' ',size(g_bins)),num2str(xcount,'%2d'),repmat(' ',... size(g_bins)),num2str(xccum,'%3d'),repmat(' ',size (g_bins)),... num2str(f*100,'%.1f'),repmat(' ',size(g_bins)),num2str(fcum*100, '%.1f')]); disp('----------------------------------------------------------') ; disp([' 合计 ',num2str(sum(xcount)),' ',num2str (sum(f)*100)]) ; disp('------------------------------------------------------------') figure, bar(g_bins,xcount,1);%%%绘制直方图 title('分布直方图'); xlabel('组段'); ylabel('频数');
3.2 医学统计学实例分析
统计学在以概率论为其理论基础, 专门研究认识随机现象数量方面的方法 论科学,是关于数据收集、表达和分析 的普遍原理和方法。
1 2 3
以正确的方式收集数据 描述数据的统计特征 统计分析及得出正确结论
统计分析
• 统计描述:用统计指标、统计表和统计图 描述资料的分析规律及数量特征 • 统计推论:包括总体参数估计和假设检验 两部分内容
-bar(x,y,width) 设置条形的相对宽度和控制在一组内条形的 间距。默认值为0.8,同一组内条形有很小 的间距。若设置width为1,则同一组内的条 形相互接触。
-bar(x,y,style)
style定义条的形状类型,可取’group’和’stack’
x=1:10 y=rand(10,2) bar(x,y,’stack’)
下表为160名正常成年女子的血清甘油三脂 (mmol/L)测量结果,试编制频数表,并画出直方图。
• 频数表和直方图
在进行统计分析或计算特定统计量之前,需要对样本数据的分布首 先有个整体了解,通常采用频数表或直方图形式来描述。
• cumsum(A)
-返回一个矩阵,其第i列是矩阵A的第i列的累加和向量 A=[2 3 4;7 8 6;4 5 9]
• size函数:显示矩阵的维数 A=[2 3 4 5;6 4 8 3] • zeros(m,n):产生m*n的全0矩阵 zeros(2,3) • length(A):数组A的行数或列数的最大值 A=[2 3 4 5;6 4 8 3] • round(x):四舍五入取整 round(4.67)
sum函数
• sum(A)
-返回向量A各元素之和 A=[2 3 4 7 8 6 4 5 9]
• sum(A)
-返回一个行向量,向量的第i个元素是矩阵A的第i列元素和 A=[2 3 4;7 8 6;4 5 9]
cumsum函数
• cumsum(X)
-返回向量X累加和向量 A=[2 3 4 7 8 6 4 5 9]
dห้องสมุดไป่ตู้sp函数
• 显示特定的值或信息 disp(repmat('nihao ',4,3)) disp('matlab程序设计') disp([repmat(' 2 ',size(A))])
disp([repmat('
',size(A)), strcat(num2str(A),'-')])
bar命令
极差
• 是一种简单的变异程度的度量 -极差=最大值-最小值 -极差很少被单独用来度量变异程度,因为 仅凭两个观察值,极易受到异常值的影响。 A=[4 7 23 36 8 9 12 43 76]
R=max(A)-min(A)
组距分组
• 组距分组是数值型数据分组的基本形式。 将全部变量值依次划分为若干个区间,并 将这一区间的变量值作为一组。 -组距=极差/组数 -组数的确定是为了显示数据的分布特征和 规律。 A=[4 7 23 36 8 9 12 43 76] R=max(A)-min(A) g_int=R/3 g_bins=[4:g_int:76]
由采样数据x编制频数表应遵循的步骤如下。
(1) 求极差: Range max( x) min( x) (2) 确定组距:极差/组段数。组段数以10~15组为宜, 分组过多计算繁琐,而过少分布特征又难以显现。 (3) 按组段进行计数,统计频数。
SamData=[0.91 1.23 1.37 1.25 1.17 1.20 0.90 1.24 1.04 1.49... ……………… 1.77 0.96 0.94 1.07 0.97 0.83 0.85 0.65 0.99 1.06]; save Data1 SamData %%%储存数据到Data1.mat文件,便于以后调用。 xmax=max(SamData);%%%求最大值 xmin=min(SamData);%%%求最小值 R=xmax-xmin; %%%求极距 g_int=round(R/12*10)/10; %%%组段为12段,求组距,保留小数点后1位。 g_bins=[0.5:g_int:1.7]'; %%%组段的边界 xcount=zeros(size(g_bins)); for k=1:length(g_bins)-1 xcount(k)=sum(SamData>=g_bins(k)&SamData<g_bins(k+1));%%%各组段内计数 end xcount(end)=sum(SamData>=g_bins(end));%%%最后一组段计数 Total=sum(xcount);%%%计数总和 f=xcount./Total; %%%频率 xccum=cumsum(xcount); fcum=cumsum(f);%%%累计频率
频数
频数也称“次数”, 对总数据按某种标 准进行分组,统计 出各个组内含个体 的个数。
累积频数
将各类别的频数逐 级累加起来。
max函数
• max(A)
-返回一个行向量,向量的第i个元素是矩阵 A的第i列上 的最大值 A=[2 3 4;7 8 6;4 5 9]
• [Y,U]=max(A)
-返回向量Y和U,Y向量记录A的每列的最大值,U向量记 录每列最大值的行号 A=[2 3 4 7 8 9 4 5 6 3 7]
disp(' 表3-3 160名正常成年女子的血清甘油三脂/mmol*L-1 频数分布表 ' ) disp('------------------------------------------------------------') disp(' 组段 频数 累计频数 频率(%) 累积频率(%) ') disp('------------------------------------------------------------') disp([repmat(' ',size(g_bins)),strcat(num2str(g_bins,'%.1f'), '-'),... repmat(' ',size(g_bins)),num2str(xcount,'%2d'),repmat(' ',... size(g_bins)),num2str(xccum,'%3d'),repmat(' ',size (g_bins)),... num2str(f*100,'%.1f'),repmat(' ',size(g_bins)),num2str(fcum*100, '%.1f')]); disp('----------------------------------------------------------') ; disp([' 合计 ',num2str(sum(xcount)),' ',num2str (sum(f)*100)]) ; disp('------------------------------------------------------------') figure, bar(g_bins,xcount,1);%%%绘制直方图 title('分布直方图'); xlabel('组段'); ylabel('频数');
3.2 医学统计学实例分析
统计学在以概率论为其理论基础, 专门研究认识随机现象数量方面的方法 论科学,是关于数据收集、表达和分析 的普遍原理和方法。
1 2 3
以正确的方式收集数据 描述数据的统计特征 统计分析及得出正确结论
统计分析
• 统计描述:用统计指标、统计表和统计图 描述资料的分析规律及数量特征 • 统计推论:包括总体参数估计和假设检验 两部分内容