minitab基础知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章基础知识
第一节数据类型及设置
在MINITAB系统中,有3种基本数据类型供用户选择,分别是:数值型数据、文本型数据和日期/时间型数据。
一般来说,不同类型的数据应采用不同的统计分析方法进行数据分析。所以,在应用MINITAB统计分析软件之前,应能够有效地识别不同类型的数据。
1.1.1 数值型(Numeric)数据
⑴计量数据(Measurement Data)
计量数据,为观测每个观察单位某项指标的大小而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。假如一个数据的所有可能取值充满数轴上一个区间(a,b),则称这样的数据为计量数据,其中a可以是-∞,b可以是+∞,通常称这类数据是连续数据(Continuous Data)。这种类型的数据往往既可以取整数、小数、分数,有时候(虽然不是全部)还可以取负数。例如:长度、重量、温度、湿度、体积、误差、速度、时间、寿命等等。它的统计分析与连续随机变量(Continuous random variable)的分布有关。在MINITAB 统计分析功能中,这种数据是主要的分析对象,统计分析时,常用的参数和方法有:均值、标准差、t检验、方差分析、回归分析等。
⑵计数数据(Enumeration Data)
计数数据又称为定性数据或分类数据(Categorical Data),是将观察单位按某种属性或类别分组计数,分别汇总各组观察单位后而得到的数据,其变量值是定性的,表现为互不相容的属性或类别。这类数据仅取数轴上有限个点或可列个点,一般只取非负整数,不取小数、分数,更不取负数。例如:某一单位面积内某一种缺陷的个数、一批产品中不合格品的个数、一个超市每天进入的人数、一个麦穗上的麦粒数等等。它的统计分析是与具有离散随机变量(Discrete random variable)的分布有关。在MINITAB的统计分析功能中,常采用非参数分析、2
χ检验、二项分布、超几何分布、泊松分布等统计方法。
以上两种数据的分类是相对的,在某些情况下,两种数据可以互相转化。例如:当观察某一特定人群的年龄时,年龄这个变量是连续的计量值数据,但是在实际统计分析时,为了使统计分析简化,往往按年、月、日进行分类,就变成了计数数据。
⑶等级数据(Ranked Data)
例如:对产品的质量情况进行分类,可以分为合格品、不合格品,或者分为一级品、二级品、等外品等等。在统计分析时这类数据常用比率、等级相关、非参数检验等统计分析方法。
⑷有序数据(Ordinal Data)
有序数据又称为有序分类数据(Ordinal Categories)。例如:评定某种酒或茶叶的品质时,只能评出一个顺序,又如布料和毛皮的手感程度等等。
⑸名义数据(Nominal Data)
名义数据或称为无序分类数据(Unordinal Categories)。有些数据既不是计量的、计数的,也不是有序的,例如人们的姓名、性别,各种不同的颜色赋予相应的不同代码,为不同类的书籍赋予相应的不同代码等等。
⑹截尾反应数据(Censored Responses)
截尾反应数据又称为删失数据(Censored Data)、不完全数据(Uncomplete Data)。例如:在产品可靠性研究领域,研究者通过试验观察到某种产品的使用寿命,这一类数据称为完全数据(Complete Data)或非截尾反应数据(Uncensored Responses)。有一部分或产品由于各种原因不能观察到其真正的使用寿命,但能够得到“该产品的使用寿命不小于某个数值”这样一个信息。习惯上,在该数值右上角标以“+”表示。统计分析时,常使用中位数、生存分析等参数或分析方法。
有的数值类型的数据又可根据实际需要相互转化。一般来说,不同类型的数据应采用相应的统计方法或图形分析方法进行描述或分析。在使用MINITAB统计软件进行统计分析时,应识别数据的不同类型,选用恰当的统计/图形模块进行分析,才可得到正确的结果。
在MINITAB统计软件的数据文件中,软件自动识别数据的类型,数值型数据以“C”表示,见图1.1-1。
1.1.2 文本型(Text)数据
文本型数据的特征一般由字母(各种文字、单词、句子),空格和指定的特征(各种符号)组成。文本就是文字,包括汉字和英文字母,但不包括数字,文本型数据不能做加减乘除等数学运算,若硬是将文本型数据加入数学运算,这些数据的默认值就是零,只是作包含、不包含、等于等运算。
【例题1.1-1】已知36个学生的学习成绩,已经建立数据文件数据文件见附件:学生统计表1(1-01).MPJ。在MINITAB统计软件的数据文件中,软件自动识别数据的类型,文本型数据以“C-T”表示,如图1.1-1a所示。
图1.1-1a 三种数据的表示方法
1.1.3 日期/时间型(Data/Time)数据
日期/时间型数据可以是日期型数据(例如:Jan-1-2009,或者2/17/2010),时间型数据(例如:08:25:22 PM),或者日期时间型数据两者皆有(例如:2/17/2010 08:25:22 PM)。用于各种日期和时间的标记。
在MINITAB统计软件的数据文件中,软件自动识别数据的类型,日期/时间型数据以“C-D”表示,见图1.1-1。
1.1.4 数据的格式设定
1、数值型数据的设置
使用数据文件:学生统计表1(1-01).MPJ。
步骤1:打开数据文件,选定数据所在的列变量,如图1.1-2所示。光标指定所在列变量,单击鼠标右键,在“格式列”中,选择“数据”,弹出如图1.1-3所示的对话框。
图1.1-2 打开数据文件,选定列变量,打开“格式列”→“数字”对话框
图1.1-3 数值型数据的格式设置
步骤2:用于指定如何格式化工作表列中的数字数据。对于数字型数据,可以选择的类别有,如图1.1-3所示。
①自动:选择此项将让Minitab 根据列中的值确定格式。
②固定小数:选择此项可指定固定小数格式。小数位:键入要显示的小数位数。
③指数:选择此项可指定指数格式。小数位:键入要显示的小数位数。
④货币:选择此项可指定货币格式。小数位:键入要显示的小数位数。符号: 选择货币符号。可用选项取决于Windows 控制面板中的区域和语言选项。负数:选择要用于负货币值的格式。货币类数据的格式设置如图1.1-4所示。
图1.1-4 数值型数据(货币类)的格式设置
⑤百分比:选择此项可指定百分比格式。小数位:键入要显示的小数位数。
步骤3:单击“确定”,完成数值型变量类型的设置。
2、日期/时间型数据的设定
仍然上例的数据文件:学生统计表1(1-01).MPJ。
步骤1:打开数据文件,选定数据所在的列变量,如图1.1-5所示。光标指定所在列变量,单击鼠标右键,在“格式列”中,选择“日期/时间”,弹出如图1.1-6所示的对话框。
图1.1-5 打开数据文件,选定列变量,打开“格式列”→“日期/时间”对话框