数据统计基础知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9
1 随机抽样
定义:是指从总体抽取样品时,使每个个体被抽到的机 会均等以使所抽取的样本数据能够很好地代表总 体的抽样方法。
方法:鉴于实际情况产品的大小、形状、存取状态等方 面的差异及条件限制,常用的随机抽样方法为: (1)简单随机抽样法: (单纯随机抽样) ① 抽签法(或掷骰子法) ② 随机数表法 (2)分层随机抽样 (3)系统随机抽样 (4)多级随机抽样
7
样本与总体的关系
个体具有随机性 总体
总体具有统计规律性
抽样方法正确:①n足够大
条件
②随机抽取
决
统计推断方法正确
定
结果:样本的统计规律性在一定程 度上反映总体的统计规律性
样本
样品随机性 样本具有统计规律性
来自百度文库
8
三 数据收集的原则
数据的收集是一项重要的基础工作,为了给质 量管理工作提供可靠的准确的情报,搜集数据 时,必须遵循以下原则 1 随机抽样 2 数据的分层 3 明确数据收集的目的和方法 4 作好数据记录,保证数据真实、可靠、准确
§ 1.1 数据的收集 § 1.2 数字特征描述(估计) § 1.3 分布状态描述——频数直方图 § 1.4 排列图、因果分析图、趋势图
2
§1.1 数据的收集
科学研究中,若无定量分析,就不会有明确的 概念,也就不易找出科学的规律。质量管理如果不 进行定量分析,也就不会有明确的质量概念,就不 会有科学的质量管理。因此质量管理是一种以数据 为基础的活动。人们必须通过有目的的搜集数据, 从中获取有关产品质量或生产状态的正确情报,从 而做出正确的判断和决策,更有效地管理生产。
(3)例:从批量N =50的产品中抽n = 4的样本采用掷骰子 采用掷骰子法确定选随机数表“I”;用瞎子点点法确定起点为11
行 第1 列,随机号码为18、18、07、92、45、44…取18、7、42、
45
11
分层随机抽样
● 定义:将总体按产品的某些特征把整批产品划分为若干层 (即小批),即分为层,同一层内的产品质量尽可
一 数据及其实质
二 总体、个体、样本、样品
三 数据收集的原则
四 数据的分类
3
一 数据及其实质
● 数据:在质量管理的各项活动中,记录有关科 学试验、质量特征、生产状态及管理现 状得到的数字资料统称为数据。
● 实质:收集的数据绝大多数都 既 具 有 随机性 (偶然性)又具有统计规律性。也就是 说它们具有随机现象的某些特征,或者 说是随机变量的一组取值。
● 如果要研究的不是一个,而是几个数量指标,如对一批晶体管不仅要研究 其直流放大系数,还有研 究 集电极-发射电极反向电流时,则要分为几个 总体来研究。
● 总体的有限和无限 类 型 随 研究的问题而定,对于上述的一批晶体管而言, 总体是有限的;但有时根据研究的需要,我们常把相同条件下的生产的所 有晶体管看成一个总体,显然,此时,它是一个无限总体。
4
二 总体、个体、样本、样品
1 总体与个体 定义:研究对象的全体,称为总体或母体;组成总体的每个单元称为个体
● 研究对象的全体,指的是研究对象某 个数量 指 标 的 全部取值,由于一个 数量指标通常就是一个随机变量,因此,总体是指某随机变量的取值的全 体。而其中的每 个 值 都 是 一 个 个 体。例如,工厂生产一批晶体管,共 10000件。其直流放大系数是一个随机变量,10000件产品直流放大系数数 据的全体称为总体,而其中的一个数据则是一个个体。
数据统计基础知识培训教材
品质保证部 (2009年3月)
1
统计基础知识
• 数理统计的应用相当广泛,它已成为工业、农业、商业、医药卫生、 教育、社会学、经济学、生物学、气象学等各领域必不可少的数学 工具和分析方法,因此又被称为统计技术。
• 描述统计是通过图表或数学方法,对数据资料进行整理、分析,并 对数据的分布状态、数字特征和随机变量之间关系进行估计和描述 的方法。
10
随机数表法
(1)定义:用随机数表查出样本号码的方法 (2)步骤:
● 随机决定所用数表页码(瞎子点点法或掷骰子法) ● 决定起点(瞎子点点法) ● 查样本号数:
﹡N≤10,查一位数字即可,取到n个样品为止,重复的数字取消 ﹡11≤n≤100,查两位数字,大于n的以n除之取余数,重复数字去掉 ﹡n>100,向下取三位,大于n的以n除之取余数,重复数字去掉
6
3 样本与总体
● 人们从总体中抽取样本的目的是根据样本数据对总体的数字特征和 分布规律进行推断、估计和检验。
●由样本推断和估计总体很难做到完全精确和可靠。但是必须采取措施 获得比较精确和具有一定可靠性的推断。其措施涉及两方面的问题: 即抽取样本的方法和统计推断的方法。
● 当样本的抽取满足下列两个条件时,样本将能很好地反映总体的统 计规律性: (1)样本容量n足够大。样本容量越大,推断的结论越准确,可 靠性越高; (2)采用随机抽样,即总体中每个个体被抽到的机会均等,即使 一个个体被抽取后,总体的成分不变。换句话说,每个样品 的抽取都是一次独立、重复试验。
能均匀一致,在各层内分别用简单随机抽样法抽取
一定数量的个体组成一个样本的方法
● 分层按比例随机抽样:若按各层在整批中所占比例分别在
各层内抽取就称为分层按比例随机
抽样
● 例:某批产品批量为N=1600,由A、B、C三条生产线加工
而成,NA=800,NB=640,NC=160。取n=150的样本。
解:
800
nA
150 1600
75
nB 60
nC 15
12
系统随机抽样法(间隔随机抽样)
● 定义:当批中产品可以按某个次序排列时,给批中
每个 产 品 编号1~N,以 N 整数部分
抽样间隔,用简单随机抽样n 法在1至
N n
为 N
n
之间
2 样本与样品 3 样本与总体
5
2 样本与样品
定义:从总体中随机抽取的若干个个体的总和称为 样本或子样;组成样本的每个个体称为样品; 样本中所有的样品的数目称为样本容量或子 样大小,样本容量常用符号n代表
例: 从批量为10,000的一批晶体管中随机抽取20件 进行检查,被抽查的20件产品称为样本,而其 中每一件产品称为样品;样本大小为20。由 于人们通常只获得样本数据,故简称为数据。
1 随机抽样
定义:是指从总体抽取样品时,使每个个体被抽到的机 会均等以使所抽取的样本数据能够很好地代表总 体的抽样方法。
方法:鉴于实际情况产品的大小、形状、存取状态等方 面的差异及条件限制,常用的随机抽样方法为: (1)简单随机抽样法: (单纯随机抽样) ① 抽签法(或掷骰子法) ② 随机数表法 (2)分层随机抽样 (3)系统随机抽样 (4)多级随机抽样
7
样本与总体的关系
个体具有随机性 总体
总体具有统计规律性
抽样方法正确:①n足够大
条件
②随机抽取
决
统计推断方法正确
定
结果:样本的统计规律性在一定程 度上反映总体的统计规律性
样本
样品随机性 样本具有统计规律性
来自百度文库
8
三 数据收集的原则
数据的收集是一项重要的基础工作,为了给质 量管理工作提供可靠的准确的情报,搜集数据 时,必须遵循以下原则 1 随机抽样 2 数据的分层 3 明确数据收集的目的和方法 4 作好数据记录,保证数据真实、可靠、准确
§ 1.1 数据的收集 § 1.2 数字特征描述(估计) § 1.3 分布状态描述——频数直方图 § 1.4 排列图、因果分析图、趋势图
2
§1.1 数据的收集
科学研究中,若无定量分析,就不会有明确的 概念,也就不易找出科学的规律。质量管理如果不 进行定量分析,也就不会有明确的质量概念,就不 会有科学的质量管理。因此质量管理是一种以数据 为基础的活动。人们必须通过有目的的搜集数据, 从中获取有关产品质量或生产状态的正确情报,从 而做出正确的判断和决策,更有效地管理生产。
(3)例:从批量N =50的产品中抽n = 4的样本采用掷骰子 采用掷骰子法确定选随机数表“I”;用瞎子点点法确定起点为11
行 第1 列,随机号码为18、18、07、92、45、44…取18、7、42、
45
11
分层随机抽样
● 定义:将总体按产品的某些特征把整批产品划分为若干层 (即小批),即分为层,同一层内的产品质量尽可
一 数据及其实质
二 总体、个体、样本、样品
三 数据收集的原则
四 数据的分类
3
一 数据及其实质
● 数据:在质量管理的各项活动中,记录有关科 学试验、质量特征、生产状态及管理现 状得到的数字资料统称为数据。
● 实质:收集的数据绝大多数都 既 具 有 随机性 (偶然性)又具有统计规律性。也就是 说它们具有随机现象的某些特征,或者 说是随机变量的一组取值。
● 如果要研究的不是一个,而是几个数量指标,如对一批晶体管不仅要研究 其直流放大系数,还有研 究 集电极-发射电极反向电流时,则要分为几个 总体来研究。
● 总体的有限和无限 类 型 随 研究的问题而定,对于上述的一批晶体管而言, 总体是有限的;但有时根据研究的需要,我们常把相同条件下的生产的所 有晶体管看成一个总体,显然,此时,它是一个无限总体。
4
二 总体、个体、样本、样品
1 总体与个体 定义:研究对象的全体,称为总体或母体;组成总体的每个单元称为个体
● 研究对象的全体,指的是研究对象某 个数量 指 标 的 全部取值,由于一个 数量指标通常就是一个随机变量,因此,总体是指某随机变量的取值的全 体。而其中的每 个 值 都 是 一 个 个 体。例如,工厂生产一批晶体管,共 10000件。其直流放大系数是一个随机变量,10000件产品直流放大系数数 据的全体称为总体,而其中的一个数据则是一个个体。
数据统计基础知识培训教材
品质保证部 (2009年3月)
1
统计基础知识
• 数理统计的应用相当广泛,它已成为工业、农业、商业、医药卫生、 教育、社会学、经济学、生物学、气象学等各领域必不可少的数学 工具和分析方法,因此又被称为统计技术。
• 描述统计是通过图表或数学方法,对数据资料进行整理、分析,并 对数据的分布状态、数字特征和随机变量之间关系进行估计和描述 的方法。
10
随机数表法
(1)定义:用随机数表查出样本号码的方法 (2)步骤:
● 随机决定所用数表页码(瞎子点点法或掷骰子法) ● 决定起点(瞎子点点法) ● 查样本号数:
﹡N≤10,查一位数字即可,取到n个样品为止,重复的数字取消 ﹡11≤n≤100,查两位数字,大于n的以n除之取余数,重复数字去掉 ﹡n>100,向下取三位,大于n的以n除之取余数,重复数字去掉
6
3 样本与总体
● 人们从总体中抽取样本的目的是根据样本数据对总体的数字特征和 分布规律进行推断、估计和检验。
●由样本推断和估计总体很难做到完全精确和可靠。但是必须采取措施 获得比较精确和具有一定可靠性的推断。其措施涉及两方面的问题: 即抽取样本的方法和统计推断的方法。
● 当样本的抽取满足下列两个条件时,样本将能很好地反映总体的统 计规律性: (1)样本容量n足够大。样本容量越大,推断的结论越准确,可 靠性越高; (2)采用随机抽样,即总体中每个个体被抽到的机会均等,即使 一个个体被抽取后,总体的成分不变。换句话说,每个样品 的抽取都是一次独立、重复试验。
能均匀一致,在各层内分别用简单随机抽样法抽取
一定数量的个体组成一个样本的方法
● 分层按比例随机抽样:若按各层在整批中所占比例分别在
各层内抽取就称为分层按比例随机
抽样
● 例:某批产品批量为N=1600,由A、B、C三条生产线加工
而成,NA=800,NB=640,NC=160。取n=150的样本。
解:
800
nA
150 1600
75
nB 60
nC 15
12
系统随机抽样法(间隔随机抽样)
● 定义:当批中产品可以按某个次序排列时,给批中
每个 产 品 编号1~N,以 N 整数部分
抽样间隔,用简单随机抽样n 法在1至
N n
为 N
n
之间
2 样本与样品 3 样本与总体
5
2 样本与样品
定义:从总体中随机抽取的若干个个体的总和称为 样本或子样;组成样本的每个个体称为样品; 样本中所有的样品的数目称为样本容量或子 样大小,样本容量常用符号n代表
例: 从批量为10,000的一批晶体管中随机抽取20件 进行检查,被抽查的20件产品称为样本,而其 中每一件产品称为样品;样本大小为20。由 于人们通常只获得样本数据,故简称为数据。