2.1.1简单随机抽样
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Hale Waihona Puke 章引言数 字 化 的 时 代
产品的合格率
农作物的产量
就业状况
30 25 20 15 10 5 0 上海 南京 天津 沈阳 哈尔滨 缺水量/
电视台的收视率
我国是世界上的第 13个贫水国,人均淡 水占量排世界第109 位
我国土地沙漠化问题非常严重,全国沙漠化土地面积已超 过174000平方公里,并以每年3400平方公里的速度扩张。
总体、个体、样本、样本容量
总体:在统计中,所有考察对象的全体。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做这个总 体的一个样本。 样本容量:样本中个体的数目。 问题一:“为了解我校3500名学生的身体情况,最近 组织学生体检,并抽样调查了高二(8)班54名学生 的身体情况。”这个调查中,总体、个体、样本、样 本容量各是什么? 问题二:对于一个确定的总体,其样本是唯一的吗?
在抽样调查中要注意什么问题?
那么,怎样从总体中抽取样本呢?如何表示样本数据? 如何从样本数据中提取基本信息(样本分布、样本数字特征 等),来推断总体的情况呢?这些正是本章要解决的问题。
数理统计所要解决的问题是如何根据样本来推断总体。 首先必须清楚地知道要收集的数据是什么;其次,我们检验 样本的目的是为了了解总体的情况;再次,我们要知道如何 才能收集到高质量的样本数据。
中央电视台需要在我市调查“春节联欢晚会”的收视率。 (1)每个看电视的人都要被问到吗? (2)对我校学生的调查结果能否作为该节目的收视率? (3)你认为对不同社区、年龄层次、文化背景的人所做调查的结 果会一样吗?
答(1)中央电视台在调查时不可能问到每一个看电视的人。
(2)对一所中学学生的调查结果不能作为该节目的收视率, 因为只有中学生,缺乏代表性。 (3)不同社区、年龄层次、文化背景的人所做调查的结果
不一样,因为他们的兴趣、爱好等方面情况相距甚远。
为了了解学生对学校伙食的满意程度,小红访问了50名女生; 小聪访问了50名男生;小明访问了24名男生和24名女生, 其中高一、高二和高三的男生和女生各8名。你认为小红、小聪、 小明三人的不同抽样方法那一种最好?为什么?
答:小明的方法最好。小明抽得样本既有男生,又有女生,而 均匀分布在各年级,这样的抽样较具有代表性,反映的情况具 有普遍意义。 1.我们常常根据样本得到结果来推测总体的结果。不同 的抽样可能得到不同的结果。 2.为了使结果更具准确性,抽样时,样本的容量要合 理,样本的个体要有代表性。
实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如
下: 候选人 罗斯福 兰顿 预测结果 43 57 选举结果 62 38
思 考
你认为预期结果出错的原因是什么?
原因是:用于统计推断的样本来自少数富人,只能代 表富人的观点,不能代表全体选民的观点(样本不具有代 表性)。 像本例中这样容易得到的样本称为方便样本。如果使 用“方便样本”,那么得出与事实不符的结论的可能性就 会大大增加。 结论:在抽样时不能只图方便。如果只从一些容易得 到的个体中抽取样本,那么所得到的样本只是一个“方便 样本”,“方便样本”的代表性差,基本这种方便样本得 出的结论就会与事实相左。
要了解全国高中生的视力情况,调查方法:在全国 ①按东、西、南、北、中分片, ②每个区域各抽3所中学, ③对这15所中学的全部高中生15000人进行视力测试。 考察对象是什么? 全国每位高中学生的 视力情况。 在统计中,我们把所要考察的对象的 全体叫做总体 把组成总体的每一个考察的对象叫 做个体
这15000名学生的视力情况 从总体中取出的一部分个体的集体 又组成一个集体 叫做这个总体的一个样本。 15000 样本中的个体的数目叫做样本 的容量。
2.1 随机抽样
2.1.1 简单随机抽样
简单随机抽样
一般地,设一个总体含有有限个个体,并记其个 体数为N 。如果通过逐个抽取的方法从中抽取一个样 本,且每次抽取时各个个体被抽到的概率相等,就称 这样的抽样为简单随机抽样。
生活中的“数学”
品尝一勺汤,就可以知道一锅汤的味道,你知道其中蕴 涵的道理吗?
高质量的样本数据来自“搅拌均匀”的总体。如果我们 能够设法将总体“搅拌均匀”,那么从中任意抽取一部分 个体的样本,它们含有与总体基本相同的信息。
阅
读
一个著名的案例
在抽样调查中,样本的选择是至关重要的,样本能否代表总 体,直接影响着统计结果的可靠性。下面的故事是一次著名的失败的 统计调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什 么一个好的样本如此重要。 在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了 一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的 总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话 簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年 电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿 非常受欢迎,于是杂志预测兰顿将在选举中获胜。
你知道这些数据是怎么来的吗?
通过调查获得的。
怎么调查? 是对考察对象进行全面调查还是抽样 调查?
问题情境
• 1、灯泡厂要了解生产的灯泡的使用寿命,需要将 所有灯泡逐一测试吗? • 2、前一段时间,食品添加剂中“苏丹红”事件闹 得沸沸扬扬,国家卫生部要对食品中的添加剂 “苏丹红”含量进行检测,怎样获得相关数据? • 3、国际奥委会2003年6月决定29日决定,2008 年北京奥运会的举办日期将比原定日期推迟两周, 改在8月8日至8月24日举行。原因是7月末8月初 北京地区的气温高于8月中上旬。这一结论是如何 得到的?
统计学是干什么的?
• 现代社会是信息化的社会,人们常常需要 收集数据,根据所获得的数据提取有价值 的信息,作出合理的决策。统计是研究如 何合理收集、整理、分析数据的学科,它 可以为人们制定决策提供依据。
统计的基本思想方法是什么?
• 统计的基本思想方法是用样本估计总体, 即当总体数量很大或检测过程具有一定的 破坏性时,不直接去研究总体,而是通过 从总体中抽取一个样本,根据样本的情况 去估计总体的相应情况。 • 如何进行合理的抽样呢?
产品的合格率
农作物的产量
就业状况
30 25 20 15 10 5 0 上海 南京 天津 沈阳 哈尔滨 缺水量/
电视台的收视率
我国是世界上的第 13个贫水国,人均淡 水占量排世界第109 位
我国土地沙漠化问题非常严重,全国沙漠化土地面积已超 过174000平方公里,并以每年3400平方公里的速度扩张。
总体、个体、样本、样本容量
总体:在统计中,所有考察对象的全体。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做这个总 体的一个样本。 样本容量:样本中个体的数目。 问题一:“为了解我校3500名学生的身体情况,最近 组织学生体检,并抽样调查了高二(8)班54名学生 的身体情况。”这个调查中,总体、个体、样本、样 本容量各是什么? 问题二:对于一个确定的总体,其样本是唯一的吗?
在抽样调查中要注意什么问题?
那么,怎样从总体中抽取样本呢?如何表示样本数据? 如何从样本数据中提取基本信息(样本分布、样本数字特征 等),来推断总体的情况呢?这些正是本章要解决的问题。
数理统计所要解决的问题是如何根据样本来推断总体。 首先必须清楚地知道要收集的数据是什么;其次,我们检验 样本的目的是为了了解总体的情况;再次,我们要知道如何 才能收集到高质量的样本数据。
中央电视台需要在我市调查“春节联欢晚会”的收视率。 (1)每个看电视的人都要被问到吗? (2)对我校学生的调查结果能否作为该节目的收视率? (3)你认为对不同社区、年龄层次、文化背景的人所做调查的结 果会一样吗?
答(1)中央电视台在调查时不可能问到每一个看电视的人。
(2)对一所中学学生的调查结果不能作为该节目的收视率, 因为只有中学生,缺乏代表性。 (3)不同社区、年龄层次、文化背景的人所做调查的结果
不一样,因为他们的兴趣、爱好等方面情况相距甚远。
为了了解学生对学校伙食的满意程度,小红访问了50名女生; 小聪访问了50名男生;小明访问了24名男生和24名女生, 其中高一、高二和高三的男生和女生各8名。你认为小红、小聪、 小明三人的不同抽样方法那一种最好?为什么?
答:小明的方法最好。小明抽得样本既有男生,又有女生,而 均匀分布在各年级,这样的抽样较具有代表性,反映的情况具 有普遍意义。 1.我们常常根据样本得到结果来推测总体的结果。不同 的抽样可能得到不同的结果。 2.为了使结果更具准确性,抽样时,样本的容量要合 理,样本的个体要有代表性。
实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如
下: 候选人 罗斯福 兰顿 预测结果 43 57 选举结果 62 38
思 考
你认为预期结果出错的原因是什么?
原因是:用于统计推断的样本来自少数富人,只能代 表富人的观点,不能代表全体选民的观点(样本不具有代 表性)。 像本例中这样容易得到的样本称为方便样本。如果使 用“方便样本”,那么得出与事实不符的结论的可能性就 会大大增加。 结论:在抽样时不能只图方便。如果只从一些容易得 到的个体中抽取样本,那么所得到的样本只是一个“方便 样本”,“方便样本”的代表性差,基本这种方便样本得 出的结论就会与事实相左。
要了解全国高中生的视力情况,调查方法:在全国 ①按东、西、南、北、中分片, ②每个区域各抽3所中学, ③对这15所中学的全部高中生15000人进行视力测试。 考察对象是什么? 全国每位高中学生的 视力情况。 在统计中,我们把所要考察的对象的 全体叫做总体 把组成总体的每一个考察的对象叫 做个体
这15000名学生的视力情况 从总体中取出的一部分个体的集体 又组成一个集体 叫做这个总体的一个样本。 15000 样本中的个体的数目叫做样本 的容量。
2.1 随机抽样
2.1.1 简单随机抽样
简单随机抽样
一般地,设一个总体含有有限个个体,并记其个 体数为N 。如果通过逐个抽取的方法从中抽取一个样 本,且每次抽取时各个个体被抽到的概率相等,就称 这样的抽样为简单随机抽样。
生活中的“数学”
品尝一勺汤,就可以知道一锅汤的味道,你知道其中蕴 涵的道理吗?
高质量的样本数据来自“搅拌均匀”的总体。如果我们 能够设法将总体“搅拌均匀”,那么从中任意抽取一部分 个体的样本,它们含有与总体基本相同的信息。
阅
读
一个著名的案例
在抽样调查中,样本的选择是至关重要的,样本能否代表总 体,直接影响着统计结果的可靠性。下面的故事是一次著名的失败的 统计调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什 么一个好的样本如此重要。 在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了 一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的 总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话 簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年 电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿 非常受欢迎,于是杂志预测兰顿将在选举中获胜。
你知道这些数据是怎么来的吗?
通过调查获得的。
怎么调查? 是对考察对象进行全面调查还是抽样 调查?
问题情境
• 1、灯泡厂要了解生产的灯泡的使用寿命,需要将 所有灯泡逐一测试吗? • 2、前一段时间,食品添加剂中“苏丹红”事件闹 得沸沸扬扬,国家卫生部要对食品中的添加剂 “苏丹红”含量进行检测,怎样获得相关数据? • 3、国际奥委会2003年6月决定29日决定,2008 年北京奥运会的举办日期将比原定日期推迟两周, 改在8月8日至8月24日举行。原因是7月末8月初 北京地区的气温高于8月中上旬。这一结论是如何 得到的?
统计学是干什么的?
• 现代社会是信息化的社会,人们常常需要 收集数据,根据所获得的数据提取有价值 的信息,作出合理的决策。统计是研究如 何合理收集、整理、分析数据的学科,它 可以为人们制定决策提供依据。
统计的基本思想方法是什么?
• 统计的基本思想方法是用样本估计总体, 即当总体数量很大或检测过程具有一定的 破坏性时,不直接去研究总体,而是通过 从总体中抽取一个样本,根据样本的情况 去估计总体的相应情况。 • 如何进行合理的抽样呢?