统计漫谈
漫谈统计学与数学的关系
4.5
报纸
10
0.050
5.0
路牌
2
0.010
1.0
推断统计
1. 内容
•总体
▪ 参数估计
▪ 假设检验
2. 目的
▪ 对总体特征作出
推断
•样
本
描述统计与推断统计的关系
•概率论
•(包括分布理论、大数定 律和中心极限定理等)
•反映客观 现象的数
据
•样本数 据
•总体数 据
•描述统计
•(统计数据的搜集、 整理、显示和分析等)
•按收集方法
•按时间状况
•分 •顺 •类 •序 •数 •数 •据 •据
•数 •值 •型 •数 •据
•观 •测 •数 •据
•实 •验
•计••数据量
•时
•间
•截
•序 •面
•列
•数
•数
•据
•据
•统计测量尺度的种类:
1.收集数据 Collecting Data 例,问卷调查Survey 2.演示数据 Presenting Data 例,图表Charts & Tables 3.刻划数据 Characterizing Data 例,平均值Average 4. 分析数据 Data Analysis
统计数据的内在规律
(一些例子)
1. 正常条件下新生婴儿 的性别比为107:100.
2. 投掷一枚均匀的硬币 ,出现正面和反面的 频率各为1/2;投掷一 枚骰子出现1~6点的 频率各为1/6
3. 农作物的产量与施肥 量之间存在相关关系
统计数据的内在规律 从大量实
(你知道的例子—讨论)
验(观察)数 据中利用统
计方法探索
在坚持中坚守 在坚信中坚定——30年统计工作感悟
是从长计议还是短期行为?都需
要 我 们 作 出 明 智 的 抉 择 。 实 际 上 , 的阶梯。
民 意 、掌 握 实 情 ,获 得 第 一 手 鲜 活
人 生 最 关 键 的 往 往 就 那 么 几 步 ,最
的 素 材 ,撰 写 出 有 深 度 、有 份 量 、
初 几 年 ,是 一 个 人 汲 取 知 识 营 养 的
与人之间的差异最终在于业余时
诗人陆游在给他的儿子传授写诗
间如何利用。业余时间可以成就
的经验时写道:
“ 汝 果 欲 学 诗 ,工
一 个 人 ,可 以 平 庸 一 个 人 ,也 可 以
夫 在 诗 外 。”大 意 是 指 :学 习 做 诗 ,
坚持勤奋蓄力量。初入统计
毁 灭 一 个 人 。 所 以 ,入 职 之 初 ,就
书记勉励我们:
“幸福都是奋斗出
就 拿 写 文 章 来 说 ,好 的 文 章 ,不 是
一 如 既 往 地 遨 游 数 海 、笔 耕 不 辍 ,
来 的 。”同 样 的 ,成 功 也 不 例 外 ,是
一 蹴 而 就 的 ,只 有 经 过 长 期 的 磨 练
以 德 润 身 、以 文 化 人 ,给 统 计 事 业
去 影 响 、感 染 身 边 的 人 ,积 极 带 领
悟 ,现 与 奋 斗 在 统 计 战 线 上 的 同 仁
等 各 类 书 籍 ,为 从 事 统 计 工 作 打 下
处(科)室 人 员 深 入 基 层 、深 入 一
们分享一二,共勉之。
良 好 的 基 础 。 爱 因 斯 坦 曾 说 过 :人
线 ,开 展 调 研 服 务 活 动 。 南 宋 爱 国
日 定 会 出 类 拔 萃 的 。 当 今 社 会 ,很
统计漫谈
养猴人心中暗笑:“朝四暮三和朝三暮四,不 是都等于七吗?这畜牲就是不如人聪明。”猴 子们窃窃私语:“朝四暮三和朝三暮四,虽然 吃到肚子里都等于七,但朝四暮三更符合早吃 饱、晚吃少的科学道理,不信去问问费雪。人 虽然比我们聪明,但没学过统计的人,智商还 真不如我们高”。 ——新编《齐物论》
20 世纪20年代后期的一个夏日午后,一群 风度翩翩的学者偕漂亮的夫人及女友,正在英国剑 桥的户外餐桌旁,悠闲地品茶论道。席间,一位美 丽的女士说道:午茶的调制顺序对味道有很大影响 ,把茶加进牛奶里和把牛奶加进茶里,喝起来风味 完全不同。出于对女性的尊重,那些学者们面带绅 士的微笑,内心却不以为然,甚至是藐视,依据他 们的科学头脑分析,茶和牛奶两种物质混合后的化 学成份不会因为调制顺序不同而不同,怎么会喝起 来不一样呢?在他们看来,这个命题的假定前提是 不论调制顺序如何,牛奶和茶的比例是固定的或是 基本不变的。美丽女士提出的问题有点类似朝四暮 三和朝三暮四的关系。
在大战紧急中,林彪无论有多忙,仍然坚持每晚必作的“功课”。一天深夜,值 班参谋正在读着下面某师上报的其下属部队的战报。说他们下面的部队碰到了一个 不大的遭遇战,歼敌部分、其余逃走。与其它之前所读的战报看上去并无明显异样 ,值班参谋就这样读着读着,林彪突然叫了一声“停!”他的眼里闪出了光芒,问 :“刚才念的在胡家窝棚那个战斗的缴获,你们听到了吗?” 大家带着睡意的脸上出现了茫然,因为如此战斗每天都有几十起,不都是差不 多一模一样的枯燥数字吗?林彪扫视一周,见无人回答,便接连问了三句: “为什么那里缴获的短枪与长枪的比例比其它战斗略高”?“为什么那里缴获 和击毁的小车与大车的比例比其它战斗略高”?“为什么在那里俘虏和击毙的军官 与士兵的比例比其它战斗略高”? 人们还没有来得及思索,等不及的林彪司令员大步走向挂满军用地图的墙壁, 指着地图上的那个点说:“我猜想,不,我断定!敌人的指挥所就在这里!” 随后林彪口授命令,追击从胡家窝棚逃走的那部分敌人,并坚决把他们打掉。 各部队要采取分割包围的办法,把失去指挥中枢后会变得混乱的几十万敌军切成小 块,逐一歼灭。 廖耀湘对自己静心隐蔽的精悍野战司令部那么快就被发现、打掉,觉得实在不 可思议,认为那是一个偶然事件,输得不甘心。当他得知林彪是如何得出判断之后 说,“我服了,败在他手下,不丢人。”
统计的魅力
统计的魅力
春秋时齐国名相管仲有言:“不明于计数,而欲举大事,犹无舟楫而经于水,险也。
"
伟人列宁曾说:“统计是认识社会最有力的武器之一。
”
统计能够帮助我们认识大千世界,洞察是非曲直,警示暗流坎坷,预测未来趋势。
特别是在今天这样一个信息社会、数字时代,统计的作用正变得越来越重要。
大到国家管理决策,小到百姓日常生活,都与统计有着密切联系统。
作为一名统计员,我深深的在这份工作中享受着。
时而苦恼,时而枯燥,时而甜蜜。
对它真的是爱着,又恨着,它的魅力在我经历了近四年统计工作后,更加深入的吸引着我。
知晓统计,理解统计,紧扣公司动态生产的实际发展情况,坚持理论联系实际原则,对基本统计理论,统计指标,统计方法学习,总结并运用,感受统计的魅力。
生产技术办公室
杨丽娟
2016-4-25。
数学漫谈:如何利用折线统计图说明数据变化
数学漫谈:如何利用折线统计图说明数据变化如何利用折线统计图说明数据变化数据变化在我们生活和工作中无处不在,因此对于数据的分析和处理也成为了一项非常重要的技能。
然而,对于很多人来说,利用表格和图表来展示和比较数据是一项相对晦涩的任务。
针对这个问题,本文将介绍折线统计图的基本概念和应用方法,帮助读者更好地理解和分析数据变化。
一、什么是折线统计图?折线统计图是一种常用的图表类型,它通过折线的形态来呈现数据在时间轴上的变化趋势。
一般来说,横轴表示时间或其他连续性变量,纵轴则表示数据的取值。
这种图表不仅能够展示数据变化的趋势,还能够对不同数据之间的比较和分析提供便利。
二、折线统计图的基本构成折线统计图通常由以下几个部分组成:1.图表标题:用于描述统计图展示的数据和变化趋势。
2.直角坐标系:通常由横轴和纵轴组成,用于展示数据的取值和时间等变量。
3.折线:通过直线的连接来表示数据点之间的取值变化。
4.坐标轴标签:用于标识坐标轴上的数值单位、刻度等信息。
5.数据标签:用于在折线上标注具体数据值,以便读者更加清晰地了解数据变化趋势。
三、折线统计图的应用场景折线统计图虽然简单,但它也是一个功能强大的工具,可以被广泛用于不同的应用场景。
1.展示数据趋势折线统计图是展示数据趋势的最佳选择。
通过对比不同数据,我们可以很容易地看出趋势和变化的规律,有助于我们做出更加精确的预测和决策。
2.比较不同数据使用折线统计图可以很容易地比较不同数据之间的差异和变化幅度。
通常情况下,我们会将数据绘制在同一个图表上,并在图例中标明对应数据名称,这样可以让读者更清晰地了解不同数据之间的关系和趋势。
3.突出异常数据有时候数据中可能会出现异常点,如数据的极端值、数据突变或趋势的突然改变等。
此时,使用折线统计图就可以更好地突出并分析这些异常点,从而做出更好的决策。
四、如何创建折线统计图?创建一个简单的折线统计图并不难,以下是一些常用的步骤:1.收集数据:我们需要准备好需要展示的数据,这些数据可以来自不同的来源,如调查结果、销售数据或其他的统计数据。
漫谈统计信息的特点及功能
1 间接 性 : 般 社 会 经 济 信 息 是 就 近 发 的是“ 、 一 现在事实” 本身 , 以在 时间上要求及 所
生的事实直接、 客观的叙述 式描写, 在表现上 时, 这样才 能保证信息 的新鲜 性。而统计信 要求真实地再现 事实 的发 生和发展 过程, 而 息反 映的, 不是事实本身 , 而是“ 过去事实” 的
的决策 和广 大群 众 的社会 经 济 生活 中产 生 了 信息叙事说理的基本表现手段。 积 极 的作用 , 日益 成 为 统 计 工 作 发 挥 社 会 效 3 背景 性 : 会经 济信 息 是 反 映“ 在 事 、 社 现 益 的重 要桥 梁 ,日前 已经 成 为统 计 工 作 的一 实” 背景材料在整个信息材料 中处于次要 的, 项 重要 内容 。统 计 信 息 有 哪 些 特 点和 功 能 , 地位 , 对现在实事起补充、 注释和说 明作 用。
《 海 统计 》 O O年 第 4期 青 2l
漫 谈 统 计 信 息 的
肆— { I 肆— { I 耳—安 { I 耳—受 异—
. ; 特
' i I | } i
点
及
- }
功
i | i
能
侯青 云
统计 信 息 , 适 应 经 济 社 会 发 展 和 统 计 果 是 对事 实本 质 的概 括 , 事 实 的 间接 性反 是 是 由“ 闭式” 向“ 放 式 ” 封 走 开 改革 的需要 , 统 映。 在
统 计信 息 主 要是 运 用 统 计 数 字来 反 映 事 实 。 本质意义, 即通过分析 内在原 因, 来揭示发展
《统计教育》2010年总目录
美 国劳工统计局简介
实证 高考填报志愿 的综合决策模 型
余芳东 2 1. 00 3
孙土金 2 1. 00 3 唐晓静 2 1. 00 3
美 国联邦政府统计体制及其启示
余芳东 2 1. 0 01
艾 小 青 2 1. 0 01
安徽 省金融 发展与经济增长 : 基于 V R和 V C模型 的 A E
统计教育
21 0 0卑
《 统计教 育}0 总 目录 2 1 0年
纵论宏观经济形势 姚景源 2 1. 0 01 了解人 口普查 数海之旅——姜 国钧访谈 录 章国荣 2 1. 00 2 韩 际平 2 1- 0 03 岁月如歌—— 山东省统计局局长杜 昌祚访谈 录
韩 际 平 2 1. 0 01
郭 剑 J 0 0 I2 1. I 4
透视美 国普查局
余芳东 2 1. 002
大学生校园创业 行为的影 响因素研究
兰 欣 杨 安 2 1. 00 4
财政支农 、 农村居民消费与农 民增收的动态分析 张 峁 王 青 2 1. 002
全要素生产率 的 L v sh — e n半参方法的测算和 比 ei on P t n i f
抽样推 断中比例估计 的几种方法及 比较
独立逆抽样下优势 比的置信区间
罗玉波 2 1. 0 01
我 国经济增长影响 因素和当前形势分析 李宝仁 张 院 2 1- 003
农民收入与金融财政支持的实证研究: 例证 陕西
星 焱 2 1. 0 01
中国的工业集聚与劳动力流动分析
史一哲 2 1. 003
杨烨军
宋马林
王舒鸿 2 1. 00 7
北京地 区汽车保险新系统的实证分 析 潘Βιβλιοθήκη 军 吴 黎军 2 1 . 0 07
漫谈现代统计“四大天王”
漫谈现代统计“四⼤天王”摘要1卡尔.⽪尔逊篇1. 世界的本质是随机的吗?谈统计,我们却不得不从这样⼀个哲学问题开始,因为它涉及整个学科存在的合理性。
如果我们拿这个问题去问任何⼀个统计学家,他/她⼀定会回答:是!——否则,还要统计⼲什么呢?但要⼤众⽂化接受这样的观念却并不容易。
⾃19世纪以来,以⽜顿⼒学为代表的科学,应⽤于现实世界,在各⾏各业取得了巨⼤的成就,也让⼀种“决定论”的世界观深⼊⼈⼼——世界的本质就像⼀个⼤时钟运⾏着,于是,我们只需要少量的数学公式,不仅可以描述现实,还能预测未来。
但有⼀个⼈,推翻了这种“常识”,带来了⼀场统计⾰命,他就是卡尔.⽪尔逊。
学⽣时代的⽪尔逊,就像你⾝边最为艳羡的同学:1875年剑桥⼤学⼊学考试,以第⼆名的成绩荣获奖学⾦⼊读国王学院;四年之后以数学⼀等荣誉中第三名的优异成绩毕业。
考虑到该学霸同学喜好宗教和政治的⽂艺青年特质,⼤学毕业后选择到德国攻读政治学的博⼠,也并不让⼈意外。
在那⾥,他⼜深深地迷上了卡尔.马克思,为表达敬意,23岁的他将⾃⼰的名字都由“Carl”变成了马克思的“Karl”,且他这⼀⽣在政治观点上,始终保持着对受压迫者的同情——这对于出⾝富裕阶层的青年才俊尤其难得,尤其是对⼥性的提携和尊重也让卡尔不同与其他思想⼤家。
40岁之前,⽪尔逊已经是皇家科学院院⼠,两获达尔⽂奖章。
⽪尔逊的名作《科学的语法》多次再版,到今天仍然是“介绍科学和数学最伟⼤的书籍之⼀”⼤概是声望与权⼒膨胀,也⽆限放⼤了他的控制欲,在接下来的20年,⽪尔逊把他的实验室以及所有同事都变成了他个⼈意志的延伸,把《⽣物统计》变成了他⼀个⼈的杂志——只发表他认可的⽂章,得不到认可的观点在整个统计界都不能发表;除此,还充斥着⼤量他⾃⼰写的各式评论——⽐⽅,他依旧兴趣⼴泛,所以《⽣物统计》也发表过他的考古发现,当然还有更多的是他对⾃⼰看不惯的学术观点毫不客⽓的批评。
1910年如⽇中天的统计⼀哥:⽪尔逊对他在后世声名影响最⼤的,莫过于他与⽇后另⼀⼤“统计天王”费希尔旷⽇持久且刻薄激烈的学术争⽃。
统计学教学漫谈
为了对总体 的数字及分布特征有所了解 ( 例如 总体均值 ) , 在不方便普查 的情况下 , 先从总体中随 机抽取一定数量 的个体组成一个样本 , 通过对样本 中的个体进行普查得到样本统计量 的具体取值. 以 观察到 的样本统计量的取值为基础 , 通过一定程序 来对总体作出参数或分布的推断. 统计推断的理论 基础是大数定理和 中心极限定理 . 因此 , 在讲参数 估计和假设检验之前应对这两组定理做全面介绍 , 介 绍 的 目的主 要是 为 了让 学生 了解这 两 组 定 理 的
Vo 1 . 2 9N o . 3
Ma l " . 2 01 3
统计 学教学漫谈
赵 现 军
( 安 徽科 技 学 院 财 经 学院 ,安徽 凤阳 2 3 3 1 0 0 )
摘
要: 在大学经管类课程 中统计 学是一 门重要的基础课 , 也是考试通过率相对较低的一 门 课程. 为了
教 好 这 门课 程 , 笔 者根 据 自己的教 学经验 提 出 了以下 建议 : 一、 有 必要在 第一 节课 中把 学 习统计 学的意 义 讲清楚; 二、 对 统计 学 的讲授 应视 内容采 取 不 同策略 ; 三、 要教 会 学生正 确 解读推 断统计 的 结论 ; 四、 要 培 养 学生理 解基 础 上记 忆公 式 的 习惯 ; 五、 应在 课程 体 系框 架 内有 选择 地讲 授 统计知 识 .
程的教学工作 , 深感把统计学教好不是一件容易的 事. 以下就统计学的教学工作谈些个人看法及体会.
1 有 必 要在 第 一节课 中把 学 习统计 学 的意 义讲 清
楚
任何一门学科都有其独特的作用 , 或提升人的 内在修养 , 或增强人 的谋生能力 , 而且影响通常是 潜移 默 化 的彳 艮 多学 生 会在 统 计 学第 一节 课 上 发 出 这样 的疑问 : 学 习统计 学有 何 意义 呢 ?心理 学 常识 告诉 我们 , 兴趣是最好 的老师 , 要想让学生对统计 学产 生 兴趣 , 并进 而 主动学 习统 计 学 , 作为 教 师 , 我 们有责任把学 习统计学 的意义讲清楚 , 而且能让学 生真切感受 到 , 最好能举些生 活中的例子. 在这一 点上许多统计学教材在绪论 中讲 的很不充分 , 通常 宏 观方面讲 的较多 , 而微观层 面讲 的较少. 笔者认 为学 习统计学除了教材 中通常讲到 的那 些作用 以 外 至 少在 以下 方 面对个 人决 策有 帮 助 : 对现 象 总体 进 行 恰 当概况 ; 对 现象 总体进 行 科 学分 组及 直 观展 示 ;根据样本信息推断总体数字特征及分布特征 ; 根据统计数据改进工作学习方法 , 提高效率 ; 为后 续计量经济学的学习打基础等. 意义讲得越全面 , 学生学 习的兴趣 就会越高涨 , 当然 , 也不能牵强附 会地过度拔高 , 那样只会适得其反 , 令人生厌.
大数位数据化简的几种方法漫谈
观点>>OPINION59在统计工作过程中,时常会碰到一些数位比较大的数据。
这种数位冗长的“大”数据,不但会影响数据处理工作效率,增加统计工作难度,而且对于统计结果的展现与表达,统计结论的识记等,都会造成一定的障碍。
因此,当统计数据较大时,就可能需要用到一些化简方法把“大”数据转化为“小”数据。
以下是笔者归纳整理的几种大数位数据化简方法。
一、“掐头”法如果把数据的高位数值作为头,低位数值作为尾,“掐头”法就是在处理一组统计数据时,把其中具有相同数位的高位数值去掉,只保留每一个数据中有差异的低位数值,以达到化简数据的目的。
例如,在输入一组从2000-2022的顺序数据时,因为前两位数相同,可以只录入后两位数即00-22,再例如,当处理一组增长速度的数据时,因为每一个数的分母都是百分号,就可只截取分子进行处理,有时甚至可以只截取有差异的分子进行数据表达,如增长1个点、2个点等。
“掐头”化简法主要适用于那些体量较大,但变化较小的数据。
在统计数据的可视化中,有一种能够保留数据原始信息的统计图叫茎叶图,茎叶图的绘制就是把高位数值提取出来作为“茎”,只保留低位数值作为“叶”绘制出来的图形,是数据“掐头”化简的典型。
在统计实践中,常常有这样的一类数据,这类数据的某些数位在一定时间和空间内会发生变化,而另一些数位则不会发生变化,我们可以把前者称为“活数据”,后者称为“死数据”。
一般来讲,“活数据”是低位数值,“死数据”是高位数值。
“掐头”化简的实质就是删除不变的“死数据”,仅保留有差异或有变化的“活数据”。
“掐头”化简法不但可以减少“大”数据的位数,提高数据处理的效率,而且还可以保留数据的计量单位和计量精度等,是一种比较常见的数据化简方式。
需要说明的是,“死数据”与“活数据”是相对的,随着统计条件的改变,“一些死数据”会转化为“活数据”。
因此,使用“掐头”法对数据进行化简,要注意统计时间或空间节点的变化,合理删除数据的位数,以免产生类似计算机“千年虫”一样的统计“千年虫”问题,给统计工作造成困扰。
探索统计研究与统计发展
探索统计研究与统计发展统计学是一门研究数据收集、分析和解释的学科,它广泛应用于社会科学、自然科学、医学、商业和政治等领域。
统计学通过使用数学和计算机科学的技术,来帮助人们更好地理解数据,更好地做出决策。
随着科技的发展和数据量的增加,统计学也在不断地发展和创新。
本文将探索一下统计研究与统计发展的历史与现状。
一、统计研究的起源统计研究最早可以追溯到17世纪的英格兰,当时政府为了了解国家的收入和人口统计,开始进行人口普查和税收统计等工作。
这些工作需要有专门的人员进行统计和分析。
因此,在统计学的早期阶段,人们主要关注数据的收集和简单的描述统计分析。
到了19世纪,随着社会的发展和工业产生的大量数据,统计学也开始逐渐发展为一门独立的学科,并且开始涉及到更加复杂的数据分析技术。
二、统计学的发展历程在20世纪,利用计算机进行数据分析和处理成为了统计学的一个重要发展方向。
同时,也出现了许多新的数据分析方法和技术。
例如多元统计分析、非参数统计、计量经济学、贝叶斯统计、机器学习等等。
这些新的数据分析方法和技术,为统计学提供了更加灵活和高效的解决方案。
它们使得人们可以更好地挖掘数据内部的关系和趋势,并且从中做出更加准确的决策。
三、统计发展的现状目前,统计学的应用范围非常广泛,从商业和工业到医学和社会科学,各个领域都可以利用统计学进行数据分析和决策。
同时,也出现了很多新的数据分析工具和技术,例如深度学习、数据挖掘等等。
这些新技术为数据分析提供了更加高效和准确的解决方案,并且也为统计学的发展和创新提供了动力和激励。
随着更多的数据被收集和存储,同时也需要更加先进的数据分析工具和技术来处理这些数据。
四、总结综上所述,统计学是一门非常重要的学科,它在人类社会的发展中起到了重要作用。
随着科技的发展和数据量的增加,统计学也面临着新的挑战和机遇。
因此,我们需要不断地创新和实验,来寻找更加高效和优化的数据分析和决策方案。
这样,才能更好地利用数据,为社会的发展和进步做出更多的贡献。
统计漫谈
统计学中的几个主要术语
6. 7. 样本(Sample)
– 总体的一部分
统计量(Statistic)
– 样本的概括性测度值即样本指标
几种常用的统计软件 (Software) • 典型的统计软件
– – – – – – – SAS SPSS MINITAB STATISTICA Excel S-plus R
10.1960年,药物肽胺哌啶酮(Thalidomide,又 称反应停)曾引起一次胎儿畸形的爆发,美 国FDA发现1267名医生开方子给19822名患者 (含3760名育龄妇女),服用了250余万药片。 这一事实提出一个问题:医学界的“专业判 断”是否仍然可信?公众的呼声使得国会通 过、总统批准了所谓的1962药物修正案。这 项法律把FDA转变成医疗领域里面药物有效 性的最终仲裁者。 FDA 为临床试验规定了一 整套制度,使之成为确定药物疗效的标准方 法。
总体
对总体特征
作出推断
样 本
描述统计与推断统计的 关系
概率论 (包括分布理论、大数定律 和中心极限定理等)
样本数据
推断统计 描述统计 (利用样本信息和概率 论对总体的数量特征进 行估计和检验等)
反映客观 现象的数 据
(统计数据的搜集、整 总体数据 理、显示和分析等)
总体内在的 数量规律性
统计学探索现象数量规律性的过程
统计学中的几个主要术语
1. 总体(Population)和总体单位(Unit) – 所关心的所有元素的集合 – 构成总体的每个元素 2. 参数(Parameter),也称指标(Index) – 总体的数字特征 3. 标志(Attribute)
– 表明总体单体特征的概念
4.说明现象的某种属性或标志称为变量。 5.对变量进行测量或观测的值称为观测值或变量值。
【转载】统计学历史人物漫谈
【编者注】T检验、卡方分析、回归这些统计名次想必数据分析人员都十分的清楚,但是这些名称背后又隐藏着什么样的故事呢?中国统计网特推荐统计学历史人物漫谈这一系列文章,帮助大家更好的了解和理解数据分析基础知识。
一、戈赛特(Gosset)——t检验的创始人戈赛特据说同时拥有数学和化学两个学位(这在当时似乎并不是很少见,不少学者都同时拥有两个甚至以上的学位)。
与许多学者一样,他当时并没有直接从事统计学的研究,毕竟,在100多年前,统计学甚至还算不上一门学科。
他当时从事的是啤酒酿造行业,然后就在这一似乎与统计无关的行业里,他做了一项研究,想弄清楚发酵时需要加多少酵母最合适。
当时戈赛特做出了结果并准备将其发表,可惜他所在的是酿酒行业,贸然发表的话会引起泄露机密之嫌。
但戈赛特又确实想发表这一文章,因此采取了折中的办法:匿名发表。
他采用了一个笔名,也就是现在我们仍可以在统计学课本上见到的“student”。
戈赛特最重要的一个贡献就是提出了小样本的检验思想。
现在我们看起来似乎并无任何出奇。
但在当时,统计学几乎就是大样本的科学,一提起统计学,就想到大样本。
当时的K皮尔逊的几乎所有工作都是基于大样本的假设。
但戈赛特根据自己的经验认为,有的情况下,大样本对于研究者来讲太过于奢侈了,必须专注于小样本。
但是一旦用小样本分析,无可避免地会牵扯到误差的问题。
在大样本情况下,你可以假定没有误差或者误差很小可以忽略不计,而小样本必须考虑到这一问题。
那么小样本情况下,误差有多大呢?这就是戈赛特所关注的。
戈赛特通过自己的不断演算,最终于1908年发表了一篇极为重要的文章《the probable error of the mean》,提出了t分布,这也是至今我们仍在广泛应用的t检验(也叫student t检验)的基础。
考虑一下当时的条件,可想而知戈赛特做出了多少次的计算才得出这一结论。
他需要一次一次地计算均数、标准误,以确定相关数据的概率分布,现在条件下通过计算机模拟可能很快出来结果,但当时显然是很复杂的。
漫谈概率论与数理统计中的哲学思想
从哲学的角度探讨概率论与数理统计中的辩证思维,教师若能以哲学思想来指导教学,在教学中自觉地渗透辩证的思维方法,不仅能提高学生的学习数学的效率,也能取得更好的教学效果.概率论与数理统计作为理工科专业重要的基础课之一,一直以来受到广大师生的重视,有关这方面的教研论文很多,但从哲学角度来探讨这方面的论文却较少.本文主要从以下几个方面谈谈概率论与数理统计中蕴含的哲学思想:1对立统一规律马克思主义哲学告诉我们,对立统一规律是辩证法的实质与核心.概率论是对随机现象统计规律演绎的研究,随机现象是偶然的,但又有一定的规律性,偶然中蕴含着必然.必然性是客观事物在发展过程中合乎规律的、确定不移的趋势;而偶然性则是事物发展过程中不确定的、并非必定如此的趋势.必然性和偶然性虽是事物联系和发展的两种对立趋势,但两者又是相互统一的.频率与概率是两个对立的概念,概率是从频率中抽象出来的,是频率的稳定值;而频率则是概率的具体体现,是概率的近似值.概率是抽象的、难测的、人们生疏的;频率是具体的、易测的、人们熟悉的.因此利用频率来认识概率是科学的,也是十分必要的.频率是随着试验的发生而发生的,其值是不断变化的(变数),而概率是先于试验而客观存在的,是随机事件发生可能性大小的度量(常数).概率的统计定义是利用频率来刻画概率的,频率是概率收敛于概率,这反映了常量与变量的辩证统一.二项分布属于离散型,正态分布属于连续型,拉普拉斯中心极限定理表述了二项分布的极限分布是正态分布,这充分体现了离散与连续的辩证统一关系.统计推断的思想方法同样有着深刻的哲理,从局部推断整体,可以说是数理统计的一个特点.它是对有关信息缺乏完全掌握的情况下进行的归纳推理方法,是一种定量的推理技术,从局部观察要对总体下结论,这种推理的可行性与可靠性,尚有赖于局部样本个性(特殊性)和总体共性(普遍性)之间的一种内在的对立统一的辩证关系.如果抽样和推理完全建立在可靠的科学基础之上(即按随机性原则抽样,加上科学的推理方法),则总体的推断是可能的,而且结论是可靠的.统计推断的思想方法反映了“每一事物内部不但包括了矛盾的特殊性,而且包含矛盾的普遍性,普遍性存在于特殊性之中”.统计推断的结论,往往是在某一“可靠性水平”下给出的,这种矛盾的特殊性与普遍性的辩证统一,贯穿于数理统计的始终.2质量互变规律量变和质变,是事物发展变化的两种基本形式,量变是质变的必要准备,质变是量变的必然结果,当量变达到一定程度,突破事物的度,就产生质变.“实际推断原理”指出“概率很小的事件在一次试验中实际上几乎不发生”,小概率事件在一、两次试验中一般不会发生,但在大量重复试验时这个事件几乎是必然发生.事实上,设事件A在一次试验中发生概率P=(A)=p(0<p<1),则P(A)=1-p.在n次重复独立试验中A都不发生的概率为(1-p)n,于是在n次重复独立试验中A至少发生一次的概率为1-(1-p)n,当n→∞时,由0<1-p<1知1-(1-p)n→1,这就表明事件A迟早会发生.这就是为什么自然界发生地震、海啸、泥石流、交通事故等等都是必然发生的、不可避免的原因.3无限和有限无限与有限是相互依赖、相互渗透并在一定条件下可以相互转化.在概率论中有时我们需要把无限转化为有限的情况,有时又要把有限转化或推广到无限的情形.例1任取一个正整数,求该数的平方的个位数是1的概率.解如果我们把正整数的全体取为样本空间,这样的空间是无限的,同时也不好谈等可能.于是要考虑在保证等可能的情况下,将无限转化为有限,一个正整数的平方的个位数只取决于该整数的个位数,它们可以是0,1,…,9这十个数字中的任一个,即取样本空间.Ω={0,1,…,9}.而欲求概率对应的事件A={1,9},所以.P(A)=2=1.例2甲、乙、丙、丁4人相互传球,第一次由甲将球传出,每次传球时,传球者将球等可能地传给另外3人中的任何1人,球经过n次传球后,球在甲手中的概率记为pn(n=0,漫谈概率论与数理统计中的哲学思想贾朝勇(蚌埠学院数理系,安徽蚌埠233000)摘要:概率论与数理统计中蕴含着丰富的哲学思想,如对立统一规律、质量互变规律等等.教师若在讲授概率论与数理统计过程中加强哲学思想的渗透,将会取得更好的教学效果.关键词:概率论;对立统一规律;质量互变规律;实践中图分类号:G642文献标识码:A文章编号:1673-260X (2011)09-0001-02Vol.27No.9Sep.2011第27卷第9期2011年9月赤峰学院学报(自然科学版)Journal of Chifeng University (Natural Science Edition )基金项目:安徽省高等学校优秀青年人才科研资助项目(2010SQR L115)1--1,…,),求Pn+1和pn的关系式,并求出pn的表达式及limn→∞pn.解记An为事件“球经过n次传递后,球在甲手中”(n=1,2,…),则有P(A1)=0,即p1=0.由于An+1=AnAn+1+AnAn+1,因而P(An+1)=P(AnAn+1)+P(AnAn+1)=P(AnAn+1)=1(1-pn)所以pn+1和pn的关系式为pn+1=1(1-pn)(n=1,2,…)(1)将(1)式变形为pn+1-1=-1(pn-1)所以pn-1是公比为-1,首项为p1-1=-1的等比数列.故有pn-14=-14(-13)n-1即pn=14[1-(-13)n-1](2)由(2)可得limn→∞pn=14.4联系的观点在概率论教学中,教师若能运用辩证法中的联系观点来分析概率论知识,不仅能使抽象的概率论内容具体化、形象化,而且增强学生学习的信心,提高学生学习数学的能力.概率论中随机事件间的关系及运算有事件的并、交、差、逆等等,如撇开其符号所表示的内容,则与集合论知识中的并集、交集、差集、补集等具有相同的表示形式,所以教师教学上联系集合论知识,学生会在原有知识的基础上,能够很快顺利的理解和掌握随机事件之间的关系及运算.连续型随机变量分布函数和密度函数把积分和求导联系起来了,它们有如下关系:F(x)=x-∞乙f(t)dt;若f(x)在x处连续,则F'(x)=f(x).根据变量的取值情况分为离散型随机变量和非离散型随机变量.一切可能的取值能够按一定次序一一列举,这样的随机变量叫做离散型随机变量;如果可能的取值充满了一个区间,无法按次序一一列举,这种随机变量就叫做非离散型随机变量.非离散型随机变量中主要研究的是连续型随机变量,离散型随机变量和连续型随机变量是概率论所研究的随机变量中的两种最主要类型,离散型比较简单,能较好地阐述概率思想、说明方法;连续型相对比较复杂,在学习过程中要善于将离散与连续型联系对比,融会贯通.这样,就可以将离散型的概念和结果“移植”到连续型情形.概率分布在离散中扮演的角色与密度函数在连续中扮演的角色相同,分布函数和特征函数是离散与连续对立统一的数学表现形式.在研究连续型随机变量的概率分布时,可以用离散化方法,反过来离散型随机变量的分布在一定的条件下又以连续型分布为极限.例如,指数分布具有其特有的性质———“无记忆性”,即设X ̄E(λ),则对任意非负实数x,y,有P(X>x+y|X>x)=P(X>y).既然连续型随机变量中指数分布具有“无记忆性”,那么离散型随机变量有没有类似的分布呢?其实几何分布X ̄G(p),P(X=k)=pqk-1(0<p<1,q=1-p),则对任意非负整数m,n,有P(X>m+n|X>m)=P(X>n).即几何分布也具有“无记忆性”.有趣的是指数分布是连续型随机变量中唯一具有“无记忆性”的分布,而几何分布也是离散型随机变量中唯一具有“无记忆性”的分布.更使人惊奇的是,指数分布与几何分布除具有某些相似的性质外,二者之间还存在某种内在联系.事实上,设X ̄E(λ),则,P(k-1<X≤k)kk-1乙λe-λxdx=e-λ(k-1)(1-e-λ)=pqk-1(k=1,2,…)其中p=1-e-λ,q=e-λ.记Y为离散型,{Y=k}={k-1<X≤k},则P(Y=k)=pqk-1亦即y ̄G(p).上述过程可理解为将参数为λ的指数分布E(λ)离散化为参数为p=1-e-λ的几何分布G(P).两个事件独立和二维随机变量独立类似,事实上,对事件A、B,若P(AB)=P(A)P(B)成立,则称事件A、B相互独立;相应的对二维随机变量(X,Y),若F(x,y)=FX(x)FY(y),坌x,y∈R成立,称随机变量X与Y相互独立,或对于二维连续型随机变量(X,Y)独立也可以用密度函数f(x,y)=fX(x)fY(y),坌x,y∈R,成立来定义,对于二维离散型随机变量独立也可以用分布律Pij=Pi·P·j,坌i,j∈N成立来定义.同样,已知事件的条件概率的定义和二维随机变量条件密度函数的定义也是相似.5实践的观点实践是认识的起点,也是认识的归宿.概率论源于实践,最终还要应用于实践,接受实践的检验.例如,在一次随机试验的结果完全是受偶然性支配的,没有什么规律性可言,但是当试验大数次地进行时,随机试验的结果就会呈现出某种规律性,这就是所谓的“统计规律性”.这种统计规律性几乎全是人们在实践中总结、归纳、提炼出来的,这不仅由实践升华出了“概率”的统计定义,而且还导出了一个著名的贝努里大数定律一一频率“依概率收敛”于概率.这充分反应了数学家们尊重实践、尊重客观统计规律的科学精神.极大似然估计法也充分体现了数理统计源于实践.因为在随机试验的实际观测中,既然子样(x1,x2,…,xn)出现了,这就表明试验条件对这个子样的出现“最为有利”,因而在所有的子样中,随机子样出现在这个子样(x1,x2,…,xn)领域内的可能性(即概率)就应该最大,相应的似然函数值就应该达到最大.这正是实践观点的具体体现,这也是与人们长期实践的经验相吻合的.“实际推断原理”是一个用实践证明的真理,概率很小的事件在一次试验中“实际上是不可能发生的”.这个原理的正确性不是用纯粹数学的逻辑推理来证明的,而是用实践经验来证明的,这不仅没有什么问题,而且恰好是“实践是检验真理的唯一标准”这一基本哲学观点的具体体现.在进行概率论与数理统计的教和学的过程中,有必要研究它与哲学的内在联系,从哲学的视野来看待这门课程,这不仅是学习概率论与数理统计的需要,而且也是教学与研究的需要.———————————————————参考文献:〔1〕胡满峰,魏国强.化解概率论习题难点的若干方法[J].高等数学研究,2008,11(1):109-112.〔2〕孙世良.概率论中的若干典型问题[J].大学数学,2008,24(1):155-161.〔3〕王爱茹,刘福会.漫谈数学中的哲学思想[J].高等农业教育,2005(6):60-62.〔4〕张栋栋,张德然.概率论思维及其智力品质的培养[J].大学数学,2005,21(5):103-108.〔5〕张焱.偶然与必然的辨证法--概率论教学札记之二[J].四川师范学院学报(高教研究专号),1995(5):89-90.〔6〕赵晓青,戎晓剑,董文雷.概率论中三种重要分布的归一性研究[J].石家庄铁路职业技术学院学报,2008,7(3):72-75.2--。
有趣的统计学
有趣的统计学统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。
尽管统计学有时被认为是一门枯燥的学科,但实际上,它也具有一些有趣的方面。
本文将介绍一些有趣的统计学概念和应用,带您领略统计学的魅力。
1. 平均数的谬误当人们谈论平均数时,往往会忽略其中的细节。
平均数是一组数据的总和除以数据的个数,但有时候这个值可能会产生误导。
举个例子,如果一个房间里有99个普通人和1个亿万富翁,那么平均财富将会非常高,但大多数人的财富并没有得到改善。
这种情况下,中位数可能更能反映数据的真实情况,中位数是将数据按大小排序后的中间值。
2. 样本大小的影响在统计学中,样本大小对结果的影响是非常重要的。
较小的样本容易产生误导性的结果,因为它们不能很好地反映整个总体的特征。
例如,如果一项调查只采样了10个人,那么得出的结论可能并不具有代表性。
相反,较大的样本容易更准确地反映总体情况。
3. 回归分析的应用回归分析是一种用于研究变量之间关系的统计方法。
它可以用来预测未来的趋势或解释变量之间的因果关系。
回归分析在各个领域都有广泛的应用,例如经济学、医学和市场营销等。
通过回归分析,我们可以发现一些有趣的关联,例如身高与体重之间的关系或者学历与收入之间的关系。
4. 误差与可信度统计学中有一个重要的概念是误差和可信度。
任何测量都存在误差,而统计学可以帮助我们了解这些误差的范围和影响。
例如,在民意调查中,我们经常看到一个百分比加减几个百分点的误差范围。
这意味着实际结果可能在这个范围内,而不是精确的数值。
了解误差和可信度可以帮助我们更好地理解数据和结论。
5. 随机性与概率统计学中随机性和概率的概念也是非常有趣的。
随机性是指在一系列事件中无法预测的结果,而概率则是描述这种不确定性的数学工具。
例如,掷硬币时正反面的结果是随机的,但在大量实验中,正反面的出现次数将接近50%。
理解随机性和概率有助于我们更好地理解事件的发生和结果的可能性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
你相信统计结果吗? 你相信统计结果吗?
数据可以有误或作假 统计方法(有意或无意)使 统计方法(有意或无意) 用不当可以误导。 用不当可以误导。有低级误 导和高级误导。 导和高级误导。 常识判断和直觉是重要的
谁会在 谁会在1936选举中获胜 ?Alf London还 选举中获胜 还 罗斯福)? 是 F.D.R.(罗斯福 罗斯福 Literary Digest (文摘 送出一千万份问 文摘)送出一千万份问 文摘 卷(返回二百四十万份 后,预测 返回二百四十万份)后 预测London 返回二百四十万份 预测 会赢. 会赢. 而Gallop(盖洛普 只问了 盖洛普)只问了 盖洛普 只问了5000人说 人说 Roosevelt (罗斯福 会赢 罗斯福)会赢 罗斯福 会赢. 最后罗斯福和盖洛普都赢了 文摘倒闭 最后罗斯福和盖洛普都赢了.文摘 文摘倒闭 了.
大灰狼吃羊犯错误了吗? 大灰狼吃羊犯错误了吗? 人类社会之外的自然界有是非吗? 人类社会之外的自然界有是非吗? 人类社会的“是非”是一成不变的吗? 人类社会的“是非”是一成不变的吗?
统计只说可能性是实际世 统计只说可能性是实际世 界的真实体现。 界的真实体现。真实世界 充满了不确定性。 充满了不确定性。 从某种意义来说,生活中 从某种意义来说, 从某种意义来说 唯一确定的事情就是其不 确定性。 确定性。
你想过下面的问题吗? 你想过下面的问题吗?
如何通过大众调查来得到性别 、 年龄 、 如何通过大众调查来得到性别、 年龄、 职业、 收入等各种因素与公众对某项事 职业 、 比如商品或政策) 的态度的关系呢? 物 ( 比如商品或政策 ) 的态度的关系呢 ? 一个从来没有研究过红楼梦的统计学家 如何根据比较写作习惯得出红楼梦从哪 一段开始就不是曹雪芹的手笔了呢? 一段开始就不是曹雪芹的手笔了呢? 如何才能够客观地得到某个电视节目的 收视率, 以确定广告的价格是否合理呢? 收视率 , 以确定广告的价格是否合理呢 ?
当你买了一台电视时 , 被告知三年内可以免 当你买了一台电视时, 费保修。 你想过厂家凭什么这样说吗? 费保修 。 你想过厂家凭什么这样说吗 ? 说多 厂家会损失; 说少了, 会失去竞争, 了 , 厂家会损失 ; 说少了 , 会失去竞争 , 也 是损失。到底这个保修期是怎样决定的呢? 是损失。到底这个保修期是怎样决定的呢? 在同一年级中 , 同样统计学的课程可能由一 在同一年级中, 些不同教师讲授。 教师讲课方式当然不一样, 些不同教师讲授 。 教师讲课方式当然不一样 , 考试题目也不一定相同。 考试题目也不一定相同 。 那么如何比较不同 班级的统计学成绩呢? 班级的统计学成绩呢? 大学排名是一个非常敏感的问题 。 不同的机 大学排名是一个非常敏感的问题。 构得出不同的结果; 各自都说自己是客观、 构得出不同的结果 ; 各自都说自己是客观 、 公正和有道理的。 公正和有道理的 。 到底如何理解这些不同的 结果呢? 结果呢?
气象学 军事科学 核材料安全管理 眼科学 制药学 物理学 政治学 心理学 心理物理学 质量控制 宗教研究 社会学 调查抽样 分类学 气象改善 搏采,等等... 搏采,等等
统计历史人物
Edmond Halley (哈雷 (1656-1742) 哈雷) 哈雷 Leonhard Euler (欧拉 (1707-1783) 欧拉) 欧拉 Thomas Robert Malthus (马尔萨斯 (1766-1834) 马尔萨斯) 马尔萨斯 Ronald Aylmer Fisher (费歇 (1890-1962), 费歇) 费歇 Moivre (棣美佛 (1667-1754) 棣美佛) 棣美佛 Pierre Simon Laplace (拉普拉斯 (1749-1827) 拉普拉斯) 拉普拉斯 Jacob Bernoulli (伯努利 伯努利)(1654-1705) 伯努利 Thomas Bayes (贝叶斯 (1702-1761), 贝叶斯) 贝叶斯 Adrien Marie Legendre (勒让德 (1752-1833) 勒让德) 勒让德 Friedrich Gauss (高斯 (1777-1855) 高斯) 高斯 Johann Gregor Mendel (孟德尔 (1822-1884) 孟德尔) 孟德尔 Karl Pearson (皮尔森 (1857-1936) 皮尔森) 皮尔森 William Feller (费勒 费勒)(1906-1970). 费勒 Jerzy Neyman (1894-1981) Egon Sharpe Pearson (1895-1980)
统计的内容和需要的知识
统计可能触及数学的几乎所有内容 你不一定事先知道需要什么) (你不一定事先知道需要什么) 但每一个统计问题或者分支可能只 用数学的很小一部分 用计算机做统计计算 其他(对象)领域的知识(如生物医 其他(对象)领域的知识( 经济、行为、社会、金融等等) 学、经济、行为、社会、金融等等)
统计和数学的区别
计算机的重要性
由于统计和数据打交道,没有 由于统计和数据打交道, 由于统计和数据打交道 计算机的发展统计就没有前 途. 计算机和统计的发展相辅相 计算机和统计的发展相辅相 成
数据和模型的关系
作为根据的数据 比如各地人均GDP,各 作为根据的数据(比如各地人均 比如各地人均 各 种资源,自然条件等和航空旅客人数 自然条件等和航空旅客人数) 种资源 自然条件等和航空旅客人数 基于数据建立模型 回归模型 基于数据建立模型(回归模型 回归模型) 模型用来指导未来 预测未来 某城市 模型用来指导未来, 预测未来(某城市 GDP达到某水平 是否需要建立或扩建 达到某水平,是否需要建立或扩建 达到某水平 机场等决策…) 机场等决策 模型随时要根据新的数据来改进(新的 模型随时要根据新的数据来改进 新的 飞机,新的消费理念 新的旅游景点等) 新的消费理念,新的旅游景点等 飞机 新的消费理念 新的旅游景点等 没有完美的模型 没有无误差的数据
你想过下面的问题吗? 你想过下面的问题吗?
你想过下面的问题吗? 你想过下面的问题吗?
任何公司都有一个信用问题 。 当然 , 在这 任何公司都有一个信用问题。 当然, 些公司试图得到贷款时并没有不还贷的不 良记录。 良记录 。 如何根据它们的财务和商业资料 来判断一个公司的信用等级呢? 来判断一个公司的信用等级呢? 我国东部和西部的概念是一个比较笼统的 概念。 如何能够根据需要, 概念 。 如何能够根据需要 , 选择一些指标 来把各省,或各市县甚至村进行分类呢? 来把各省,或各市县甚至村进行分类呢? 疾病传播时, 如何能够通过感染者入院前 疾病传播时 , 后的各种因素得到一个疾病传染方式的模 型呢? 型呢?
关于美国选举的两个例子(1) 关于美国选举的两个例子
谁会在 谁会在1948选举中获胜 ? Thomas 选举中获胜
关于美国选举的两个例子(2) 关于美国选举的两个例子
Dewey还是 还是Harry Truman(杜鲁门 ? 杜鲁门) 还是 杜鲁门 Crossley, Gallop(盖洛普 Roper所 盖洛普), 盖洛普 所 会赢(每个机构用了 有都预测Dewey 会赢 每个机构用了
你如何理解下面说法? 你如何理解下面说法?
“某国的综合竞争力排名第43位” 某国的综合竞争力排名第43位 某国的综合竞争力排名第43 该国家属于发展中国家” “该国家属于发展中国家” 该药品疗效99% 99%” “该药品疗效99% “该国贫富差距大” 该国贫富差距大” 该国贫富差距大 这个县收入比那个县高” “这个县收入比那个县高” 该结果统计显著” “该结果统计显著” “消费价格指数为120% 消费价格指数为120%” 120% “他的血压已经正常了” 他的血压已经正常了” 他的血压已经正常了
你如何理解下面说法? 你如何理解下面说法?
“明天降水概率为40%” 明天降水概率为40% 明天降水概率为40 我冬天去新加坡度假的概率为10 10% “我冬天去新加坡度假的概率为10%” 该节目收视率是30% 30%” “该节目收视率是30% “调查结果表明20%的观众喜欢某节目” 调查结果表明20%的观众喜欢某节目” 调查结果表明20%的观众喜欢某节目 抽样调查结果的误差为±3%” “抽样调查结果的误差为±3% “支持率的95%置信区间为(25%,30%) 支持率的95 (25%,30%)” 支持率的95%置信区间为(25%,30%) “某学校排名第一” 某学校排名第一” 某学校排名第一 某县是贫困县” “某县是贫困县”
引言 统计漫谈
吴喜之
什么是统计呢? 什么是统计呢?
统计的定义 用以收集数据、分析 用以收集数据 用以收集数据、 数据和由数据得出结 和由数据 数据和由数据得出结 论的一组概念、 论的一组概念、原则 和方法. 和方法
什么地方统计用得上呢? 什么地方统计用得上呢?
任何领域. 任何领域. 任何领域
运用统计的领域包括(1) 运用统计的领域包括
精算 农业 动物学 人类学 考古学 审计学 晶体学 人口统计学 牙医学 生态学 经济计量学 教育学 选举预测和策划 工程 流行病学 金融 水产渔业研究 遗传学 地理学 地质学 历史研究 人类遗传学 水文学 工业 法律 语言学 文学 劳动力计划 管理科学 市场营销学 医学诊断
5000个问卷 个问卷). 个问卷 最后 包括盖洛普 他们都输了 而杜鲁 最后(包括盖洛普 他们都输了, 包括盖洛普)他们都输了 门赢了. 门赢了
统计的一些做法
统计可以指导我们收集数据. 统计可以指导我们收集数据. 当拥有来自一些变量(指标)的数据或记录, 当拥有来自一些变量(指标)的数据或记录, 但缺乏模型来描述这些变量之间关系的情 况下,可用统计方法建立模型. 况下,可用统计方法建立模型. 在有了一定的模型时,统计可以确定手中数 在有了一定的模型时, 据是否令人信服地支持某种论点. 据是否令人信服地支持某种论点.模型也用 来对未来进行预测. 来对未来进行预测. 统计直观的图表展示,可以使各个领域的专 统计直观的图表展示, 家容易理解