统计学整理笔记
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节统计表与统计图
一、统计表
统计表的作用:代替冗长的文字叙述,便于计算、分析和对比。
(一)列表原则
1、重点突出,简单明了:一张表一般只包括一个中心内容
2、主谓分明,层次分明:研究对象作横坐标,研究指标作纵坐标。
(二)统计表的基本结构及要求
1.标题
2.标目:横标目(主语)纵标目(谓语)
3.线条
4.数字(宾语)
5.备注
主语和谓语连贯起来能读成一句完整而通顺的话。
二、统计表的基本结构与要求
1、标题:概括地说明表的内容,必要时注明资料的时间和地点,写在表上方。
常见的错误:过于简略,甚至不写标题;或过于繁琐;或标题不确切。
2、标目:有横标目和纵标目,分别说明表格每行和每列数据的含义。横标目在表头的左侧,代表研究的对象;纵标目位于表头的右侧,表达研究对象的指标。文字简明扼要,有单位的标目要注明单位。
常见的错误:标目过多,层次不清
3、线条:不宜过多,一般采用3条线:顶线,底线,纵标目下的横线。其余线条一般均省去。不能有竖线和斜线。
4、数字:
(1)数字一律用阿拉伯数字表示。
(2)同一指标的小数位数应一致,位次对齐。
(3)表内不宜留空格; 暂缺或未记录,用“…”表示; 无数字,用“—”表示;数字为0,填写0
(4)绝对数太小而无法计算指标,则用“…”代替。
5、备注:一般不列入表内,必要时可用“*”号标出,写在表的下面。
三、统计图及其应用
(一)统计图作用
通过点、线、面等形式表达统计资料,直观地反映事物之间的数量关系。但需注意,由于统计图对数量的表达较粗糙,不便于作深入细致的分析,一般需附相应的统计表。
(二)统计图的种类
条图,百分条图,圆图,线图,半对数线图,直方图,散点图,统计地图
(三)制图的基本要求
1.按资料的性质和分析目的,选用适合的图形
2.要有标题,扼要说明资料的内容,必要时注明时间、地点,一般写在图的下面。
3.横轴尺度从左到右,纵轴尺度从下而上,数量一律由小到大。横轴与纵轴坐标长度比例一般为5:7
4.比较不同事物,用不同线条或颜色表示,并附上图例说明。
(四)常见统计图适用范围及其绘制要点
1、条图(bar graph):
(1)适用范围:相互独立的资料(病种、职业、民族等),常用形式:单式和复式
(2)绘制要点:
A.用等宽的直条的长短反映各指标的数量大小。
B.纵轴的尺度必须从0开始。
C.各直条之间的间隙应相等,一般将比较的指标按大小顺序排列。
2、百分条图(percent bar graph)
(1)适用范围:构成比资料
(2)绘制要点:
A. 将长条全长为100%;
B. 将各百分构成比在长条上分割若干段;
C. 各段按大小顺序排列。
3、圆图(pie chart)
(1)适用范围:构成比资料
(2)绘制要点:
A.将圆面积为100%,B.将各百分构成比乘以3.6度,变为圆心角度数,
C.在圆上绘出各扇型面积D.各扇型面积按大小顺序排列。
4、普通线图(line graph)
(1)适用范围:连续性资料
(2)绘制要点:A.纵横轴均用算术尺度B.纵横轴尺度比一般为5:7 C.相邻两点用直线连接。(3)意义:反映事物的变化趋势。
5、半对数线图(semi-logarithmic line graph)
(1)意义:反映连续性资料的变化速度或指标间相差悬殊的连续性资料的变化趋势。
(2)绘制要点:
A.横轴用算术尺度,纵轴用对数尺度B.纵横轴尺度比一般5:7 C.相邻两点用直线连接。
6.直方图(histogram)
(1)适用范围:计量的频数表资料
(2)绘制要点:
A.横轴表示被观察事物,纵轴(必须从0开始)表示频数或频率,
B.用等宽的矩形面积表示各组段的频数或频率
7.散点图(scatter diagram):
(1)适用范围:双变量资料
(2)分析目的:用点的密度程度和趋势表示两变量间的相关关系
8、箱式图(box plot):
(1)适用范围:计量资料
(2)分析目的:应用百分位数对计量数据作直观比较分析
(3)图形绘制特点:箱子上端为P75,下端为P25,中间以横线表示P50,最大值和最小值分别为箱子上下两个柄。
9、统计地图(statistical map)
用不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描述研究指标的地理分布。
绘制统计图的注意事项(小结)
1.正确选择统计图类型。例如:独立资料用直条图;连续资料用线图或直方图;构成比资料用百分条图或圆图;双变量资料用散点图;地区性资料用统计地图等。
2.统计图要有合适的标题。标题写在图的下方,其要求和统计表的标题的要求一样,要能够概括图的内容。
3.直条图、线图、半对数线图和直方图的纵、横坐标上要有刻度和单位,刻度要均匀等距(半对数线图的纵坐标除外)。纵横周长度之比为5∶7较合适,比例太大或太小都是不合适的。
4.直条图与直方图纵坐标要求从0开始。如果不从0开始,容易造成错觉。
5.比较不同事物时用不同的线条和颜色来表示,并附上图例。
实习三统计图表
一、目的要求
1、熟悉统计表的结构和要求。
2、掌握条图、百分条图、圆图、线图、半对数线图、直方图、散点图等各种统计图绘制方法及其适用范围。
第四章 总体均数估计和假设检验
重点掌握
1、抽样误差、标准误、可信区间、假设检验、检验效能(把握度)、单侧检验、双侧检验、Ⅰ型错误与Ⅱ型错误的概念。
2、标准差与标准误的区别和联系、t 分布的特征、t 分布和u 分布的区别和联系。
3、标准误、可信区间的计算方法和应用。
4、假设检验的基本步骤, t 检验和 u 检验的应用及其条件。
5、应用假设检验注意事项。 资料的统计分析方法
统计描述(statistical descreptive):
频数表、直方图、平均数指标、离散度指标。说明数据分布特征和分布类型。 统计推断(statistical inference):
用样本信息来推断总体的特征(以小窥大)。 (1)参数估计(总体均数估计,总体率估计) (2)假设检验 均数的抽样误差
在抽样研究中,由于总体中存在个体变异,而样本仅是总体的一部分,所以由抽样得到的样本均数与总体均数之间存在差异,这种差异称为抽样误差。
抽样研究中,抽样误差是不可避免的,但其大小可以控制和估计的。 二、中心极限定理
1、在正态总体中,随机抽取例数为n 的样本,样本均数 服从正态分布;
2、在偏态总体中随机抽样,当n 足够大时(n≥30),样本均数 也近似正态分布;
3、从均数为μ,标准差为σ的正态或偏态总体中,抽取例数为n 的样本,样本均数的均数 仍为μ,标准差为 。
三、标准误意义及其计算方法
1、标准误意义:均数的标准差就是标准误,它说明均数的抽样误差大小。均数的标准误用 表示。
2、标准误计算方法:
........(理论值) ........(估计值)
均数的标准误与标准差成正比,与样本例数n 的平方根成反比。
随着 n S 稳定 0
因此,减少抽样误差最有效的办法:增加样本例数 3、均数标准误的应用
(1)反映均数抽样误差大小:标准误越大,抽样误差越大,反之,就越小;
(2)反映均数的可靠性:标准误越大,样本均数的抽样误差就越大,用样本均数推断总体均数的可
x σ
x
x
x σ
n
σσx =
n
S
S x =
n
S
S x =
x
s