社会统计学 复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、参数:是一个变量。我们在研究当前问题的时候,关心某几个变量的变化以及它们之间的相互关系,用自变量和因变量来表示。如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。
2、列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。
3、备择假设:又称研究假设,是我们在社会学研究中事先安排的假设。通过抽样调查有充分根据否定原假设,是与原假设相反的假设,用H1表示,是当原假设被推翻时需要接受的假设。备择假设有三种形式,以H0为=Z0为例,当H0被否定,可能被采用的H1为>Z0, 4、非参数检验:也称自由检定法,指对分布类型已知总体进行参数检验之外,所有检验方法的总称,这类方法的使用不需要对总体分布作任何事先的假定,例如:正态分布等,同时从检验内容来说,也不是检验总体分布的某些参数,例如均值等,而是检验总体某些有关的性质。 5、非参数检验与参数检验的区别 ①非参数检验的限制比参数检验少,无需任何假定,无需限制变量类型,且计算量小,简单易行 ②但非参数检验与参数检验相比,效率较差,不精确,检验相同的问题,需要比参数检验更大的样本量 ③非参数检验显著,参数检验不一定显著,但参数检验显著,非参数检验必定显著 6、选择相关系数的标准1看两个变量的变量层次2看两个变量是否对称 7、假设检验与区间估计的逻辑有哪些不同不同 ①假设检验从总体到样本,即事先对总体参数值或分布形式作出某种假设,然后利用样本来判断这个原假设是否成立 ②区间估计从样本到总体,即根据样本计算出一个范围来对未知参数进行估计 相同:区间估计与假设检验的统计处理时相通的,实际上假设检验的接受域也正是区间估计的置信区间 8、相关关系的特点:①现象之间确实存在着数量上的依存关系。就是说,一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化。 ②现象间的数量依存关系值是不确定的。就是说,一个现象发生数量上的变化,另一个现象会有几个可能值与之对应,而不是唯一确定的值。 9、相关系数:指线性相关系数,对两个变量之间线性相关程度的度量。相关程度有强弱之分,一般是在-1到1之间,相关系数越趋于0,关系越弱,相关系数与趋于绝对值1时,关系越强。 10、参数估计:即根据抽样结果合理地、科学地猜测总体参数的具体值或其范围。参数估计包括参数的点估计和区间估计两种 11、统计值:关于调查样本中某一变量的综合描述,是样本特征值,如样本均值,成数及方差 12、置信水平:指总体位置参数落在置信区间内的概率。用(1- )表示,常用的置信水平有:99%,95%,90% 13、变量分为哪几个层次?定类变量与定序变量之间的相关系数是什么? 变量分为四个层次,即定类变量、定序变量、定距变量和定比变量。相关系数是eat2 14、我们通常根据哪些原则确定原假设与备择假设? 原假设是关于总体间参数值相等或总体分布符合某种分布的假设,是待否定的假定,与之相对立,备择假设是指总体间参数值不相等或总体分布不符合某种分布的假设,是待选择的假设 原则二:原假设往往是研究者不愿接受而期待拒绝的假设,备择假设往往是研究者希望证实并且期待接受的假设,研究中的假设一般是备择假设,通常先设立备择假设,再对立的设定原假设 原则三:如果研究的目的只在于分析事物间是否有差异,不强调哪个比哪个好,这种情况下的假设比较容易,可以根据原则去理解和假设,这时进行的是双侧检验的情形,原假设设定为H0:U=U0等,备择假设随即设定为其对立面 原则四:如果研究的目的在于分析事物哪个比哪个好,这时可以根据原则二去理解和假设如题目中问“是否更长,大……”,即进行右侧检验,原假设设定为:H0:U≦U0等,反之,则进行左侧检验,原假设为H0:U≧U0等。 15、何为列联表?制作列联表的原则有哪些? 1)列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。 2)制作原则:第一行是自变量的取值,第二行是因变量的取值 16、接受域:接受H0的区间,抽样所获数据计算的统计量值小于临界值,则接受H0。 17、临界值:把拒绝原假设的小概率事件定在分布的右尾,则右尾面积总和所代表的概率即为显著水平α,φ(Zα)=1-α,Zα称作临界值。(详见教材p232) 18、推断统计:主要用于抽样调查,以抽样调查获得的信息材料通过推断统计进行简化处理,以便从样本的统计值推断总体的参数值。 19、抽样分布:指统计量的分布。抽样分布是在同一总体反复不断抽取不同样本时,各个样本可能出现的样本统计值的分布情况 20、假设检验中选择统计量的一般原则是什么? 假设检验是通过样本计算某个统计量进行的,选择统计量的一般原则首先是确定是大样本还是小样本,然后根据总体方差是一直还是未知选择统计量 21、试比较相关系数与回归系数的关系相关系数r表示的是两变量之间的疏密程度,回归系数b是回归直线的斜率,说明回归直线的陡度。相关关系r表现了真实数据与回归直线靠拢的程度 22、总体均值检验时,哪些情况下可以使用Z检验 答:总体均值检验使用Z检验时的假定条件如下: 1连个样本都是独立的随机样本 2两个总体都服从正态分布 3如总体不服从正态分布,可以用正态分布来近似 23、小概率原则:它是假设检验的基本思想,包括两个部分,一是指概率很小的随机事件在一次观察中不可能出现;二是如果小概率事件在一次观察中出现了,那么假设就是错误的。(小概率原理:在日常生活中,人们习惯于把概率很小的事件,当做在一次观察中不可能出现的事件。) 24、散点图:散点图是相关关系的图形表示,数据点在直角坐系平面上的 分布图。散点图表示因变量随自变量而变化的大致趋势,据此可以选择合 适的回归方程对数据点进行拟合。 25、回归方程:是研究自变量x不同取值时,因变量y平均值的变化。当因变量y的平均值与自变量x呈线性规律时,称做线性回归方程。