上一次统计学和大家分享了统计描述的一些内容,今天我们来回顾一下统计推断的相关内容。统计推断我将从参数估计和假设检验两个部分来进行概述,可能大家看的教材不同,这一部分的组织结构也有差异,但我还是觉得分成这两部分比较容易理解。
参数估计,首先区分两个概念,什么是参数,什么是统计量。统计量是针对样本而言的,参数是针对总体而言的,以中国所有的6岁儿童为总体,以随机抽取的10000名6岁儿童为样本,前者的身高均值称为参数,后者的平均身高称为统计量。
由于总体的无限性,或者不可及等其他原因,参数无法直接获得,只能由统计量通过一定的方法来估计参数,这就是参数估计。参数估计有两种方法,一是点估计,二是区间估计。点估计属于较为粗糙的估计,它的原理很简单,直接以统计量的数值作为参数的数值。区间估计则是将统计量与标准误,得出一个具有较大置信度的包含参数的范围,这个范围称为参数的置信区间。
这一块内容,可能置信区间的概念比较难以理解,教材上一般这样阐述,以95%的置信区间为例,重复100次抽样,每次抽取的样本量都是n,每个样本都按照“均数±1.96*标准误”构建置信区间,这样就有100个置信区间出来,其中95个置信区间包含总体均数,5个置信区间不包含总体均数。大家耐心的领会一下吧。
看到上面置信区间的计算公式,有没有觉得和参考值范围很相像?这是经常会混淆的两个概念,因此区分置信区间与参考值范围也是本章的一个重点;捎带着区分一下标准差与标准误这两个概念吧,也是常常考察的东西。
罗嗦了这么多参数估计,下面进入假设检验。假设检验的目的、核心原理希望大家能领悟;好像前面我已经提过了,就是什么时候需要假设检验,什么时候不需要假设检验,这个要搞搞清楚。不要看到数据就检验,看到p<0.05就欢喜。p值的概念或者说内涵重点把握,还有检验水准,也就是α的内涵,α与p的区别和联系,这些小知识点多思考一下。假设检验的基本步骤,无效假设和备选假设的设定,也需要看一下。
第一种假设检验方法,t检验,首先知道进行t检验的前提条件,即正态性、方差齐,不满足这两个条件就不能做t检验。t检验的三种方法,单样本t检验、两独立样本t检验和配对t检验,怎么计算不是重点,重点是要学会识别资料,什么样的资料可以用单样本t检验,什么样的资料可以用两独立样本t检验,什么样的资料可以用配对t检验;掌握了这些,t检验就算是过关了。
这一次就over到这里。
发表回复