不知道我这个题目概括的是否恰当,大家看完下面的文章应该就会明白一点。昨天的时候,有个博士师姐在群里求助,如何对多年级多性别的资料进行分年级分性别的统计学描述,以身高的均数为例,frequence、descriptive选项卡中的其他统计量也可以。假设数据库是下面这个样子的。
如果是你,你会怎么处理这个问题?最笨的方法,把这个数据库按照年级分割成三个库,然后分开进行统计描述。不过,这是在数据量较少,并且数据库结构比较简单的情况下;如果对于一个结构复杂且样本量较大的数据库,比如全国青少年体质监测的数据库,为了实现题目中要求的数据描述,而大动干戈,实在划不来。下面说我的解决办法,其实是很简单的。
选择data选项卡下的split命令,将分组变量年级选中,拖入右侧区域,然后选择organize output by groups,选择ok。这一步完成后,就可以去analyze选项卡进行所需要的各项统计学描述了,你将看到统计学描述的结构是按照设定的组别分别输出的。注意,完成分组描述后,需要返回split命令对话框,将分组变量拖回远处,并且选择analyze all the cases选项。
over。
我们只学了sas,北大出题会设计spss的吗?
根据往年出题的经验,其实是较少涉及程序运算类题目的;如果我没有记错的话,只有极个别的年份考过程序题目,是给出一个spss运行结果截图,好像是相关或者回归那部分的,很简单。你可以看一下近5年的真题,如果没考过,那其实不必担心。不过你们竟然学习sas,这个很先进也很高级。我都不懂呢。还有,个人感觉,研究生阶段还是spss用的稍微多一点,毕竟容易上手。