SPSS数据正态性检验解析例:请对某大学学生的身高资料进行分析,是否符合正态分布1.2.3.结果部分:解析:偏度>0,尾部向右延伸偏度<0,尾部向左延伸峰度=0与正态分布的陡缓程度相同峰度>0比正态分布的高峰更加陡峭——尖顶峰(瘦)峰度<0比正态分布的高峰来得平台——平顶峰(胖)SAS规定:n≤2000,以Shapiro-Wilk(W检验)为准;n>2000,以Kolmogorow-Smirnov(D检验)为准如果整个图逆时针转90度,就变成变相的直方图,也是反映分布形态的,但信息含量远大于直方图(分布及数值大小)。以倒数第二行为例,最左边的17是指右边的小数点后面有17个数字。17是茎,0001114是17个树叶,最后一行主干宽度是10,意味上面数字得放大10倍,意思是有3个180,3个181。&为零碎叶子的标志。因叶子太小或太大无法在图中显示,用&表示。解读:P-P图反映了变量的实际累积概率与理论累积概率的符合程度,Q-Q图反映了变量的实际分布与理论分布的符合程度,两者意义相似,都可以用来考察数据资料是否服从某种分布类型。若数据服从正态分布,则数据点应与理论直线(即对角线)基本重合。本例数据很多不在参考线上,不符合正态分布,与前W检验结果一致。P-P图Q-Q图注意:事实上,Shapiro-Wilk检验及Kolmogorov-Smirnov检验从实用性的角度,远不如图形工具进行直观判断好用。在使用这两种检验方法的时候要注意:当样本量较少的时候,检验结果不够敏感,即使数据分布有一定的偏离也不一定能检验出来;当样本量较大的时候,检验结果又会太过敏感,只要数据稍微有一点偏离,P值就会<0.05,检验结果倾向于拒绝原假设,认为数据不服从正态分布。如果样本量足够多,即使检验结果P<0.05,数据来自的总体也可能是服从正态分布的。因此,在实际的应用中,往往会出现这样的情况,明明直方图显示分布很对称,但正态性检验的结果P值却<0.05,拒绝原假设认为不服从正态分布。此时建议不要太刻意追求正态性检验的P值,一定要参考直方图、P-P图等图形工具来帮助判断。很多统计学方法,如T检验、方差分析等,与其说要求数据严格服从正态分布,不如说“数据分布不要过于偏态”更为合适。经验法:一般正态分布的标准差不会大于均值的1/3,这是目测判断法,最终还是要经过检验,但如果标准差都大于均数,一般不太可能正态分布。发现异常值!P75P50P25虽然箱式图一般用于判定数据是否存在异常值,但如果细心,上方很多离群值,数据像大的方向拖尾,结果与直方图判读一致。按照SPSS默认选项,如果所有数据都在四分位点1.5倍盒子长度内,则线的端点为最大值和最小值,否则线长度就是1.5倍盒子长度(盒子长度等于四分位间距),在其外的值单独点出(1.5倍用圈圈表示可疑值,3倍用*表示异常值)部分案例参考精鼎数据分析联盟、医咖会,详细文章请参考相关微信公众号