333.2回归分析(2)教学目标(1)通过实例了解相关系数的概念和性质,感受相关性检验的作用;(2)能对相关系数进行显著性检验,并解决简单的回归分析问题;(3)进一步了解回归的基本思想、方法及初步应用.教学重点,难点相关系数的性质及其显著性检验的基本思想、操作步骤.教学过程一.问题情境1.情境:下面是一组数据的散点图,若求出相应的线性回归方程,求出的线性回归方程可以用作预测和估计吗?2.问题:思考、讨论:求得的线性回归方程是否有实际意义.二.学生活动对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?这就是上节课提到的问题①,即模型的合理性问题.为了回答这个问题,我们需要对变量x与y的线性相关性进行检验(简称相关性检验).三.建构数学1.相关系数的计算公式:对于x,y随机取到的n对数据(,)iixy(1,2,3,,)in,样本相关系数r的计算公式为112222221111()()()()(())(())nniiiiiinnnniiiiiiiixxyyxynxyrxxyyxnxyny.22.相关系数r的性质:0246810051015024681005101533(1)||1r;(2)||r越接近与1,x,y的线性相关程度越强;(3)||r越接近与0,x,y的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.3.对相关系数r进行显著性检验的步骤:相关系数r的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?这需要对相关系数r进行显著性检验.对此,在统计上有明确的检验方法,基本步骤是:(1)提出统计假设0H:变量x,y不具有线性相关关系;(2)如果以95%的把握作出推断,那么可以根据10.950.05与2n(n是样本容量)在附录2(教材P111)中查出一个r的临界值0.05r(其中10.950.05称为检验水平);(3)计算样本相关系数r;(4)作出统计推断:若0.05||rr,则否定0H,表明有95%的把握认为变量y与x之间具有线性相关关系;若0.05||rr,则没有理由拒绝0H,即就目前数据而言,没有充分理由认为变量y与x之间具有线性相关关系.说明:1.对相关系数r进行显著性检验,一般取检验水平0.05,即可靠程度为95%.2.这里的r指的是线性相关系数,r的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.3.这里的r是对抽样数据而言的.有时即使||1r,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.4.对于上节课的例1,可按下面的过程进行检验:(1)作统计假设0H:x与y不具有线性相关关系;(2)由检验水平0.05与29n在附录2中查得0.050.602r;(3)根据公式2得相关系数0.998r;(4)因为0.9980.602r,即0.05rr,所以有95﹪的把握认为x与y之间具有线性相关关系,线性回归方程为527.59114.453yx是有意义的.33四.数学运用1.例题:例1.下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y与x之间的关系.母亲身高/xcm154157158159160161162163女儿身高/ycm155156159162161164165166解:所给数据的散点图如图所示:由图可以看出,这些点在一条直线附近,因为1541571638159.25x,1551561668161y,82222218()1541638159.2559.5iixx,82222218()1551668161116iiyy,8181541551631668159.2516180iiixyxy,所以963.01165.5980r,由检验水平0.05及26n,在附录2中查得707.005.0r,因为0.9630.707,所以可以认为x与y之间具有较强的线性相关关系.线性回归模型yabx中,ab的估计值,ab分别为3381822181.345,8iiiiixyxybxx53.191aybx,故y对x的线性回归方程为xy345....