§3.1回归分析的基本思想及其初步应用(2)【学情分析】:教学对象是高二理科学生,学生已掌握建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。在教学中,要结合实例,让学生了解随机误差产生的原因。初步了解可以通过求回归模型的相关指数或利用残差分析不同的回归模型的拟合精确度。在起点高的班级中通过让学生观察、思考与讨论,进一步体会回归分析中的数理计算,及运用相关指数与残差分析来刻画模型拟合效果,初步形成运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。【教学目标】:(1)知识与技能:了解求线形回归方程的两个计算公式的推导过程,、回归平方和;了解随机误差产生的原因;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线性模型通过变换转化为线性回归模型。(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,进而学习相关指数,用相关指数来刻画回归的效果。(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。【教学重点】:1.了解判断刻画模型拟合效果的方法——相关指数和残差分析;2.通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。【教学难点】:1.了解随机误差产生的原因,用残差平方和衡量回归方程的预报精度;2.了解判断刻画模型拟合效果的方法——相关指数和残差分析。【教学过程设计】:教学环节教学活动设计意图一、创设情境1.由例1知,体重的值受身高或随机误差的影响。2.问题一:身高172cm的女大学生的体重一定是60.316kg吗?如果不是,其原因是什么?引入回归分析的效果评价的三个统计量二、探究新知解答问题一:显然,身高172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg.上图3.1-2中的样本点和回归直线的相互结合实例由结果分析残差图是否异常,养成从实际问题出发,抽象为数学问题中的线性回归问题,从而指导实际问题的解决。140455055606570150155160165170175180位置说明了这一点.由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用下面的线性回归模型来表示:y=bx+a+e(3)这里a和b为模型的未知参数,e是y与之间的误差。通常e为随机变量,称为随机误差,它的均值E(e)=0,方差D(e)=.这样线性回归模型的完整表达式为:(4)在线性回归模型(4)中,随机误差e的方差越小,通过回归直线(5)预报真实值y的精度越高。随机误差是引起预报值与真实值y之间的误差的原因之一,大小取决于随机误差的方差。另一方面,由于公式(1)和(2)中为截距和斜率的估计值,它们与真实值a和b之间也存在误差,这种误差是引起预报值与真实值y之间误差的另一个原因。思考1、产生随机误差项e的原因是什么?答:实际上,从上例中,一个人的体重值除了受身高的影响外,还受到许多其它因素的影响。例如饮食习惯、是否喜欢运动、度量误差等。另外,我们选用的线性模型往往只是一种近似的模型。所有这些因素都会导致随机误差项e的产生。问题二、在线性回归模型中,e是用预报真实值y的误差,它是一个不可观测的量,那么应该怎样研究随机误差?如何衡量预报的精度?解答问题二:因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征。均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机误差的均值为0,因此可以用方差来衡量随机误差的大小。为了衡量预报的精度,需要估计的值。一个自然的想法是通过样本方差来估计总体方差。如何得到随机变量e的样本呢?由于模型(3)或(4)中的e隐含在预报变量y中,我们无法精确地把它从y中分离出来,因此也就无法得到随机变量e的样本。解决问题的途径是通过样本的估计值来估计。根据截距和斜率的估计公式(1)和(2),可以建立回归方程学生思考,回答2因此是(5)中的估计量。由于随机误差,所以是e的估...