考纲要求1.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.4.了解回归分析的基本思想、方法及其简单应用.热点提示1.以考查线性回归系数为主,同时可能考查利用散点图判断变量间的相关关系.2.以实际生活为背景,重在考查独立检验、回归分析,多以选择题、填空题为主.1.相关关系及回归分析(1)相关关系:自变量取值一定时,因变量的取值带有一定的两个变量之间的关系叫做相关关系.(2)回归分析:在统计中,对具有相关关系的两个变量进行叫做回归分析.回归分析是寻找相关关系中非确定关系的某种确定性.随机性统计分析2.散点图:将n个数据点(xi,yi)(i=1,2,3…n)描在平面直角坐标系中,以表示具有相关关系的两个变量的叫做散点图.3.正相关与负相关:从散点图上看,点散布的位置在从的区域内,两个变量的这种相关关系称为正相关;点散布的位置在从的区域内,两个变量的相关关系称为负相关.左下角到右上角左上角到右下角图形5.线性回归模型y=bx+a+e(e称为),因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化.在统计中,我们也把自变量x称为,因变量y称为.随机误差解释变量预报变量系的强弱.当r>0时,表示两个变量;当r<0时,表示两个变量;r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表示两个变量间之间线性相关关系.通常当r>时,认为两个变量有很强的线性相关关系.正相关负相关几乎不存在0.757.用相关指数R2来刻画回归的效果,其计算公式是R2=R2的值越大,说明残差平方和越小,也就是说模型拟合的效果.在线性回归模型中,R2表示解释变量对预报变量变化的,R2越接近于1,表示回归的效果越好.越好贡献率8“”.变量的不同值表示个体所属的,这样的变量称为分类变量.9.列出两个分类变量的表,称为列联表.一般地,假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表如下表:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d称为2×2列联表.不同类别频数10.利用随机变量K2来确定在可以认为“”两个分类变量有关系的方法称为两个分类变量的独立性检验,其中K2=多大程度上1.有关线性回归的说法,不正确的是()A.相关关系的两个变量是非确定关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.散点图中的点越集中,两个变量的相关性越强解析:散点图上的点大致分布在通过散点图中心的那条直线附近,整体上呈线性分布时,两个变量相关关系越强.答案:D2.对于事件A和事件B,通过计算得到K2的观测值k≈4.514,下列说法正确的是()A.有99%的把握说事件A和事件B有关B.有95%的把握说事件A和事件B有关C.有99%的把握说事件A和事件B无关D.有95%的把握说事件A和事件B无关解析:k≈4.514>3.841,即有95%的把握认为事件A和事件B有关.当k>6.635时即有99%的把握认为事件A和事件B有关.答案:B3.已知回归方程为=0.50x-0.81,则x=25时,y的估计值为________.解析:当x=25时,y=0.50×25-0.81=11.69.答案:11.694.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算K2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).解析: K2=27.63>6.635,∴有99%的把握认为“打鼾与患心脏病有关”.答案:有关5.下表是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x之间有较好的线性相关关系,求y与x的回归方程.月份x1234用水量y4.5432.5解:x-=2.5,y-=3.5,4i=1x2i=12+22+32+42=30,4i=1xiyi=1×4.5+2×4+3×3+4×2.5=31.5,b^=4i=1xiyi-4x-y-4i=1x2i-4x-2=31.5-4×2.5×3.530-4×2.52=-0.7,a^=y--b^x-=3.5+0.7×2.5=5.25,∴回归方程为y^=-0.7x+5.25.【例1】关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数据:判断它们是否...