变量之间的相互关系两个变量的线性相关1.变量间的相关关系(1)相关关系的定义变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有_________的,那么这两个变量之间的关系叫做相关关系,两个变量之间的关系分为_________和____________.(2)散点图将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的图形叫做散点图.随机性函数关系相关关系(3)正相关与负相关①正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为_______.②负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为________.正相关负相关2.回归直线方程(1)回归直线:如果散点图中点的分布从整体上看大致在_________附近,就称这两个变量之间具有__________关系,这条直线叫做回归直线.(2)线性回归方程:__________对应的方程叫做回归直线的方程,简称回归方程.一条直线线性相关回归直线(3)最小二乘法:求线性回归方程y^=b^x+a^时,使得样本数据的点到回归直线的______________最小的方法叫做最小二乘法.b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x,其中,b^是线性回归方程的______,a^是线性回归方程在y轴上的______.距离的平方和斜率截距相关关系及判断某个男孩的年龄与身高的统计数据如下表所示.年龄x(岁)123456身高y(cm)788798108115120(1)画出散点图;(2)判断y与x是否具有线性相关关系.[解](1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.[规律方法]1.相关关系是两个变量间一种不完全确定的关系.它不一定是因果关系,也可能是伴随关系.2.判断两个变量x和y之间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果图上发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.求回归方程[探究问题]1.任意两个统计数据是否均可以作出散点图?提示:任意两个统计数据均可以作出散点图.2.任何一组数据都可以由最小二乘法得出回归方程吗?提示:用最小二乘法求回归方程的前提是先判断所给数据具有线性相关关系,否则求回归方程是无意义的.3.回归系数b^的含义是什么?提示:(1)b^代表x每增加一个单位,y的平均增加单位数,而不是增加单位数.(2)当b^>0时,两个变量呈正相关关系,含义为:x每增加一个单位,y平均增加b^个单位数;当b^<0时,两个变量呈负相关关系,含义为:x每增加一个单位,y平均减少b^个单位数.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:零件数x(个)102030405060708090100加工时间y(分)626875818995102108115122(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求y关于x的回归直线方程.[思路探究]画散点图→确定相关关系→求回归直线系数→写回归直线方程.[解](1)画散点图如下:由上图可知y与x具有线性相关关系.(2)列表、计算:i12345678910xi102030405060708090100yi626875818995102108115122xiyi62013602250324044505700714086401035012200x=55,y=91.7,i=110=x2i=38500,i=110y2i=87777,i=110xiyi=55950a^=y-b^x=91.7-0.668×55=54.96.即所求的回归直线方程为:y^=0.668x+54.96.回归方程的应用某5名学生的总成绩和数学成绩(单位:分)如表所示:学生ABCDE总成绩x428383421364362数学成绩y7865716461(1)画出散点图;(2)求y对x的线性回归方程(结果保留到小数点后3位数字);(3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩.[解](1)散点图如图所示:(2)由题中数据计算可得x=391.6,y=67.8,i=15x2i=770654,i=15xiyi=133548.代入公式得b^=133548-5×391.6×67.8770654-5×391.62≈0.204,a^=67.8-0.204×391.6≈-12.086,所以y对x的线性回归方程为y^=-12.086+0.204x.(3)由(2)得当总成绩为450分时,y^=-12.086+0.204×450≈80,即这个学生的数学成绩大约为80分.[规律方法]1.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测.否则,如果两个变量之间不存在线性相关关系,即使由样本数据求出回归直线方程,用其估计和预测结果也是不可信的.2.根据回归直线进行预测时估计值不是实际值两者会有一定的误差.