概率统计(ZYH)5.3协方差与相关系数一、协方差的定义与性质二、随机变量的线性逼近与相关系数概率统计(ZYH)一、协方差的定义和性质在5.2节方差性质4°的证明中为此,我们引入下面的定义.()()()2XEXYEYDXYDXDYE即,如果随机变量X和Y是相互独立的,则必有E[(X-EX)(Y-EY)]=0这意味着当E[(X-EX)(Y-EY)]≠0时,X与Y不相互独立或存在着一定的关系.||0协方差)()(YDXD独立YX,概率统计(ZYH)定义1Cov(,)()()()XYEXYEXEY(,),()(),()(),Cov(,),XYEXEXYEYEXEXYEYXYXY协对二维若存在则称为随机变量与的记为方差即特别,当X与Y相互独立时,有Cov(,)()()XYEXEXYEY将上式展开,易得公式Cov(,)0XY由协方差的定义亦容易推得协方差的如下性质概率统计(ZYH),,,ab设是常数则当下所遇期望和协方差存在时有协方差的性质o1Cov(,)0;aXo2Cov(,);XXDXo3Cov(,)Cov(,);XYYXo4Cov(,)Cov(,);aXbYabXYo5Cov(,)Cov(,)Cov(,).XYZXZYZ例1设X为一随机变量,其方差为DX,Y=a+bX,其中a与b均为常数,求Cov(X,Y).解Cov(,)Cov(,)XYabXXCov(,)Cov(,)aXbXXbDXCov(,)()()XYEXEXYEY概率统计(ZYH)二、随机变量的线性逼近与相关系数在解决实际问题时,常常需要用随机变量X的线性函数a+bX逼近随机变量Y.为了使这种逼近的近似程度好,我们自然希望误差|Y-(a+bX)|越小越好.或者更方便地,用误差来衡量这种逼近的好坏程度.显然,r的值越小,则表示逼近程度越好.故应取a,b使误差r的值最小.2)]([bXaYEr下面讨论a,b的取值.概率统计(ZYH)参数a,b的确定2)]([bXaYEr)(2222222XYbEaEYabEXEXbaEYEYbEXaar222)(2222XYEaEXbEXbrbEXEYa22)()(EXEXEXEYXYEbDXYX),Cov(EXDXYXEY),Cov(得,0,0brar令0,0DXDY(设)概率统计(ZYH)误差r的最小值:XY(称其为与的相关系数)DXYXb),Cov(2min)]([bXaYEr2),Cov(),Cov(XDXYXEXDXYXEYYE2),Cov()(EXXDXYXEYYEDXYXDY2)],[Cov(DYDYDXYX2),Cov(1DYDXYXXY),Cov(记DYrXY)1(2min则,),Cov(EXDXYXEYa概率统计(ZYH)相关系数的性质为相关系数其中DYDXYXXY),Cov(,)1(2minDYrXY误差1}{,,1bXaYPbaXY使常数证1||0)1(min2XYXYDYr知由01minrXY0)]([,,2bXaYEba使常数0)]}([{)]([2bXaYEbXaYD或0)]([0)]([bXaYEbXaYD且或1}{,,bXaYPba使常数相关系数满足|ρXY|≤1且概率统计(ZYH)当|ρXY|较大时rmin较小,此时X与Y(就线性关系来说)联系较紧密.特别当ρXY=±1时,X与Y之间以概率1存在着线性关系.当|ρXY|较小时rmin较大,此时X与Y(就线性关系)联系不够紧密.特别当ρXY=0时rmin达到最大,X与Y之间无线性关系可言,这时称X与Y不相关.性质表明:为相关系数其中DYDXYXXY),Cov(,)1(2minDYrXY误差相关系数ρXY刻画了随机变量X与Y的线性相关性相互独立不相关一般地概率统计(ZYH)设随机变量X和Y的方差分别为4和16,相关系数为-0.5,求协方差Cov(X,Y).例241645.0),Cov(DYDXYXXY解122212(,),,,,,.XYXY设服从参数为的二维正态分布求与的相关系数例3概率统计(ZYH)例3解22112)exp(ρσσhf2222212121212)())((2)()1(21σμyσσμyμxρσμxρhtu221211dde))((21),Cov(ρσσyxμyμxYXh二维正态分布的密度是utρtuσuσutdde)1()(212221220222ut2112112221121σμxσμxρσμy概率统计(ZYH)对于二维正态分布,参数ρ就是X与Y的相关系数,因而二维正态分布可由X与Y的期望、方差及它们的相关系数完全确定.且有如下utuσσYXutdde)(21),Cov(222122uutσσutde21de21222212221σσ关系:2121),Cov(σσσσDYDXYXXY所以),(2221σDYσDX参数ρ=0不相关相互独立