第48页共28页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第48页共28页第四章理论分布和抽样分布在上章样本分布及其特征的基础上本章将讨论总体的分布及其特征。首先介绍间断性变数总体的理论分布,包括二项分布和泊松分布;其次介绍连续性变数总体的理论分布,即正态分布;最后介绍从这两类理论分布中抽出的样本统计数的分布,即抽样分布。为了说明这些理论分布,必须首先了解概率的基本概念和计算法则。第一节事件、概率和随机变量一、事件和事件发生的概率在自然界中一种事物,常存在几种可能出现的情况,每一种可能出现的情况称为事件,而每一个事件出现的可能性称为该事件的概率(probability)。例如种子可能发芽,也可能不发芽,这就是两种事件,而发芽的可能性和不发芽的可能性就是对应于两种事件的概率。若某特定事件只是可能发生的几种事件中的一种,这种事件称为随机事件(randomevent),例如抽取一粒种子,它可能发芽也可能不发芽,这决定于发芽与不发芽的机会(概率),发芽与不发芽这两种可能性均存在,出现的是这两种可能性中的一种。事件发生的可能性(概率)是在大量的实验中观察得到的,例如棉田发生盲蝽象为害的情况,并不是所有的棉株都受害,随着观察的次数增多,我们对棉株受害可能性程度大小的把握越准确、越稳定。这里将一个调查结果列于表4.1。调查5株时,有2株受害,受害株的频率为40%,调查25株时受害频率为48%,调查100株时受害频率为33%。可以看出三次调查结果有差异,说明受害频率有波动、不稳定。而当进一步扩大调查的单株数时,发现频率比较稳定了,调查500株到2000株的结果是受害棉株稳定在35%左右。表4.1在相同条件下盲蝽象在某棉田危害程度的调查结果调查株数(n)52550100200500100015002000受害株数(a)212153372177351525704棉株受害频率(a/n)0.400.480.300.330.360.3540.3510.3500.352现以n代表调查株数,以a代表受害株数,那么可以计算出受害频率p=a/n。从棉株受害情况调查结果看,频率在n取不同的值时,尽管调查田块是相同的,频率p却不同,只有在n很大时频率才比较稳定一致。因而,调查株数n较多时的稳定频率才能较好地代表棉株受害的可能性。统计学上用n较大时稳定的p近似代表概率。然而,正如此试验中出现的情况,尽管频率比较稳定,但仍有较小的数值波动,说明观察的频率只是对棉株受害这个事件的概第49页共28页第48页共28页编号:时间:2021年x月x日书山有路勤为径,学海无涯苦作舟页码:第49页共28页率的估计。统计学上通过大量实验而估计的概率称为实验概率或统计概率,以P(A)=n→∞a/n表示。此处P代表概率,P(A)代表事件A的概率,P(A)变化的范围为0~1,即0≤P(A)≤1。随机事件的概率表现了事件的客观统计规律性,它反映了事件在一次试验中发生可能性的大小,概率大表示事件发生的可能性大,概率小表示事件发生的可能性小。若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。这里的0.05或0.01称为小概率标准,农业试验研究中通常使用这两个小概率标准。除了随机事件外,还有必然事件和不可能事件,它们是随机事件的特例。对于一类事件来说,如在同一组条件的实现之下必然要发生的,称为必然事件;例如,水在标准大气压下加热到100℃必然沸腾。相反,如果在同一组条件的实现之下必然不发生的,称为不可能事件。例如,水在标准大气压下温度低于100℃时,不可能沸腾。必然事件和不可能事件发生的概率为1和0。二、事件间的关系在实际问题中,不只研究一个随机事件,而是要研究多个随机事件,这些事件之间又有一定的联系。例如,在种子发芽试验中,显然“发芽”和“不发芽”之间是有一定联系的。为了表述类似上述事件之间的联系,下面说明事件之间的几种主要关系。(一)和事件事件A和B至少有一个发生而构成的新事件称为事件A和B的和事件,记为A+B,读作“或A发生,或B发生”。例如,有一批种子,包含有能发芽的和不能发芽的。若A为“取到能发芽种子”,B为“取到不能发芽种子”,则A+B为“或者取到能发芽种子或者取到不能发芽种子”。事件间...