第二章 抽样调查基本原理第一节 有关基本概念一、总体总体也叫母体,它是所要认识对象的全体,是具有同一性质的许多单位的集合。组成总体的每个个体叫做单位。总体可以是有限的,也可以是无限的。如果总体中所包含个体的数目为有限多个,则该总体就是有限总体,反之是无限总体。总体也可区分成计量总体(由测量值组成的)和计数总体(由品质特征组成的)。在抽样以前,必须根据实际情况把总体划分成若干个互不重叠并且能组合成总体的部分,每个部分称为一个抽样单元,不论总体是否有限,总体中的抽样单元数一定是有限的 ,而且是已知的,因此说抽样调查的总体总是有限的。抽样单元又有大小之分,一个大的抽样单元可以分成若干个小的抽样单元,最小的抽样单元就是每一个个体。如一项全国性的调查,如果把省作为一级单元,则可以把县作为二级单元,乡作为三级单元,村作为四级单元等等。又如在流动人口抽样中,可以以居委会作为抽样单元,而在家计调查中,则以户为抽样单元。总体应具备同质性、大量性和差异性的特征。在抽样调查中,通常将反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有:1.总体总和 Y:例如全国人口数。Y=∑yi=y1+y2+…+yN2.总体均值¯Y :例如职工平均工资。¯Y =Y/N=∑yi /N3.总体比率 R:是总体中两个不同指标的总和或均值的比值。如总收入与总支出之比。R=Y/X=¯Y /¯X4.总体比例 P:是总体中具有某种特性的单元数目所占比重。如产品的合格率。二、样本样本是由从总体中所抽选出来的若干个抽样单元组成的集合体。抽样前,样本是一个n 维随机变量,属样本空间;抽样后,样本是一个 n 元数组,是样本空间的一个点。样本是总体的缩影,是总体的代表。抽样的效果好不好,依赖于样本对总体是否有充分的代表性。样本的代表性愈强,用样本指标对总体全面特征的推断就愈精确,即推断的误差就愈小;反之,如果样本的代表性愈弱,推断的误差就愈大,推断结果就愈不可靠。如何增强样本的代表性,使其能达到估计或推断的预期效果,就必须分析影响样本代表性的因素,以便加强控制。一般情况下,影响样本代表性的因素有以下几个方面:(1)总体标志值分布的离散程度。若总体标志值的分布很集中,即平均离散程度(标准差)很小,从中任抽部分单元做样本,样本特征很近似于总体特征,样本的代表性就强;反之,如果标志值的分布很分散,即平均离散程度很大,从中抽取样本单元的随机波动也很大,必将影响样本的代表性。(2)抽...