SPSS 作业8:二项Logistic 回归分析 为研究和预测某商品消费特点和趋势,收集到以往胡消费数据。数据项包括是否购买,性别,年龄和收入水平。这里采用 Logistic回归的方法,是否购买作为被解释变量(0/1二值变量),其余各变量为解释变量,且其中性别和收入水平为品质变量,年龄为定距变量。变量选择采用 Enter方法,性别以男为参照类,收入以低收入为参照类。 (一)基本操作: (1)选择菜单 Analyze-Regression-Binary Logistic; (2)选择是否购买作为被解释变量到Dependent 框中,选其余各变量为解释变量到Covariates框中,采用 Enter方法,结果如下: 消费的二项 Logistic分析结果(一)(强制进入策略) Categorical Variables Codings Frequency Parameter coding (1) (2) 收入 低收入 132 .000 .000 中收入 144 1.000 .000 高收入 155 .000 1.000 性别 男 191 .000 女 240 1.000 分析:上表显示了对品质变量产生虚拟变量的情况,产生的虚拟变量命名为原变量名(编码)。可以看到,对收入生成了两个虚拟变量名为Income(1)和Income(2),分别表示是否中收入和是否高收入,两变量均为0 时表示低收入;对性别生成了一个虚拟变量名为Gedder(1),表示是否女,取值为0时表示为男。 消费的二项 Logistic分析结果(二)(强制进入策略) Block 0: Beginning Block Classification Tablea,b Observed Predicted 是否购买 Percentage Correct 不购买 购买 Step 0 是否购买 不购买 269 0 100.0 购买 162 0 .0 Overall Percentage 62.4 a. Constant is included in the model. b. The cut value is .500 分析:上表显示了 Logistic分析初始阶段(第零步)方程中只有常数项时的错判矩阵。可以看到:269人中实际没购买且模型预测正确,正确率为100%;162人中实际购买了但模型均预测错误,正确率为0%。模型总的预测正确率为62.4%。 消费的二项 Logistic分析结果(三)(强制进入策略) Variables in the Equ ation B S.E. Wald df Sig. Exp(B) Variables in the Equ ation B S.E. Wald df Sig. Ex p(B) Step 0 Constant -.507 .099 26.002 1 .000 .602 分析:上表显示了方程中只有常数项时的回归系数方面的指标,各数据项的含义依次为回归系数,回归系数标准误差,Wald 检验统计量的观测值,自由度,Wald 检验统...