SPSS 学习笔记之— — 二项 Logistic 回归分析 一、 概述 Logistic 回归主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。他可以从多个自变量中选出对因变量有影响的自变量,并可以给出预测公式用于预测。 因变量为二分类的称为二项 logistic 回归,因变量为多分类的称为多元 logistic 回归。 下面学习一下 Odds、OR、RR 的概念: 在病例对照研究中,可以画出下列的四格表: ------------------------------------------------------ 暴露因素 病例 对照 ----------------------------------------------------- 暴露 a b 非暴露 c d ----------------------------------------------- Odds: 称为比值、比数,是指某事件发生的可能性(概率)与不发生的可能性(概率)之比。在病例对照研究中病例组的暴露比值为: odds1 = (a/(a+c))/(c(a+c)) = a/c, 对照组的暴露比值为: odds2 = (b/(b+d))/(d/(b+d)) = b/d OR:比值比,为:病例组的暴露比值(odds1)/对照组的暴露比值(odds2) = ad/bc 换一种角度,暴露组的疾病发生比值: odds1 = (a/(a+b))/(b(a+b)) = a/b 非暴露组的疾病发生比值: odds2 = (c/(c+d))/(d/(c+d)) = c/d OR = odds1/odds2 = ad/bc 与之前的结果一致。 OR 的含义与相对危险度相同,指暴露组的疾病危险性为非暴露组的多少倍。OR>1 说明疾病的危险度因暴露而增加,暴露与疾病之间为“正”关联;OR<1 说明疾病的危险度因暴露而减少,暴露与疾病之间为“负”关联。 还应计算 OR 的置信区间,若区间跨 1,一般说明该因素无意义。 关联强度大致如下: ------------------------------------------------------ OR 值 联系强度 ------------------------------------------------------ 0.9-1.0 1.0-1.1 无 0.7 -0.8 1.2-1.4 弱(前者为负关联,后者为正关联) 0.4 -0.6 1.5 -2.9 中等(同上) 0.1-0.3 3 .0-9.0 强(同上) <0.1 10.0 以上 很强(同上) ------------------------------------------------------ R R : 相对危险度(relative risk)的本质为率比(rate ratio)或危险比(risk ratio),即暴露组与非暴露组发病率之比,或发病的概率之比。但是病例对照研究不能计算发病率,所以病例对照研究中只能计算OR。当人群中疾病的发病率或...