发布网友 发布时间:2024-10-21 17:21
共1个回答
热心网友 时间:2024-11-10 23:44
logistic回归是一种广义的线性回归分析模型,适用于数据挖掘、疾病自动诊断、经济预测等领域,如探讨疾病诱因、客户商品购买意愿、借款人违约风险等。
有序logistic回归关注的是多分类定类数据,具有三个或更多分类水平,且这些分类有序,例如:年级、满意度等。
当因变量为具有多个分类水平且有序的数据时,可以构建累计logistic模型,通过拟合因变量水平数减一的logistic回归模型实现。此模型实质上是将因变量按不同取值水平依次分割为两个等级,并分别建立二分类的logistic回归模型。
有序logistic回归需满足的前提条件包括:数据类型要求(因变量为有序多分类变量,自变量为分类或连续变量,协变量为分类变量),以及假设模型中自变量系数保持不变,仅常数项(比例优势)发生变化。
可通过平行线检验确认模型假设是否满足。这一检验在进行有序logistic回归分析时即可直接完成,无需额外检验。
应用场景包括:多分类因变量且类别之间具有比较大小或程度高低的关系,与自变量之间的关联性分析。例如,探讨收入水平(底、中、高)与性别、学历之间的关系,同时考虑年龄作为控制变量。
使用SPSS进行有序logistic回归分析的步骤如下:
①选择“分析-回归-有序”。
②添加变量,考虑多个协变量时需进行标准正态变换。
③设置参数,勾选“输出”中“平行线检验”,保持其他选项默认设置。
④查看输出结果,重点关注平行线检验结果、模型拟合信息、拟合优度检验、伪R方表以及多分类logistic回归参数。
SPSS输出中,需关注的表包括:平行线检验结果、模型拟合信息(-2对数似然值降低表示模型改善)、模型的显著性(<0.05表示模型具有统计学意义)、拟合优度检验(卡方和偏差卡方不如似然比检验稳健)、伪R方值(应用有限,不需关注)、多分类logistic回归参数(临界值、位置估计、标准误、置信区间、wald检验结果)。
在分析结果时,可计算自变量参数估计值(即β值)对应的相对风险比(OR)值。例如,若“性别”的P值小于0.05,表明存在统计学意义,且OR值为1.42,意味着男性比女性收入水平提升一个等级的可能性增加1.42倍;“学历”方面,若OR值为6.67,表示研究生的收入水平升一个等级的可能性是大专学历的个体的6.67倍。