请教用spss进行logistic回归的一个问题

zyfbb

各位大虾好，我想问一下用logistic回归模型做拟合预测的时候得一个问题。

书上讲的如果一个自变量是多分类变量时，譬如学历EDU分为三个以上等级，初中，高中，大学，就要增加虚拟变量，变成edu1（高中1或者0），edu2（大学1或者0），初中作为参照变量，就是原来的edu这个变量分解为两个虚拟变量。

但是现在的10以后的版本（我不知道以前的版本什么样），自变量可以选择设置为nominal变量和序次变量，如果把edu用1.2.3分别表示，那是不是它就能自动识别这个变量是多分类变量，不用产生新的edu1和edu2这样的虚拟变量，直接用一个内容为1或2.3的分类变量edu就可以进行数据拟合参数估计了？还是这样会导致变量被识别为连续的问题。

望高手指教一下，谢谢:)

shoeda

logistic回归模型因变量是离散型的，自变量没有要求，不用设置虚拟变量；在原数据输入的时候，需要定义变量的类型；并不是说SPSS这么智能：你给一组数，它能自动识别类型。如果你不清楚你的变量是什么类型的，那么请你把窗口转到variable view窗口，然后对应你的变量看看最后一列measure，就知道你的变量是什么类型的了，也可以更改类型的。

zyfbb

谢谢版主哦，我的意思就是只在variable view那里把自变量的类型定义了是不是就可以了，说得不专业:)因为看一本专门讲logistic回归的书，里面都设虚拟变量了。这样方便多了，谢谢版主大人，

netcow

要设置哑变量的（我们医学统计领域称之为哑变量），如果自变量是多分类的，如果数据类型是（ordinal）整序变量，则不用设置哑变量，如果是多分类名义变量（观测类型是norminal）则必须设置哑变量，SPSS会自动设置，但具体设置也可以自己选择，一般默认的情况下，是以最后一个组为对照组。

zyfbb

哦，谢谢大牛们指教，我明白了:)

abel

[quote]引用第3楼netcow于2006-06-13 08:53发表的“”:

要设置哑变量的（我们医学统计领域称之为哑变量），如果自变量是多分类的，如果数据类型是（ordinal）整序变量，则不用设置哑变量，如果是多分类名义变量（观测类型是norminal）则必须设置哑变量，SPSS会自动设置，但具体设置也可以自己选择，一般默认的情况下，是以最后一个组为对照组。[/quote]

ordinal的时候，和nomial会有比较大的不同的处理方式，可以参考专门讲ordinal变量分析的资料，或者logistic方面的资料，总之要谨慎使用。根据我的经验，我遇到正确使用这个分析工具的人的数量远远少于错误使用、或者错误阐释结果人的数量。

linda8866

看了之后大有收获。谢谢