zyfbb
各位大虾好,我想问一下用logistic回归模型做拟合预测的时候得一个问题。
书上讲的如果一个自变量是多分类变量时,譬如学历EDU分为三个以上等级,初中,高中,大学,就要增加虚拟变量,变成edu1(高中1或者0),edu2(大学1或者0),初中作为参照变量,就是原来的edu这个变量分解为两个虚拟变量。
但是现在的10以后的版本(我不知道以前的版本什么样),自变量可以选择设置为nominal变量和序次变量,如果把edu用1.2.3分别表示,那是不是它就能自动识别这个变量是多分类变量,不用产生新的edu1和edu2这样的虚拟变量,直接用一个内容为1或2.3的分类变量edu就可以进行数据拟合参数估计了?还是这样会导致变量被识别为连续的问题。
望高手指教一下,谢谢:)
shoeda
logistic回归模型因变量是离散型的,自变量没有要求,不用设置虚拟变量;在原数据输入的时候,需要定义变量的类型;并不是说SPSS这么智能:你给一组数,它能自动识别类型。如果你不清楚你的变量是什么类型的,那么请你把窗口转到variable view窗口,然后对应你的变量看看最后一列measure,就知道你的变量是什么类型的了,也可以更改类型的。
zyfbb
谢谢版主哦,我的意思就是只在variable view那里把自变量的类型定义了是不是就可以了,说得不专业:)因为看一本专门讲logistic回归的书,里面都设虚拟变量了。这样方便多了,谢谢版主大人,
netcow
要设置哑变量的(我们医学统计领域称之为哑变量),如果自变量是多分类的,如果数据类型是(ordinal)整序变量,则不用设置哑变量,如果是多分类名义变量(观测类型是norminal)则必须设置哑变量,SPSS会自动设置,但具体设置也可以自己选择,一般默认的情况下,是以最后一个组为对照组。
zyfbb
哦,谢谢大牛们指教,我明白了:)
abel
[quote]引用第3楼netcow于2006-06-13 08:53发表的“”:
要设置哑变量的(我们医学统计领域称之为哑变量),如果自变量是多分类的,如果数据类型是(ordinal)整序变量,则不用设置哑变量,如果是多分类名义变量(观测类型是norminal)则必须设置哑变量,SPSS会自动设置,但具体设置也可以自己选择,一般默认的情况下,是以最后一个组为对照组。[/quote]
ordinal的时候,和nomial会有比较大的不同的处理方式,可以参考专门讲ordinal变量分析的资料,或者logistic方面的资料,总之要谨慎使用。根据我的经验,我遇到正确使用这个分析工具的人的数量远远少于错误使用、或者错误阐释结果人的数量。
linda8866
看了之后大有收获。谢谢