本质是研究出生率对GDP的影响,但是是分时间和9个地区的,教授说要安时间和地区用固定效应的虚拟变量,设置后看对那俩之间系数的影响,请问具体要怎么录入数据,STATA命令又应该是什么?非常感谢,详细说明会加分
比如你的变量叫做REG1,针对2010年。你同时还有一个变量叫YEAR,里面是每一个变量对应的年数。那么用以下命令,你能生成一个新的变量,只有当对应的YEAR变量为你想要的2010年时,数值取值为1,其他的都取值为0 : gen REG1 = (YEAR==2010)。
还有一种方法更加方便,就是用TABULATE命令。如果你的变量YEAR非常的规则,比如1990-2010年。共有21个年份。没有其他的比如小数、无理数之类的乱七八糟的数。那么
tabulate YEAR, gen(REG)
会直接生成21个变量,REG1,REG2,....REG21。REG1就是当YEAR =1990时取值为1,其他时候取值为0.类似的REG2就是当YEAR =1991时取值为1,其他时候取值为0.。。。。
我用第二种方法弄的,上为什么前10几年都说有多重线性的问题啊
追答你其他的变量是什么?我猜是dummy variables的问题。可能期间有重复,造成了多重线性。仔细检查一下dummy variables,还有,你是不是设置了常数项?
温馨提示:答案为网友推荐,仅供参考