最近要 SPSS 的期末的期末考试了,感觉完全没有头绪,的确会按照PPT上的步骤操作,但对于一个一个的数据,实在是有点看不懂,不懂得怎么分析,这里就记录一下 Regression 的分析过程
详细解释 Regression 分析
Regression的几个表格
Regression statistic 回归统计 Anova 方差分析 拟合测度 Residual output残差输出
以Excel为例
数据导入
我们先以EXCEL为例,毕竟是之前在课上记的笔记,然后再自己通过SPSS再回归一次,锻炼一下具体技能
我们以树木的树高 tree height 和 树墩子的直径 trunk diameter 为例 数据如下
tree height | trunk diameter |
---|---|
35 | 8 |
49 | 9 |
27 | 7 |
33 | 6 |
60 | 13 |
21 | 7 |
45 | 11 |
51 | 12 |
首先在excel内先添加分析工具,具体怎么操作,百度吧
然后点击 数据-数据分析-回归

然后跳出了这个界面

X就是自变量,Y就是因变量,记得把表头给选上,然后可以按照我这里的来打勾,置信度这里设定成95%,算是比较宽松的条件了,如果想要线性回归的拟合图可以把图的多选框打勾,然后点确定
得到这样一个表

这里就是非常完整的回归表了,但这里也是很头疼的地方,看不懂对吧
我们先从最上面的一个表开始说起
回归统计

含义 | 数据含义 | |
---|---|---|
Multiple R | 代表X与Y之间的关系强度 | 变量展现出88%的关系强度 |
R Square | Pertentage change in y explained by x | 22%的不可以用这些变量解释 |
Adjusted R Square | R^2 adjusted in N and K | |
标准误差standard error | overall distance between point and line / N | |
观测值Number of data | Number of data | 使用了共8个数据 |
ANOVA方差分析
ANOVA
代表着 Analysis of the variance
方差分析

解释 | |
---|---|
df | degree of freedom 自由度 |
SS | sum of squares 平方和 |
MS | mean of sum of squares 平方和的平均 |
F | Fit test 适合度检验 |
Significance F | probability my results are random 拒绝真实性概率 |
回归分析regression | explained by line |
残差residual | not explain by line |
总计total | explain + not explained |
这里 回归分析 df:k= 1 (能自由取值的变量个数,此处就一个x,所以是1)
残差的df:N-K-1=6
总计df:N -1 = 7
其他不管了
然后看Significance F
在这里,由于0.0033小于我们的置信度区间0.05的值,说明其不是随机的值,故而通过了测试,这个值很重要很Significant
拟合测度

什么意思 | |
---|---|
Intercept(拦截) | 回归方程中常数 |
trunk diameter | 自变量 x |
Coefficient | 系数 |
t stat | T统计量 T检验的结果,t stat=回归系数/系数标准误差,假设检验时用于与临界值相比,越大越好,通过 T值进行标准正态分布查表可得P-value |
P-value | percentage probability my intercept is random,需要与置信度区间进行比较判断是否拒绝原假设,大于就拒绝原假设,说明 是 laji |
这里通过系数一栏看出
然后不管,直接看P-value
intrecept p-value 为 0.89>0.05,故在95%的置信区间内,拒绝原假设,intercept is reject,这个intercept不产生显著关系
trunk diameter p-value 0.003< 0.05 故在95%的置信区间内,不拒绝原假设,not reject the slope,产生显著关系
单尾——单侧检验,检验是否正或负单方面是小概率事件. 双尾——双侧检验,检测是否正负双方面都是小概率事件.
以SPSS 为例
导入数据

线性回归



然后点击确定
得到
得到结果


然后这个就和第一个没啥区别了
解释SPSS
不解释了



分析建议
最后送上SPSSAU的一个分析逻辑
回归分析用于研究X(定量或定类)对Y(定量)的影响关系,是否有影响关系,影响方向及影响程度情况如何;
第一:首先分析模型拟合情况,即通过R平方值分析模型拟合情况,以及可对VIF值进行分析,判断模型是否存在共线性问题【共线性问题可使用岭回 归或者逐步回归进行解决】;
第二:写出模型公式(可选);
第三:分析X的显著性;如果呈现出显著性(P值小于0.05或0.01);则说明X对Y有影响关系,接着具体分析影响关系方向;
第四:结合回归系数B值,对比分析X对Y的影响程度(可选);
第五:对分析进行总结。 回归分析之前,可使用箱盒图查看是否有异常数据,或使用散点图直观展示X和Y之间的关联关系;回归分析之后,可使用正态图观察和展示保存的残 差值正态性情况;或使用散点图观察和展示回归模型异方差情况【残差与X间的散点完全没有关系则无异方差】。