本文编写于 697 天前,最后修改于 697 天前,其中某些信息可能已经过时。

最近要 SPSS 的期末的期末考试了,感觉完全没有头绪,的确会按照PPT上的步骤操作,但对于一个一个的数据,实在是有点看不懂,不懂得怎么分析,这里就记录一下 Regression 的分析过程

详细解释 Regression 分析

Regression的几个表格

Regression statistic 回归统计 Anova 方差分析 拟合测度 Residual output残差输出

以Excel为例

数据导入

我们先以EXCEL为例,毕竟是之前在课上记的笔记,然后再自己通过SPSS再回归一次,锻炼一下具体技能

我们以树木的树高 tree height 和 树墩子的直径 trunk diameter 为例 数据如下

tree height trunk diameter
35 8
49 9
27 7
33 6
60 13
21 7
45 11
51 12

首先在excel内先添加分析工具,具体怎么操作,百度吧

然后点击 数据-数据分析-回归

然后跳出了这个界面

X就是自变量,Y就是因变量,记得把表头给选上,然后可以按照我这里的来打勾,置信度这里设定成95%,算是比较宽松的条件了,如果想要线性回归的拟合图可以把图的多选框打勾,然后点确定

得到这样一个表

这里就是非常完整的回归表了,但这里也是很头疼的地方,看不懂对吧

我们先从最上面的一个表开始说起

回归统计

含义 数据含义
Multiple R 代表X与Y之间的关系强度 变量展现出88%的关系强度
R Square Pertentage change in y explained by x 22%的不可以用这些变量解释
Adjusted R Square R^2 adjusted in N and K
标准误差standard error overall distance between point and line / N
观测值Number of data Number of data 使用了共8个数据

ANOVA方差分析

ANOVA 代表着 Analysis of the variance方差分析

解释
df degree of freedom 自由度
SS sum of squares 平方和
MS mean of sum of squares 平方和的平均
F Fit test 适合度检验
Significance F probability my results are random 拒绝真实性概率
回归分析regression explained by line
残差residual not explain by line
总计total explain + not explained

这里 回归分析 df:k= 1 (能自由取值的变量个数,此处就一个x,所以是1)

残差的df:N-K-1=6

总计df:N -1 = 7

其他不管了

然后看Significance F

在这里,由于0.0033小于我们的置信度区间0.05的值,说明其不是随机的值,故而通过了测试,这个值很重要很Significant

拟合测度

什么意思
Intercept(拦截) 回归方程中常数
trunk diameter 自变量 x
Coefficient 系数
t stat T统计量 T检验的结果,t stat=回归系数/系数标准误差,假设检验时用于与临界值相比,越大越好,通过 T值进行标准正态分布查表可得P-value
P-value percentage probability my intercept is random,需要与置信度区间进行比较判断是否拒绝原假设,大于就拒绝原假设,说明 是 laji

这里通过系数一栏看出

y = -1.31+4.54x

然后不管,直接看P-value

intrecept p-value 为 0.89>0.05,故在95%的置信区间内,拒绝原假设,intercept is reject,这个intercept不产生显著关系

trunk diameter p-value 0.003< 0.05 故在95%的置信区间内,不拒绝原假设,not reject the slope,产生显著关系

单尾——单侧检验,检验是否正或负单方面是小概率事件. 双尾——双侧检验,检测是否正负双方面都是小概率事件.

以SPSS 为例

导入数据

线性回归

然后点击确定

得到

得到结果

然后这个就和第一个没啥区别了

解释SPSS

不解释了

分析建议

最后送上SPSSAU的一个分析逻辑

回归分析用于研究X(定量或定类)对Y(定量)的影响关系,是否有影响关系,影响方向及影响程度情况如何;

第一:首先分析模型拟合情况,即通过R平方值分析模型拟合情况,以及可对VIF值进行分析,判断模型是否存在共线性问题【共线性问题可使用岭回 归或者逐步回归进行解决】;

第二:写出模型公式(可选);

第三:分析X的显著性;如果呈现出显著性(P值小于0.05或0.01);则说明X对Y有影响关系,接着具体分析影响关系方向;

第四:结合回归系数B值,对比分析X对Y的影响程度(可选);

第五:对分析进行总结。 回归分析之前,可使用箱盒图查看是否有异常数据,或使用散点图直观展示X和Y之间的关联关系;回归分析之后,可使用正态图观察和展示保存的残 差值正态性情况;或使用散点图观察和展示回归模型异方差情况【残差与X间的散点完全没有关系则无异方差】。