本文编写于 443 天前,最后修改于 434 天前,其中某些信息可能已经过时。

如何理解假设检验中的假设设计?

直接看这个文档,就明白标准的做法了

关于假设检验如何选择备择假设和原假设

就以往的概括性理论而言,在单侧检验中一般将研究者想收集证据予以支持的假设作为备择假设H1。这就是说一个研究者想证明自己的研究结论是正确的,备择假设的方向就要与想要证明其正确性的方向一致;同时将研究者想收集证据证明其不正确的假设作为原假设H0 。

一定要把H1设计成自己想证明的内容,要立足观点

零假设Ho模型是不准确的两者没有显著性相关性,二者有显著性差异

备择假设Ha或H1模型是准确的两者有显著性相关性,二者没有显著性差异

如果最后的p-value>1-置信度区间如95%=0.05,则不拒绝原假设

如果呈现出显著性 (P 值小于 0.05 或 0.01),则reject null hypothesis,接受备择假设alternative hypothesis,模型是准确的两者有显著性相关性,二者没有显著性差异

但注意不拒绝原假设不等于接受原假设

举例

下面的例子1参考这个链接,其他例子也可以参考这个链接,写的非常好

中国石油大学经济管理学院-第8章假设检验

例1

一个汽车轮胎制造商声明,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于40000公里,对一个由15个轮胎组成的随机样本作了试验,得到的平均值和标准差分别为42000公里和5000公里。假定轮胎寿命的公里数近似服从正态分布,我们能否从这些数据作结论,该制造商的产品同他所说的标准相符?

答:

首先, 我们关心结果是否超越预期40000KM,所以这是一个右单侧检验。

40000是一个截点,左侧也就是小于等于40000是接收域,大于40000是拒绝域, H0选择原则:H0总是假定总体没有显著差异,或是H0落在接收域,所以结合你的问题, H0应该是总体均值≤40000, 根据公式算出检验统计量T = (42000-40000)/5000/sqrt(15)=1.549<1.64,没有落在拒绝域内,故无法拒绝原假设,无法接受对立假设,可以认为没有充足理由相信制造商的轮胎寿命和他的标准相符。

这题网上搜到的百度知道内的答案全是错的,我疑惑了好半天,最后看到文库里的教材才看到正确答案

假设检验中的两种错误

I类错误:原假设为真时,原假设被拒绝

II类错误:如果虚假假设为假,则不会拒绝原假设


类型错误I的预定概率为显着性水平

检验统计量的“临界值”是检验在给定的显着性水平上仅拒绝零假设的统计量的值。

检验拒绝其原假设的检验统计量的一组值是“拒绝区域”。

不拒绝原假设的检验统计量的值是接受区域

Two types of mistakes during the hypothesis test:

Type I error: the null hypothesis is rejected when it is true

Type II error: the null hypothesis is not rejected when it is false


The prespecified probability of a type error I is the significance level.

The critical value of the test statistic is the value of the statistic for which the test just rejects the null hypothesis at the given significance level.

•The set of values of the test statistic for which the test rejects the null hypothesis is the rejection region.

•The values of the test statistic for which it does not reject the null hypothesis is the acceptance region.

P 值的意义

  1. P值是一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。

  2. 拒绝原假设的最小显著性水平)。

  3. 观察到的(实例的) 显著性水平。

  4. 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

注意:

P值不是给定样本结果时原假设为真的概率,而是给定原假设为真时样本结果出现的概率。

P 值的计算

一般地,用X 表示检验的统计量,当H0 为真时,可由样本数据计算出该统计量的值C ,根据检验统计量X 的具体分布,通过查表可求出P 值。

正态分布表Z表查表地址

具体地说:左侧检验的P 值为检验统计量X 小于样本统计值C 的概率,即: P = P{ X < C};右侧检验的P 值为检验统计量X 大于样本统计值C 的概率: P = P{ X > C};双侧检验的P 值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍: P = 2P{ X > C} (当C 位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。

若X 服从正态分布和t 分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。

计算出P 值后,将给定的显著性水平α与P 值比较,就可作出检验的结论:

如果α > P 值,则在显著性水平α下拒绝原假设。

如果α ≤ P 值,则在显著性水平α下不拒绝原假设。

在实践中,当α = P 值时,也即统计量的值C 刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。

拒绝还是非拒绝的条件

先算T值

T_{actual}=\frac{\overline{Y}-\mu_{Y,0}}{\sqrt{\frac{s^2}{n}}}\\ 其中\mu是样本平均数,s^2为样本方差,n为样本数量

如果是二项分布

T_{actual}=\frac{P-\pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}}\\ 其中\pi_0是抽样概率

适用于两尾备择假设的规则

  • 如果│T_actual│> 1.96(显著性水平为5%,或p值小于5%),则拒绝H0

适用于单尾备择假设的规则(H_1:E(Y)>μ_Y,0; H_1:E(Y)<μ_Y,0):

  • p值= Pr_H_0(Z> T_actual)= 1-Φ(T_actual)

  • 如果 T_actual> 1.64(显着性水平为5%),则拒绝H0;

  • 如果 T_actual<-1.64(显着性水平为5%),则拒绝H0

Rule for two-tailed alternative test:

•Reject H0 if │ tactual │>1.96 (significance level is 5%, or p-value is less than 5%)

Rule for one-sided alternative test (H_1:E(Y)>μ_Y,0 ; H_1:E(Y)< μ_Y,0 ):

•p-value = Pr_H_0(Z> t_actual) = 1- Φ( t_actual )

•Reject H0 if tactual >1.64 (significance level is 5%) ; Reject H0 if tactual < -1.64 (significance level is 5%)

纯统计理论讲解过程

  1. 提出检验假设又称无效假设,符号是H0;备择假设的符号是H1。

    H0:样本与总体或样本与样本间的差异是由抽样误差引起的;

    H1:样本与总体或样本与样本间存在本质差异;

    预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01 [2] 。

  2. 选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等 。

  3. 根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到 。

  4. 注意问题

    1. 作假设检验之前,应注意资料本身是否有可比性 。
    2. 当差别有统计学意义时应注意这样的差别在实际应用中有无意义 。
    3. 根据资料类型和特点选用正确的假设检验方法 。
    4. 根据专业及经验确定是选用单侧检验还是双侧检验 。
    5. 判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性 。

参考

正态分布Z分布表

p-value

关于假设检验如何选择备择假设和原假设

中国石油大学经济管理学院-第8章假设检验

如何设置假设检验中的原假设H0?

有趣的书《女士品茶》

常用数学符号的 LaTeX 表示方法