Chapter8 假设检验
假设
检验统计量与拒绝域
拒绝原假设\(H_0\)的样本值范围称为拒绝域
① 根据要检验的参数,选择对应的检验统计量\(G\)(下表以双边检验为例)
分布名称 | 原假设 | 条件 | 检验统计量 |
---|---|---|---|
单个正态总体 | \(\mu = \mu_0\) | \(\sigma^2\) 已知 | \(Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)\) |
单个正态总体 | \(\mu = \mu_0\) | \(\sigma^2\) 未知 | \(T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \sim t(n-1)\) |
单个正态总体 | \(\sigma^2 = \sigma_0^2\) | —— | \(\frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)\) |
两个正态总体 | \(\mu_1 = \mu_2\) | \(\sigma_1^2,\sigma_2^2\) 已知 | \(Z = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)\) |
两个正态总体 | \(\mu_1 = \mu_2\) | \(\sigma_1^2=\sigma_2^2=\sigma^2\) 未知 | \(T = \frac{\overline{X} - \overline{Y}}{S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)\) |
两个正态总体 | \(\sigma_1^2 = \sigma_2^2\) | —— | \(\frac{S_1^2}{S_2^2}\sim F(n_1-1, n_2-1)\) |
② 根据检验类型,选取对应的拒绝域公式并计算
检验类型 | 条件 | 拒绝域 |
---|---|---|
左侧检验 | \(H_0: \theta \geq \theta_0\) | \(W = \{G_0 < g_{1-\alpha}\}\) |
右侧检验 | \(H_0: \theta \leq \theta_0\) | \(W = \{G_0 > g_{\alpha}\}\) |
双侧检验 | \(H_0: \theta = \theta_0\) | \(W = \{\vert G_0 \vert > g_{\alpha/2}\}\) (\(\mu\)相关) |
双侧检验 | \(H_0: \theta = \theta_0\) | \(W=\{G_0<g_{1-\frac{\alpha}{2}}\cup G_0>g_\frac{\alpha}{2}\}\) (σ²相关) (通用) |
③ 计算枢轴量\(G_0\) ,如果落在了拒绝域内,就拒绝原假设
P-值假设检验
① 根据要检验的参数,选择对应的检验统计量\(G\)(下表以双边检验为例)
分布名称 | 原假设 | 条件 | 检验统计量 |
---|---|---|---|
单个正态总体 | \(\mu = \mu_0\) | \(\sigma^2\) 已知 | \(Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)\) |
单个正态总体 | \(\mu = \mu_0\) | \(\sigma^2\) 未知 | \(T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \sim t(n-1)\) |
单个正态总体 | \(\sigma^2 = \sigma_0^2\) | —— | \(\frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)\) |
两个正态总体 | \(\mu_1 = \mu_2\) | \(\sigma_1^2,\sigma_2^2\) 已知 | \(Z = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)\) |
两个正态总体 | \(\mu_1 = \mu_2\) | \(\sigma_1^2=\sigma_2^2=\sigma^2\) 未知 | \(T = \frac{\overline{X} - \overline{Y} }{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)\) |
两个正态总体 | \(\sigma_1^2 = \sigma_2^2\) | —— | \(\frac{S_1^2}{S_2^2}\sim F(n_1-1, n_2-1)\) |
② 根据检验类型,选取对应的\(P-\)值公式并计算
检验类型 | 条件 | P-值公式 |
---|---|---|
左侧检验 | \(H_0: \theta \geq \theta_0\) | \(P_- = P\{g < G_0\}\) |
右侧检验 | \(H_0: \theta \leq \theta_0\) | \(P_- = P\{g > G_0\}\) |
双侧检验 | \(H_0: \theta = \theta_0\) | \(P-=2P\{g>\vert G_0 \vert \}\) (\(\mu\)相关) |
双侧检验 | \(H_0: \theta = \theta_0\) | \(P_- = 2\min\{P(g > G_0), P(g < G_0)\}\) (σ²相关) (通用) |
在试卷第一页抬头寻找 \(g_A = G_0\),则:\(P(g < G_0) = 1 - A\),\(P(g > G_0) = A\)
③ 如果\(P-\le\alpha\),则拒绝原假设
拟合优度检验
已知总体X的大量样本数据,使用拟合优度检验判断X是否服从指定分布。
1.将 \(X\) 的取值范围划分为 \(k\) 个区间,获得各个区间内数据数量 \(n_i\):(实际频数)
如果 \(X\) 是连续型,则要将将 \(X\) 的取值范围划分为 \(k\) 个区间(题目已经划分好了)
2.假设 \(X\) 服从该分布,计算 \(X\) 在各个区间内的理论频数 \(np_i\)
\(n\) 为样本数, \(p_i\) 为 \(X\) 落在区间 \(i\) 的概率如果分布含有未知参数,则先用极大似然法估出参数(这种情况题目一般会设两问)
3.计算统计量 \(\chi^2\),若 \(\chi^2 \leq \chi_\alpha^2(k-1)\),则接受原假设,否则拒绝原假设
拟合优度统计量 $$ \chi^2 = \sum_{i=1}^{k} \frac{(n_i - np_i)^2}{np_i} $$