Chapter8 假设检验

假设

拒绝原假设$H_0$的样本值范围称为拒绝域

① 根据要检验的参数，选择对应的检验统计量$G$（下表以双边检验为例）

分布名称	原假设	条件	检验统计量
单个正态总体	$\mu = \mu_0$	$\sigma^2$ 已知	$Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)$
单个正态总体	$\mu = \mu_0$	$\sigma^2$ 未知	$T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \sim t(n-1)$
单个正态总体	$\sigma^2 = \sigma_0^2$	——	$\frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)$
两个正态总体	$\mu_1 = \mu_2$	$\sigma_1^2,\sigma_2^2$ 已知	$Z = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)$
两个正态总体	$\mu_1 = \mu_2$	$\sigma_1^2=\sigma_2^2=\sigma^2$ 未知	$T = \frac{\overline{X} - \overline{Y}}{S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)$
两个正态总体	$\sigma_1^2 = \sigma_2^2$	——	$\frac{S_1^2}{S_2^2}\sim F(n_1-1, n_2-1)$

② 根据检验类型，选取对应的拒绝域公式并计算

检验类型	条件	拒绝域
左侧检验	$H_0: \theta \geq \theta_0$	$W = \{G_0 < g_{1-\alpha}\}$
右侧检验	$H_0: \theta \leq \theta_0$	$W = \{G_0 > g_{\alpha}\}$
双侧检验	$H_0: \theta = \theta_0$	$W = \{\vert G_0 \vert > g_{\alpha/2}\}$ （$\mu$相关）
双侧检验	$H_0: \theta = \theta_0$	$W=\{G_0<g_{1-\frac{\alpha}{2}}\cup G_0>g_\frac{\alpha}{2}\}$ (σ²相关) (通用)

③ 计算枢轴量$G_0$ ，如果落在了拒绝域内，就拒绝原假设

① 根据要检验的参数，选择对应的检验统计量$G$（下表以双边检验为例）

分布名称	原假设	条件	检验统计量
单个正态总体	$\mu = \mu_0$	$\sigma^2$ 已知	$Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)$
单个正态总体	$\mu = \mu_0$	$\sigma^2$ 未知	$T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \sim t(n-1)$
单个正态总体	$\sigma^2 = \sigma_0^2$	——	$\frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)$
两个正态总体	$\mu_1 = \mu_2$	$\sigma_1^2,\sigma_2^2$ 已知	$Z = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)$
两个正态总体	$\mu_1 = \mu_2$	$\sigma_1^2=\sigma_2^2=\sigma^2$ 未知	$T = \frac{\overline{X} - \overline{Y} }{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)$
两个正态总体	$\sigma_1^2 = \sigma_2^2$	——	$\frac{S_1^2}{S_2^2}\sim F(n_1-1, n_2-1)$

② 根据检验类型，选取对应的$P-$值公式并计算

在试卷第一页抬头寻找 $g_A = G_0$，则：$P(g < G_0) = 1 - A$，$P(g > G_0) = A$

③ 如果$P-\le\alpha$，则拒绝原假设

已知总体X的大量样本数据，使用拟合优度检验判断X是否服从指定分布。

1.将 $X$ 的取值范围划分为 $k$ 个区间，获得各个区间内数据数量 $n_i$：（实际频数）

如果 $X$ 是连续型，则要将将 $X$ 的取值范围划分为 $k$ 个区间（题目已经划分好了）

2.假设 $X$ 服从该分布，计算 $X$ 在各个区间内的理论频数 $np_i$

$n$ 为样本数， $p_i$ 为 $X$ 落在区间 $i$ 的概率如果分布含有未知参数，则先用极大似然法估出参数（这种情况题目一般会设两问）

3.计算统计量 $\chi^2$，若 $\chi^2 \leq \chi_\alpha^2(k-1)$，则接受原假设，否则拒绝原假设

拟合优度统计量 $$ \chi^2 = \sum_{i=1}^{k} \frac{(n_i - np_i)^2}{np_i} $$

分布名称	原假设	条件	检验统计量
单个正态总体	\(\mu = \mu_0\)	\(\sigma^2\) 已知	\(Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)\)
单个正态总体	\(\mu = \mu_0\)	\(\sigma^2\) 未知	\(T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \sim t(n-1)\)
单个正态总体	\(\sigma^2 = \sigma_0^2\)	——	\(\frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)\)
两个正态总体	\(\mu_1 = \mu_2\)	\(\sigma_1^2,\sigma_2^2\) 已知	\(Z = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)\)
两个正态总体	\(\mu_1 = \mu_2\)	\(\sigma_1^2=\sigma_2^2=\sigma^2\) 未知	\(T = \frac{\overline{X} - \overline{Y}}{S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)\)
两个正态总体	\(\sigma_1^2 = \sigma_2^2\)	——	\(\frac{S_1^2}{S_2^2}\sim F(n_1-1, n_2-1)\)

检验类型	条件	拒绝域
左侧检验	\(H_0: \theta \geq \theta_0\)	\(W = \{G_0 < g_{1-\alpha}\}\)
右侧检验	\(H_0: \theta \leq \theta_0\)	\(W = \{G_0 > g_{\alpha}\}\)
双侧检验	\(H_0: \theta = \theta_0\)	\(W = \{\vert G_0 \vert > g_{\alpha/2}\}\) （\(\mu\)相关）
双侧检验	\(H_0: \theta = \theta_0\)	\(W=\{G_0<g_{1-\frac{\alpha}{2}}\cup G_0>g_\frac{\alpha}{2}\}\) (σ²相关) (通用)

分布名称	原假设	条件	检验统计量
单个正态总体	\(\mu = \mu_0\)	\(\sigma^2\) 已知	\(Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)\)
单个正态总体	\(\mu = \mu_0\)	\(\sigma^2\) 未知	\(T = \frac{\overline{X} - \mu_0}{S / \sqrt{n}} \sim t(n-1)\)
单个正态总体	\(\sigma^2 = \sigma_0^2\)	——	\(\frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1)\)
两个正态总体	\(\mu_1 = \mu_2\)	\(\sigma_1^2,\sigma_2^2\) 已知	\(Z = \frac{\overline{X} - \overline{Y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)\)
两个正态总体	\(\mu_1 = \mu_2\)	\(\sigma_1^2=\sigma_2^2=\sigma^2\) 未知	\(T = \frac{\overline{X} - \overline{Y} }{S_w \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)\)
两个正态总体	\(\sigma_1^2 = \sigma_2^2\)	——	\(\frac{S_1^2}{S_2^2}\sim F(n_1-1, n_2-1)\)