原作者: cc98 @camrxc
Chapter 6 统计量及抽样分布
总体与简单随机样本
统计量
统计量是指样本的不含任何未知参数的函数。注意,统计量是个随机变量。
样本均值
所有样本均值的平均值恰好是总体均值,\(E(\overline{X})=\mu,Var(\overline{X})=\frac{\sigma^2}{n}\)
样本方差
\(E(S^2)=\sigma^2\)
样本\(k\)阶(原点)矩
样本\(k\)阶中心矩
样本二阶中心矩可以估计样本方差,但不是无偏估计
\(E(B_2)=\frac{n-1}{n}\sigma^2\)
\(\chi^2\)分布,\(t\)分布,\(F\)分布
\(\chi^2\)分布
设\(X_1,X_2,\ldots,X_n\)为独立同分布的随机变量,且都服从标准正态分布\(N(0,1)\) 记: $$ Y=X_1^2+X_2^2+\ldots+X_n^2 $$ 则称\(Y\)服从自由度为\(n\)的\(\chi^2\)分布,记为\(Y\sim\chi^2(n)\),自由度\(n\)为右端包含的独立变量的个数,可理解为 $$ \chi^2(n)=N_1^2(0,1)+N_2^2(0,1)+...+N_n^2(0,1) $$
\(\chi^2\)分布的性质
- 可加性:设\(Y_1\sim\chi^2(m),Y_2\sim\chi^2(n)\),若两者相互独立,则\(Y_1+Y_2\sim\chi^2(m+n)\)
- \(E(\chi^2(n))=n\),\(Var(\chi^2(n))=2n\)
\(t\)分布
设\(X\sim N(0,1),Y\sim\chi^2(n)\),且\(X,Y\)相互独立,记: $$ T=\frac{X}{\sqrt{Y/n}} $$ 则称\(t\)服从自由度为n的\(t\)分布,记为\(T\sim t(n)\)
\(t\)分布的性质
- \(f_t(x)=f_t(-x)\),即密度函数为偶函数
- \(\lim\limits_{n\rightarrow+\infty}f_t(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\)
- \(T\sim t(n)\),\(-T\sim t(n)\)
- \(t_{1-\alpha}(n)=-t_\alpha(n)\)
\(F\)分布
设\(X\sim\chi^2(n_1),Y\sim\chi^2(n_2)\),且\(X,Y\)相互独立,则称随机变量 $$ F=\frac{X/n1}{Y/n2} $$ 服从第一自由度为\(n_1\),第二自由度为\(n_2\)的\(F\)分布,记为\(F\sim F(n1,n2)\)
\(F\)分布有如下性质:
- 若\(F\sim F(n1,n2)\),则\(1/{F}\sim F(n2,n1)\)
- 若\(X\sim t(n)\),则\(X^2\sim F(1,n)\)
- \(F_{\alpha}(n1,n2)=\frac{1}{F_{1-\alpha}(n2,n1)}\)
正态总体的抽样分布定理
单个正态总体的抽样分布
设\(X_1,X_2,\ldots,X_n\)是来自正态分布总体\(N(\mu,\sigma^2)\)的简单随机样本,\(\overline X\)是样本均值,\(S^2\)是样本方差,则
-
\(\overline{X}\sim N(\mu,\frac{\sigma^2}{n})\),该结论不需要正态分布,独立同分布也成立
-
\(E(S^2)=\sigma^2,Var(S^2)=\frac{2\sigma^4}{n-1}\)
-
\(\frac{\sum_{i=1}^n(X_i-\overline{X})^2}{\sigma^2}=\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)\)
注意区分:\(\frac{\sum_{i=1}^n(X_i-\mu)^2}{\sigma^2}\sim \chi^2(n)\)和\(\frac{\sum_{i=1}^n(X_i-\overline{X})^2}{\sigma^2}\sim \chi^2(n-1)\)
-
\(\overline X与S^2\)相互独立
-
\(\frac{\bar X-\mu}{S/\sqrt{n}}\sim t(n-1)\)
两个正态总体的抽样分布
设\(X_1,X_2,\ldots,X_{n1}\)是来自正态分布总体\(N_1(\mu_1,\sigma^2_1)\)的简单随机样本,\(Y_1,Y_2,\ldots,Y_{n2}\)是来自正态分布总体\(N_2(\mu_2,\sigma^2_2)\)的简单随机样本,样本相互独立,\(\overline X,\overline Y\)是样本均值,\(S_1^2,S_2^2\)是样本方差,则
-
\(\frac{S^2_1/\sigma^2_1}{S_2^2/\sigma^2_2}\sim F(n_1-1,n_2-1)\)
-
\(\overline{X}-\overline{Y}\sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})\),\(\frac{(\overline X-\overline Y)-(\mu_1-\mu_2) }{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1)\)
-
若\(\sigma_1^2=\sigma_2^2=\sigma^2\), $$ \frac{(\bar X-\bar Y)-(\mu_1-\mu_2) }{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) $$ 其中
$$ S^2_w=\frac{(n_1-1)S^2_1+(n_2-1)S_2^2}{n_1+n_2-2},S_w=\sqrt{S^2_w} $$
可以用\(S_w^2\)来估计\(\sigma^2\)