跳转至

原作者: cc98 @camrxc

cc98链接

Chapter 6 统计量及抽样分布

总体与简单随机样本

统计量

统计量是指样本的不含任何未知参数的函数。注意,统计量是个随机变量。

样本均值

\[ \overline{X}=\frac{1}{n}\sum_{i=1}^{n}X_i \]

所有样本均值的平均值恰好是总体均值,\(E(\overline{X})=\mu,Var(\overline{X})=\frac{\sigma^2}{n}\)

样本方差

\[ S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2 \]

\(E(S^2)=\sigma^2\)

样本\(k\)阶(原点)矩

\[ A_k=\frac{1}{n}\sum_{i=1}^{n}X_i^k, k=1,2,... \]

样本\(k\)阶中心矩

\[ B_k=\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^k,k=2,3,... \]

样本二阶中心矩可以估计样本方差,但不是无偏估计

\(E(B_2)=\frac{n-1}{n}\sigma^2\)

\(\chi^2\)分布,\(t\)分布,\(F\)分布

\(\chi^2\)分布

​ 设\(X_1,X_2,\ldots,X_n\)为独立同分布的随机变量,且都服从标准正态分布\(N(0,1)\) 记: $$ Y=X_1^2+X_2^2+\ldots+X_n^2 $$ ​ 则称\(Y\)服从自由度为\(n\)\(\chi^2\)分布,记为\(Y\sim\chi^2(n)\),自由度\(n\)为右端包含的独立变量的个数,可理解为 $$ \chi^2(n)=N_1^2(0,1)+N_2^2(0,1)+...+N_n^2(0,1) $$

\(\chi^2\)​​​分布的性质

  1. 可加性:设\(Y_1\sim\chi^2(m),Y_2\sim\chi^2(n)\),若两者相互独立,则\(Y_1+Y_2\sim\chi^2(m+n)\)
  2. \(E(\chi^2(n))=n\)\(Var(\chi^2(n))=2n\)

\(t\)分布

​ 设\(X\sim N(0,1),Y\sim\chi^2(n)\),且\(X,Y\)相互独立,记: $$ T=\frac{X}{\sqrt{Y/n}} $$ ​ 则称\(t\)服从自由度为n的\(t\)分布,记为\(T\sim t(n)\)

\(t\)​分布的性质

  1. \(f_t(x)=f_t(-x)\),即密度函数为偶函数
  2. \(\lim\limits_{n\rightarrow+\infty}f_t(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\)
  3. \(T\sim t(n)\)\(-T\sim t(n)\)
  4. \(t_{1-\alpha}(n)=-t_\alpha(n)\)

\(F\)分布

​ 设\(X\sim\chi^2(n_1),Y\sim\chi^2(n_2)\),且\(X,Y\)相互独立,则称随机变量 $$ F=\frac{X/n1}{Y/n2} $$ 服从第一自由度为\(n_1\),第二自由度为\(n_2\)\(F\)分布,记为\(F\sim F(n1,n2)\)

\(F\)分布有如下性质:

  1. \(F\sim F(n1,n2)\),则\(1/{F}\sim F(n2,n1)\)
  2. \(X\sim t(n)\),则\(X^2\sim F(1,n)\)
  3. \(F_{\alpha}(n1,n2)=\frac{1}{F_{1-\alpha}(n2,n1)}\)

正态总体的抽样分布定理

单个正态总体的抽样分布

​ 设\(X_1,X_2,\ldots,X_n\)是来自正态分布总体\(N(\mu,\sigma^2)\)的简单随机样本,\(\overline X\)是样本均值,\(S^2\)​是样本方差,则

  1. \(\overline{X}\sim N(\mu,\frac{\sigma^2}{n})\),该结论不需要正态分布,独立同分布也成立

  2. \(E(S^2)=\sigma^2,Var(S^2)=\frac{2\sigma^4}{n-1}\)

  3. \(\frac{\sum_{i=1}^n(X_i-\overline{X})^2}{\sigma^2}=\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)\)

注意区分:\(\frac{\sum_{i=1}^n(X_i-\mu)^2}{\sigma^2}\sim \chi^2(n)\)\(\frac{\sum_{i=1}^n(X_i-\overline{X})^2}{\sigma^2}\sim \chi^2(n-1)\)

  1. \(\overline X与S^2\)​相互独立

  2. \(\frac{\bar X-\mu}{S/\sqrt{n}}\sim t(n-1)\)

两个正态总体的抽样分布

​ 设\(X_1,X_2,\ldots,X_{n1}\)是来自正态分布总体\(N_1(\mu_1,\sigma^2_1)\)的简单随机样本,\(Y_1,Y_2,\ldots,Y_{n2}\)是来自正态分布总体\(N_2(\mu_2,\sigma^2_2)\)的简单随机样本,样本相互独立,\(\overline X,\overline Y\)是样本均值,\(S_1^2,S_2^2\)​是样本方差,则

  1. \(\frac{S^2_1/\sigma^2_1}{S_2^2/\sigma^2_2}\sim F(n_1-1,n_2-1)\)

  2. \(\overline{X}-\overline{Y}\sim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})\)\(\frac{(\overline X-\overline Y)-(\mu_1-\mu_2) }{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1)\)

  3. \(\sigma_1^2=\sigma_2^2=\sigma^2\), $$ \frac{(\bar X-\bar Y)-(\mu_1-\mu_2) }{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) $$ 其中
    $$ S^2_w=\frac{(n_1-1)S^2_1+(n_2-1)S_2^2}{n_1+n_2-2},S_w=\sqrt{S^2_w} $$

可以用\(S_w^2\)来估计\(\sigma^2\)