抽样分布


目录
  • 概念
  • 常用统计量
  • 三大抽样分布
  • 正态总体中的抽样分布

概念

统计学利用概率论来研究具有随机性的现象。与概率论相反,通常研究对象的分布未知,需要通过样本数据的分析来确定服从什么分布。

  • 总体顾名思义就是研究或考察对象的全体

  • 总体中的每一个成员称为个体

  • 总体中包含的个体数量叫做总体的容量

  • 为了研究总体的特性从总体中抽出部分个体进行观察和试验,从总体中抽出的部分个体称为样本

  • 统计量是包含了样本信息的函数

  • 抽样分布研究统计量的分布,不包含未知参数且尽可能多地概括了样本信息。

常用统计量

  • 样本均值 \(X\)

  • 样本方差 \(S^2=\displaystyle\frac 1 {n-1} ...\)

  • 样本标准差 \(S\)

  • 样本 \(k\) 阶原点矩 \(A_k\)

  • 样本 \(k\) 阶中心距 \(B_k\)

  • 定理:\(EX=\mu, DX=\sigma^2\),则有 \(E\overline X = \mu, D\overline X = \sigma^2 /n, ES^2 = \sigma^2\)

三大抽样分布

  • 独立随机变量 \(X_{1..n}\) 都服从 \(N(0,1)\),则 \(\chi^2 = \displaystyle \sum_{ i = 1 }^{ n } X_i^2\) 服从自由度为 \(n\)\(\chi^2\) 分布。性质:\(E(\chi^2) = n, D(\chi^2) = 2n\),可加性

  • \(X\sim N(0,1), Y \sim \chi^2(n)\) 且相互独立,则 \(T=\displaystyle \frac{X}{ \sqrt{\frac Y n}}\) 服从自由度为 \(n\)\(t\) 分布。

  • 两个相互独立的 \(\chi^2\) 分布的比称为 \(F\) 分布,即 \(X \sim \chi^2(n_1),Y \sim \chi^2(n_2)\),则 \(F = \frac{X/n_1} {Y/n_2}\) 服从 \(F(n_1,n_2)\) 分布。

例:\((X,Y,Z)\),它们相互独立,分别服从 \(N(0,1)\),则 \(X^2 + Y^2 + Z^2 \sim \chi^2(3)\)\(\displaystyle\frac{X} {\sqrt{(Y^2 + Z^2)/2}} \sim t(2)\)\(\displaystyle\frac{2X^2} {Y^2 + Z^2} \sim F(1, 2)\)

正态总体中的抽样分布

考虑 \(X\sim N(\mu, \sigma^2), X_i\sim N(\mu_i, \sigma_i^2)\),相互独立

(以下表述为了方便理解记忆,严谨化请自行移项)

  • 样本均值分布:\(X \sim N(\mu,\displaystyle\frac{\sigma^2}{n})\)

  • 样本均值差的分布:\(\bar{X_1}-\bar{X_2} \sim N(\mu_1-\mu_2,\displaystyle\frac{\sigma_1^2}{n_1}+\displaystyle\frac{\sigma_2^2}{n_2})\)

  • 样本方差的分布:\({(n-1)S^2} \sim \chi^2(n-1){\sigma^2}\)

  • 样本方差比的分布:\(\displaystyle\frac{S_x^2}{S_y^2} \sim \displaystyle\frac{\sigma_1^2}{\sigma_2^2} F(n_1-1,n_2-1)\)

  • 样本 \(B_2\) 分布:\(\displaystyle \sum_{i=1}^n (X_i-\overline X)^2 \sim \sigma^2 \chi^2(n-1)\)

  • 样本均值分布(用 \(S\)):\(\displaystyle \frac {\overline X - \mu} {\displaystyle \frac S {\sqrt n}} \sim t(n-1)\)

  • \(\sigma_1=\sigma_2=\sigma\) 时,均值差的分布(用 \(S\))(打不动了)

相关