抽样分布

概念
常用统计量
三大抽样分布
正态总体中的抽样分布

概念

统计学利用概率论来研究具有随机性的现象。与概率论相反，通常研究对象的分布未知，需要通过样本数据的分析来确定服从什么分布。

总体顾名思义就是研究或考察对象的全体
总体中的每一个成员称为个体
总体中包含的个体数量叫做总体的容量
为了研究总体的特性从总体中抽出部分个体进行观察和试验，从总体中抽出的部分个体称为样本
统计量是包含了样本信息的函数
抽样分布研究统计量的分布，不包含未知参数且尽可能多地概括了样本信息。

常用统计量

样本均值 \(X\)
样本方差 \(S^2=\displaystyle\frac 1 {n-1} ...\)
样本标准差 \(S\)
样本 \(k\) 阶原点矩 \(A_k\)
样本 \(k\) 阶中心距 \(B_k\)
定理：\(EX=\mu, DX=\sigma^2\)，则有 \(E\overline X = \mu, D\overline X = \sigma^2 /n, ES^2 = \sigma^2\)

三大抽样分布

独立随机变量 \(X_{1..n}\) 都服从 \(N(0,1)\)，则 \(\chi^2 = \displaystyle \sum_{ i = 1 }^{ n } X_i^2\) 服从自由度为 \(n\) 的 \(\chi^2\) 分布。性质：\(E(\chi^2) = n, D(\chi^2) = 2n\)，可加性
设 \(X\sim N(0,1), Y \sim \chi^2(n)\) 且相互独立，则 \(T=\displaystyle \frac{X}{ \sqrt{\frac Y n}}\) 服从自由度为 \(n\) 的 \(t\) 分布。
两个相互独立的 \(\chi^2\) 分布的比称为 \(F\) 分布，即 \(X \sim \chi^2(n_1),Y \sim \chi^2(n_2)\)，则 \(F = \frac{X/n_1} {Y/n_2}\) 服从 \(F(n_1,n_2)\) 分布。

例：\((X,Y,Z)\)，它们相互独立，分别服从 \(N(0,1)\)，则 \(X^2 + Y^2 + Z^2 \sim \chi^2(3)\)，\(\displaystyle\frac{X} {\sqrt{(Y^2 + Z^2)/2}} \sim t(2)\)，\(\displaystyle\frac{2X^2} {Y^2 + Z^2} \sim F(1, 2)\)

正态总体中的抽样分布

考虑 \(X\sim N(\mu, \sigma^2), X_i\sim N(\mu_i, \sigma_i^2)\)，相互独立

（以下表述为了方便理解记忆，严谨化请自行移项）

样本均值分布：\(X \sim N(\mu,\displaystyle\frac{\sigma^2}{n})\)
样本均值差的分布：\(\bar{X_1}-\bar{X_2} \sim N(\mu_1-\mu_2,\displaystyle\frac{\sigma_1^2}{n_1}+\displaystyle\frac{\sigma_2^2}{n_2})\)
样本方差的分布：\({(n-1)S^2} \sim \chi^2(n-1){\sigma^2}\)
样本方差比的分布：\(\displaystyle\frac{S_x^2}{S_y^2} \sim \displaystyle\frac{\sigma_1^2}{\sigma_2^2} F(n_1-1,n_2-1)\)
样本 \(B_2\) 分布：\(\displaystyle \sum_{i=1}^n (X_i-\overline X)^2 \sim \sigma^2 \chi^2(n-1)\)
样本均值分布（用 \(S\)）：\(\displaystyle \frac {\overline X - \mu} {\displaystyle \frac S {\sqrt n}} \sim t(n-1)\)
\(\sigma_1=\sigma_2=\sigma\) 时，均值差的分布（用 \(S\)）（打不动了）

数理基础

抽样分布

概念

常用统计量

三大抽样分布

正态总体中的抽样分布

相关

标签