抽样分布
- 概念
- 常用统计量
- 三大抽样分布
- 正态总体中的抽样分布
概念
统计学利用概率论来研究具有随机性的现象。与概率论相反,通常研究对象的分布未知,需要通过样本数据的分析来确定服从什么分布。
-
总体顾名思义就是研究或考察对象的全体
-
总体中的每一个成员称为个体
-
总体中包含的个体数量叫做总体的容量
-
为了研究总体的特性从总体中抽出部分个体进行观察和试验,从总体中抽出的部分个体称为样本
-
统计量是包含了样本信息的函数
-
抽样分布研究统计量的分布,不包含未知参数且尽可能多地概括了样本信息。
常用统计量
-
样本均值 \(X\)
-
样本方差 \(S^2=\displaystyle\frac 1 {n-1} ...\)
-
样本标准差 \(S\)
-
样本 \(k\) 阶原点矩 \(A_k\)
-
样本 \(k\) 阶中心距 \(B_k\)
-
定理:\(EX=\mu, DX=\sigma^2\),则有 \(E\overline X = \mu, D\overline X = \sigma^2 /n, ES^2 = \sigma^2\)
三大抽样分布
-
独立随机变量 \(X_{1..n}\) 都服从 \(N(0,1)\),则 \(\chi^2 = \displaystyle \sum_{ i = 1 }^{ n } X_i^2\) 服从自由度为 \(n\) 的 \(\chi^2\) 分布。性质:\(E(\chi^2) = n, D(\chi^2) = 2n\),可加性
-
设 \(X\sim N(0,1), Y \sim \chi^2(n)\) 且相互独立,则 \(T=\displaystyle \frac{X}{ \sqrt{\frac Y n}}\) 服从自由度为 \(n\) 的 \(t\) 分布。
-
两个相互独立的 \(\chi^2\) 分布的比称为 \(F\) 分布,即 \(X \sim \chi^2(n_1),Y \sim \chi^2(n_2)\),则 \(F = \frac{X/n_1} {Y/n_2}\) 服从 \(F(n_1,n_2)\) 分布。
例:\((X,Y,Z)\),它们相互独立,分别服从 \(N(0,1)\),则 \(X^2 + Y^2 + Z^2 \sim \chi^2(3)\),\(\displaystyle\frac{X} {\sqrt{(Y^2 + Z^2)/2}} \sim t(2)\),\(\displaystyle\frac{2X^2} {Y^2 + Z^2} \sim F(1, 2)\)
正态总体中的抽样分布
考虑 \(X\sim N(\mu, \sigma^2), X_i\sim N(\mu_i, \sigma_i^2)\),相互独立
(以下表述为了方便理解记忆,严谨化请自行移项)
-
样本均值分布:\(X \sim N(\mu,\displaystyle\frac{\sigma^2}{n})\)
-
样本均值差的分布:\(\bar{X_1}-\bar{X_2} \sim N(\mu_1-\mu_2,\displaystyle\frac{\sigma_1^2}{n_1}+\displaystyle\frac{\sigma_2^2}{n_2})\)
-
样本方差的分布:\({(n-1)S^2} \sim \chi^2(n-1){\sigma^2}\)
-
样本方差比的分布:\(\displaystyle\frac{S_x^2}{S_y^2} \sim \displaystyle\frac{\sigma_1^2}{\sigma_2^2} F(n_1-1,n_2-1)\)
-
样本 \(B_2\) 分布:\(\displaystyle \sum_{i=1}^n (X_i-\overline X)^2 \sim \sigma^2 \chi^2(n-1)\)
-
样本均值分布(用 \(S\)):\(\displaystyle \frac {\overline X - \mu} {\displaystyle \frac S {\sqrt n}} \sim t(n-1)\)
-
\(\sigma_1=\sigma_2=\sigma\) 时,均值差的分布(用 \(S\))(打不动了)