定义 6.1(总体与个体) 在数理统计中,将研究对象的全体称为总体,总体中的每个元素称为个体。
总体可以用一个随机变量 $X$ 来表示,$X$ 的分布称为总体分布。
例 6.1
定义 6.2(样本) 从总体中抽取的一部分个体称为样本(或子样),样本中所含个体的数目称为样本容量。
简单随机样本: 若样本 $X_1, X_2, \ldots, X_n$ 满足: 1. 每个 $X_i$ 与总体 $X$ 同分布 2. $X_1, X_2, \ldots, X_n$ 相互独立
则称其为简单随机样本,简称样本。
样本的联合分布:
定义 6.3(统计量) 设 $X_1, X_2, \ldots, X_n$ 是来自总体 $X$ 的样本,$g(X_1, X_2, \ldots, X_n)$ 是样本的函数。若 $g$ 中不含任何未知参数,则称 $g$ 为统计量。
统计量是随机变量,其分布称为抽样分布。
1. 样本均值 $$\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$$
2. 样本方差 $$S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2 = \frac{1}{n-1}\left(\sum_{i=1}^n X_i^2 - n\bar{X}^2\right)$$
样本标准差: $S = \sqrt{S^2}$
注: 分母用 $n-1$ 而非 $n$,是为了使 $E(S^2) = \sigma^2$(无偏性)。
3. 样本 $k$ 阶原点矩 $$A_k = \frac{1}{n}\sum_{i=1}^n X_i^k \quad (k = 1, 2, \ldots)$$
4. 样本 $k$ 阶中心矩 $$B_k = \frac{1}{n}\sum_{i=1}^n (X_i - \bar{X})^k \quad (k = 1, 2, \ldots)$$
5. 顺序统计量 将样本按大小排列:$X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$,则 $X_{(k)}$ 称为第 $k$ 个顺序统计量。
$$\tilde{X} = \begin{cases} X_{(\frac{n+1}{2})}, & n \text{ 奇} \\ \frac{1}{2}(X_{(\frac{n}{2})} + X_{(\frac{n}{2}+1)}), & n \text{ 偶} \end{cases}$$
定理 6.1 设 $X_1, X_2, \ldots, X_n$ 是来自总体 $N(\mu, \sigma^2)$ 的样本,则: 1. $\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$ 2. $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ 3. $\bar{X}$ 与 $S^2$ 相互独立
1. $\chi^2$ 分布(卡方分布)
定义 6.4($\chi^2$ 分布) 设 $X_1, X_2, \ldots, X_n$ 相互独立且都服从 $N(0, 1)$,则称 $$\chi^2 = X_1^2 + X_2^2 + \cdots + X_n^2$$ 服从自由度为 $n$ 的 $\chi^2$ 分布,记为 $\chi^2 \sim \chi^2(n)$。
性质:
2. $t$ 分布(学生氏分布)
定义 6.5($t$ 分布) 设 $X \sim N(0, 1)$,$Y \sim \chi^2(n)$,$X$ 与 $Y$ 独立,则称 $$T = \frac{X}{\sqrt{Y/n}}$$ 服从自由度为 $n$ 的 $t$ 分布,记为 $T \sim t(n)$。
性质:
3. $F$ 分布
定义 6.6($F$ 分布) 设 $U \sim \chi^2(n_1)$,$V \sim \chi^2(n_2)$,$U$ 与 $V$ 独立,则称 $$F = \frac{U/n_1}{V/n_2}$$ 服从自由度为 $(n_1, n_2)$ 的 $F$ 分布,记为 $F \sim F(n_1, n_2)$。
性质:
单正态总体: 设 $X_1, \ldots, X_n \sim N(\mu, \sigma^2)$,则
1. $Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)$
2. $T = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$
3. $\frac{(n-1)S^2}{\sigma^2} = \frac{1}{\sigma^2}\sum_{i=1}^n (X_i - \bar{X})^2 \sim \chi^2(n-1)$
双正态总体: 设 $X_1, \ldots, X_{n_1} \sim N(\mu_1, \sigma_1^2)$,$Y_1, \ldots, Y_{n_2} \sim N(\mu_2, \sigma_2^2)$,独立,则
1. 当 $\sigma_1^2 = \sigma_2^2 = \sigma^2$ 时: $$T = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)$$ 其中 $S_w^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}$
2. $\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1)$
定义 6.7(分位数) 设 $X$ 是随机变量,$\alpha \in (0, 1)$,若 $x_\alpha$ 满足 $$P(X > x_\alpha) = \alpha$$ 则称 $x_\alpha$ 为 $X$ 的上 $\alpha$ 分位数(或上侧 $\alpha$ 分位数)。
等价地:$P(X \leq x_\alpha) = 1 - \alpha$
常用分位数记号:
性质:
例题 6.1 设 $X_1, X_2, X_3, X_4$ 是来自总体 $N(0, 2^2)$ 的样本,令 $$Y = a(X_1 - 2X_2)^2 + b(3X_3 - 4X_4)^2$$ 求 $a, b$ 使 $Y \sim \chi^2(n)$,并确定 $n$。
解: $X_1 - 2X_2 \sim N(0, 4 + 16) = N(0, 20)$,$\frac{X_1 - 2X_2}{\sqrt{20}} \sim N(0, 1)$
$3X_3 - 4X_4 \sim N(0, 36 + 64) = N(0, 100)$,$\frac{3X_3 - 4X_4}{10} \sim N(0, 1)$
取 $a = \frac{1}{20}$,$b = \frac{1}{100}$,则 $Y \sim \chi^2(2)$,$n = 2$。
例题 6.2 设 $X_1, \ldots, X_n$ 是来自总体 $N(\mu, \sigma^2)$ 的样本,求 $E(S^2)$ 和 $D(S^2)$。
解: $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
$E\left(\frac{(n-1)S^2}{\sigma^2}\right) = n-1$,故 $E(S^2) = \sigma^2$
$D\left(\frac{(n-1)S^2}{\sigma^2}\right) = 2(n-1)$,故 $D(S^2) = \frac{2\sigma^4}{n-1}$
基础题
1. 设 $X_1, \ldots, X_{10}$ 是来自总体 $N(0, 0.3^2)$ 的样本,求 $P(\sum_{i=1}^{10} X_i^2 > 1.44)$。
2. 设 $X_1, X_2, X_3, X_4$ 是来自总体 $N(0, 1)$ 的样本,$Y = \frac{(X_1 + X_2)^2}{(X_3 - X_4)^2}$,求 $Y$ 的分布。
提高题
3. 设 $T \sim t(n)$,证明:$T^2 \sim F(1, n)$。
4. 设 $X_1, \ldots, X_n$ 是来自总体 $N(\mu, \sigma^2)$ 的样本,$\bar{X}$ 和 $S^2$ 分别是样本均值和样本方差。又设 $X_{n+1} \sim N(\mu, \sigma^2)$ 且与 $X_1, \ldots, X_n$ 独立,求统计量 $Y = \frac{X_{n+1} - \bar{X}}{S}\sqrt{\frac{n}{n+1}}$ 的分布。
挑战题
5. 设 $X_1, \ldots, X_n$ 是来自总体 $N(\mu, \sigma^2)$ 的样本,$\bar{X}_k = \frac{1}{k}\sum_{i=1}^k X_i$($1 \leq k < n$),求统计量 $T = \frac{\bar{X}_n - \bar{X}_k}{S_k}\sqrt{\frac{k(n-k)}{n}}$ 的分布,其中 $S_k^2 = \frac{1}{k-1}\sum_{i=1}^k (X_i - \bar{X}_k)^2$。
6. 设 $X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$ 是来自总体 $N(0, 1)$ 样本的顺序统计量,求 $E(X_{(n)})$ 和 $D(X_{(n)})$ 的近似表达式($n$ 较大时)。