数理统计

2026-05-25

数理统计

核心定义

数理统计是在样本基础上对总体参数进行推断的学科，核心包括点估计、区间估计和假设检验。

统计量是由样本观测值构成的函数，不含任何 未知参数。常见统计量：样本均值 $\overline{X}=\dfrac{1}{n}\sum_{i=1}^n X_i$ ，样本方差 $S^2=$ $\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2$ （分母是 $n-1$ 保证 无偏性）。

三大抽样分布：卡方分布 $\chi^2(n)$ 、t分布 $t(n)$ 、F分布 $F(m,n)$ ，是正态总体下统计推断的基石。

点估计的评价标准：无偏性（ $E(\hat{\theta})=\theta$ ）、有效性（方差最小）、一致性（依概率收敛到真值）。

最大似然估计的步骤：写似然函数 $L(\theta)$ 、取对数 $\ln L(\theta)$ 、求导令其为零、解出 $\hat{\theta}$ 。

假设检验的核心要素：原假设 $H_0$ 、备择假设 $H_1$ 、显著性水平 $\alpha$ （控制 第一类错误 概率上限）。

关键细节 / 操作步骤

第一步：先明确要估计或检验的 总体参数（ $\mu$ 、 $\sigma^2$ 、 $p$ 等）。
第二步：构造合适的统计量，确认其抽样分布。
第三步：做点估计时，常用最大似然估计或矩估计。
第四步：做区间估计时，先找 枢轴量（含参数但分布已知的函数），再写置信区间。
第五步：若题目给正态总体，方差已知用 $Z$ 统计量，方差未知用 $t$ 统计量。
第六步：若题目问方差检验，用 $\chi^2$ 统计量（单总体）或 $F$ 统计量（两总体比）。
第七步：若题目问无偏性，检查 $E(\hat{\theta})$ 是否等于 $\theta$ 。
第八步：若题目问有效性，比较无偏估计量的方差大小。
第九步：若题目做假设检验，先给 拒绝域 再给结论，注意单侧/双侧由 $H_1$ 方向决定。
第十步：若题目问第一类/第二类错误，记住：第一类 = 拒真（ $H_0$ 真却拒绝），第二类 = 取伪（ $H_0$ 假却接受）。

⚠️ 易错辨析

统计量不能含 未知参数——反例： $\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}$ 若 $\mu,\sigma$ 未知则不是统计量。

估计量是 随机变量，估计值是一个 具体数值，两者不是一回事。

“拒绝 $H_0$ “不等于”证明 $H_1$ 绝对正确”——假设检验是基于样本证据的 拒绝机制，不是逻辑证明。

显著性水平 $\alpha$ 是 第一类错误概率上限，不是”检验正确率”—— $\alpha$ 越小，检验越保守。

P 值越小表示样本与 $H_0$ 越 不相容，不是” $H_0$ 为真的概率”——P 值本身不是概率陈述。

样本方差分母是 $n-1$ 不是 $n$ ——用 $n$ 得到的是有偏估计。

💡 技巧与口诀 口诀：先样本后参数，先统计量后估计，再看检验阈值。

应用场景：题目出现”置信区间、显著性检验、样本均值”，就优先识别分布模型和检验统计量。

小样本 + 总体方差未知 $\to$ 优先联想到 t分布。

两总体方差比检验 $\to$ 用 F分布。

最大似然估计三步：写 似然函数 $\to$ 取对数 $\to$ 求导令其为零。

单侧与双侧检验的区别在于备择假设的方向——双侧用 $\neq$ ，单侧用 $>$ 或 $<$ 。

📝 真题闭环 设 $X_1,\dots,X_n$ 来自正态总体 $N(\mu,\sigma^2)$ ， $\sigma^2$ 未知。求 $\mu$ 的 $95\%$ 置信区间。

解题思路：审题抓”正态总体""方差未知""置信区间”，切入点是 t分布枢轴量；枢轴量为 $T=\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim$ $t(n-1)$ ；由 $P(|T|<t_{\alpha/2}(n-1))=1-\alpha$ 解出 $\mu$ 的范围。

答案： $\left(\overline{X}-t_{\alpha/2}(n-1)\cdot\dfrac{S}{\sqrt{n}},\;\overline{X}+t_{\alpha/2}(n-1)\cdot\dfrac{S}{\sqrt{n}}\right)$ 。

cd ..