跳至正文

数理统计


数理统计

核心定义

数理统计 是在样本基础上对总体参数进行推断的学科,核心包括 点估计、区间估计 和 假设检验。

统计量 是由样本观测值构成的函数,不含任何 未知参数。常见统计量:样本均值 X=1ni=1nXi\overline{X}=\dfrac{1}{n}\sum_{i=1}^n X_i,样本方差 S2=S^2= 1n1i=1n(XiX)2\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2(分母是 n1n-1 保证 无偏性)。

三大抽样分布:卡方分布 χ2(n)\chi^2(n)、t分布 t(n)t(n)、F分布 F(m,n)F(m,n),是正态总体下统计推断的基石。

点估计的评价标准:无偏性E(θ^)=θE(\hat{\theta})=\theta)、有效性(方差最小)、一致性(依概率收敛到真值)。

最大似然估计 的步骤:写似然函数 L(θ)L(\theta)、取对数 lnL(θ)\ln L(\theta)、求导令其为零、解出 θ^\hat{\theta}

假设检验的核心要素:原假设 H0H_0、备择假设 H1H_1、显著性水平 α\alpha(控制 第一类错误 概率上限)。

关键细节 / 操作步骤

  1. 第一步:先明确要估计或检验的 总体参数μ\muσ2\sigma^2pp 等)。
  2. 第二步:构造合适的 统计量,确认其抽样分布。
  3. 第三步:做 点估计 时,常用 最大似然估计 或 矩估计。
  4. 第四步:做 区间估计 时,先找 枢轴量(含参数但分布已知的函数),再写置信区间。
  5. 第五步:若题目给正态总体,方差已知用 ZZ 统计量,方差未知用 tt 统计量
  6. 第六步:若题目问方差检验,用 χ2\chi^2 统计量(单总体)或 FF 统计量(两总体比)。
  7. 第七步:若题目问无偏性,检查 E(θ^)E(\hat{\theta}) 是否等于 θ\theta
  8. 第八步:若题目问有效性,比较无偏估计量的 方差 大小。
  9. 第九步:若题目做假设检验,先给 拒绝域 再给结论,注意单侧/双侧由 H1H_1 方向决定。
  10. 第十步:若题目问第一类/第二类错误,记住:第一类 = 拒真H0H_0 真却拒绝),第二类 = 取伪H0H_0 假却接受)。

⚠️ 易错辨析

  1. 统计量不能含 未知参数——反例:Xμσ/n\dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}μ,σ\mu,\sigma 未知则不是统计量。
  2. 估计量是 随机变量,估计值是一个 具体数值,两者不是一回事。
  3. “拒绝 H0H_0“不等于”证明 H1H_1 绝对正确”——假设检验是基于样本证据的 拒绝机制,不是逻辑证明。
  4. 显著性水平 α\alpha第一类错误概率上限,不是”检验正确率”——α\alpha 越小,检验越保守。
  5. P 值越小表示样本与 H0H_0不相容,不是”H0H_0 为真的概率”——P 值本身不是概率陈述。
  6. 样本方差分母是 n1n-1 不是 nn——用 nn 得到的是有偏估计。

💡 技巧与口诀 口诀:先样本后参数,先统计量后估计,再看检验阈值

应用场景:题目出现”置信区间、显著性检验、样本均值”,就优先识别分布模型和检验统计量。

小样本 + 总体方差未知 \to 优先联想到 t分布。

两总体方差比检验 \to 用 F分布。

最大似然估计三步:写 似然函数 \to对数 \to 求导令其为零。

单侧与双侧检验的区别在于 备择假设 的方向——双侧用 \neq,单侧用 >><<

📝 真题闭环X1,,XnX_1,\dots,X_n 来自正态总体 N(μ,σ2)N(\mu,\sigma^2)σ2\sigma^2 未知。求 μ\mu95%95\% 置信区间。

解题思路:审题抓”正态总体""方差未知""置信区间”,切入点是 t分布 枢轴量;枢轴量为 T=XμS/nT=\dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n1)t(n-1);由 P(T<tα/2(n1))=1αP(|T|<t_{\alpha/2}(n-1))=1-\alpha 解出 μ\mu 的范围。

答案:(Xtα/2(n1)Sn,  X+tα/2(n1)Sn)\left(\overline{X}-t_{\alpha/2}(n-1)\cdot\dfrac{S}{\sqrt{n}},\;\overline{X}+t_{\alpha/2}(n-1)\cdot\dfrac{S}{\sqrt{n}}\right)


cd ..