数理统计
数理统计
核心定义
数理统计 是在样本基础上对总体参数进行推断的学科,核心包括 点估计、区间估计 和 假设检验。
统计量 是由样本观测值构成的函数,不含任何 未知参数。常见统计量:样本均值 X=n1∑i=1nXi,样本方差 S2= n−11∑i=1n(Xi−X)2(分母是 n−1 保证 无偏性)。
三大抽样分布:卡方分布 χ2(n)、t分布 t(n)、F分布 F(m,n),是正态总体下统计推断的基石。
点估计的评价标准:无偏性(E(θ^)=θ)、有效性(方差最小)、一致性(依概率收敛到真值)。
最大似然估计 的步骤:写似然函数 L(θ)、取对数 lnL(θ)、求导令其为零、解出 θ^。
假设检验的核心要素:原假设 H0、备择假设 H1、显著性水平 α(控制 第一类错误 概率上限)。
关键细节 / 操作步骤
- 第一步:先明确要估计或检验的 总体参数(μ、σ2、p 等)。
- 第二步:构造合适的 统计量,确认其抽样分布。
- 第三步:做 点估计 时,常用 最大似然估计 或 矩估计。
- 第四步:做 区间估计 时,先找 枢轴量(含参数但分布已知的函数),再写置信区间。
- 第五步:若题目给正态总体,方差已知用 Z 统计量,方差未知用 t 统计量。
- 第六步:若题目问方差检验,用 χ2 统计量(单总体)或 F 统计量(两总体比)。
- 第七步:若题目问无偏性,检查 E(θ^) 是否等于 θ。
- 第八步:若题目问有效性,比较无偏估计量的 方差 大小。
- 第九步:若题目做假设检验,先给 拒绝域 再给结论,注意单侧/双侧由 H1 方向决定。
- 第十步:若题目问第一类/第二类错误,记住:第一类 = 拒真(H0 真却拒绝),第二类 = 取伪(H0 假却接受)。
⚠️ 易错辨析
- 统计量不能含 未知参数——反例:σ/nX−μ 若 μ,σ 未知则不是统计量。
- 估计量是 随机变量,估计值是一个 具体数值,两者不是一回事。
- “拒绝 H0“不等于”证明 H1 绝对正确”——假设检验是基于样本证据的 拒绝机制,不是逻辑证明。
- 显著性水平 α 是 第一类错误概率上限,不是”检验正确率”——α 越小,检验越保守。
- P 值越小表示样本与 H0 越 不相容,不是”H0 为真的概率”——P 值本身不是概率陈述。
- 样本方差分母是 n−1 不是 n——用 n 得到的是有偏估计。
💡 技巧与口诀 口诀:先样本后参数,先统计量后估计,再看检验阈值。
应用场景:题目出现”置信区间、显著性检验、样本均值”,就优先识别分布模型和检验统计量。
小样本 + 总体方差未知 → 优先联想到 t分布。
两总体方差比检验 → 用 F分布。
最大似然估计三步:写 似然函数 → 取 对数 → 求导令其为零。
单侧与双侧检验的区别在于 备择假设 的方向——双侧用 =,单侧用 > 或 <。
📝 真题闭环 设 X1,…,Xn 来自正态总体 N(μ,σ2),σ2 未知。求 μ 的 95% 置信区间。
解题思路:审题抓”正态总体""方差未知""置信区间”,切入点是 t分布 枢轴量;枢轴量为 T=S/nX−μ∼ t(n−1);由 P(∣T∣<tα/2(n−1))=1−α 解出 μ 的范围。
答案:(X−tα/2(n−1)⋅nS,X+tα/2(n−1)⋅nS)。
cd ..