跳至正文

随机变量及其分布


随机变量及其分布

核心定义

随机变量 是把随机试验结果映射为数值的函数,分为 离散型随机变量 与 连续型随机变量 两类。

离散型用 概率质量函数(PMF)P(X=xk)=pkP(X=x_k)=p_k 描述,连续型用 概率密度函数(PDF)f(x)f(x) 描述,两者统一于 分布函数 F(x)=F(x)= P(Xx)P(X\le x)

分布函数 F(x)F(x) 的三条性质:单调不减右连续limxF(x)=\lim_{x\to-\infty}F(x)= 00limx+F(x)=\lim_{x\to+\infty}F(x)= 11

密度函数满足 f(x)0f(x)\ge 0+f(x)dx=\int_{-\infty}^{+\infty}f(x)\,dx= 11;密度值可以大于 1,但面积必须为 1。

连续型随机变量的单点概率:P(X=x)=P(X=x)= 00,这不等于”没有分布”。

常考四大分布:二项分布 B(n,p)B(n,p)、泊松分布 P(λ)P(\lambda)、正态分布 N(μ,σ2)N(\mu,\sigma^2)、指数分布 Exp(λ)Exp(\lambda)

关键细节 / 操作步骤

  1. 第一步:先判 离散/连续——看取值是否有限或可列。
  2. 第二步:离散型列 分布律,连续型写 密度函数
  3. 第三步:需要概率时用 F(x)F(x) 或直接 积分/求和
  4. 第四步:若题目给离散取值,先列出所有可能值及其概率,验证 pk=\sum p_k= 11
  5. 第五步:若题目给连续密度,先检查密度是否 非负 且积分为 1
  6. 第六步:若题目问分布函数,记住它是 累计概率,密度是它的导数。
  7. 第七步:若题目问随机变量变换 Y=g(X)Y=g(X),先找新变量与旧变量的 映射关系,再求新分布。
  8. 第八步:若题目问二项分布,识别关键词”独立重复试验""成功次数”。
  9. 第九步:若题目问泊松分布,识别关键词”单位时间/区域""稀疏事件计数”。
  10. 第十步:若题目问正态分布的标准化,用 Z=XμσZ=\dfrac{X-\mu}{\sigma} 转为 N(0,1)N(0,1)

⚠️ 易错辨析

  1. 分布函数 \neq 密度函数:F(x)F(x) 是累计概率,f(x)f(x) 是局部强度,F(x)=f(x)F'(x)=f(x)
  2. 离散型分布写法(列表/求和)和连续型分布写法(积分)不能混写。
  3. 密度函数 f(x)f(x) 可以大于 1,但积分必须等于 1——反例:f(x)=2f(x)=2[0,0.5][0,0.5] 上合法。
  4. 连续型 P(X=x)=0P(X=x)=0 不代表事件不可能发生,只代表”单点测度为零”。
  5. 分布函数一定 单调不减右连续,判断题常考这两个性质。

💡 技巧与口诀 口诀:离散看点,连续看面;先写分布,再算概率

应用场景:题目一旦出现”概率分布、密度、累计概率、取值范围”,先判断类型再选公式。

分布识别速查:固定次数独立重复 \to 二项分布;单位时间稀疏计数 \to 泊松分布;测量误差/大量叠加 \to 正态分布;等待时间 \to 指数分布

若题目问随机变量的分布,先从 定义域取值集合 下手,不要急着代公式。

📝 真题闭环XN(μ,σ2)X\sim N(\mu,\sigma^2),求 P(Xμ<σ)P(|X-\mu|<\sigma) 的近似值。

解题思路:审题抓”正态分布""区间概率”,切入点是 标准化;令 Z=XμσN(0,1)Z=\dfrac{X-\mu}{\sigma}\sim N(0,1),则 P(Xμ<σ)=P(Z<1)=P(|X-\mu|<\sigma)=P(|Z|<1)= Φ(1)Φ(1)=2Φ(1)10.6826\Phi(1)-\Phi(-1)=2\Phi(1)-1\approx0.6826

答案:0.6826\approx 0.6826(即 3σ3\sigma 原则中的第一个 σ\sigma 区间)。


cd ..