本文是由AI生成后,经作者优化整理的文章。个人总结,仅限参考!
以下整理了概率论中的常用符号和公式表格,覆盖基础知识、关键定理和常用分布:
一、基础集合与事件符号
符号名称含义/公式说明SSS样本空间所有可能结果的集合全集ω\omegaω样本点SSS 中的元素基本事件A,BA, BA,B事件SSS 的子集可能发生的结果集合AcA^cAc补事件S−AS - AS−AAAA 不发生A∩BA \cap BA∩B事件交AAA 与 BBB 同时发生P(A∩B)P(A \cap B)P(A∩B) 即联合概率A∪BA \cup BA∪B事件并AAA 或 BBB 发生加法公式核心A∖BA \setminus BA∖B事件差AAA 发生但 BBB 不发生A∩BcA \cap B^cA∩Bc∅\emptyset∅空事件不可能事件P(∅)=0P(\emptyset) = 0P(∅)=0A⊆BA \subseteq BA⊆B事件包含AAA 发生则 BBB 必然发生蕴含关系A⊥BA \perp BA⊥B事件独立P(A∩B)=P(A)P(B)P(A \cap B) = P(A)P(B)P(A∩B)=P(A)P(B)统计独立性定义
二、概率函数与公理
公理
公理名称数学表述说明公理 1非负性对于任意事件 AAA (即 A⊆SA \subseteq SA⊆S), P(A)≥0P(A) \geq 0P(A)≥0任何事件发生的概率都不能小于零。公理 2规范性P(S)=1P(S) = 1P(S)=1整个样本空间 SSS (包含所有可能结果) 发生的概率等于 1。意味着某种结果必然发生。公理 3可列可加性对于任意可数个 (有限个或可数无穷个) 两两互斥的事件 A1,A2,A3,...A_1, A_2, A_3, ...A1,A2,A3,... (即 i≠ji \neq ji=j 时 Ai∩Aj=∅A_i \cap A_j = \emptysetAi∩Aj=∅), P(⋃i=1∞Ai)=∑i=1∞P(Ai)P\left( \bigcup_{i=1}^{\infty} A_i \right) = \sum_{i=1}^{\infty} P(A_i)P(⋃i=1∞Ai)=∑i=1∞P(Ai)互斥事件并的概率等于各事件概率之和。如果一个事件可以分解成一些互不重叠的子事件,那么该事件的概率就是这些子事件概率的总和。
符号名称公式/定义说明P(A∣B)P(A \mid B)P(A∣B)条件概率P(A∩B)P(B)\dfrac{P(A \cap B)}{P(B)}P(B)P(A∩B)BBB 发生下 AAA 的概率公式乘法公式P(A∩B)=P(A∣B)P(B)P(A \cap B) = P(A \mid B) P(B)P(A∩B)=P(A∣B)P(B)联合概率计算公式全概率公式P(A)=∑iP(A∣Bi)P(Bi)P(A) = \sum_i P(A \mid B_i) P(B_i)P(A)=∑iP(A∣Bi)P(Bi){Bi}\{B_i\}{Bi} 为分割公式贝叶斯定理P(Bj∣A)=P(A∣Bj)P(Bj)∑iP(A∣Bi)P(Bi)P(B_j \mid A) = \dfrac{P(A \mid B_j) P(B_j)}{\sum_i P(A \mid B_i) P(B_i)}P(Bj∣A)=∑iP(A∣Bi)P(Bi)P(A∣Bj)P(Bj)后验概率计算对偶公式
符号/名称公式说明德摩根律(事件逆运算法则)(A∪B)c=Ac∩Bc(A \cup B)^c = A^c \cap B^c(A∪B)c=Ac∩Bc并集的补集 = 补集的交集(推广:(⋃iAi)c=⋂iAic\left( \bigcup_{i} A_i \right)^c = \bigcap_{i} A_i^c(⋃iAi)c=⋂iAic)(A∩B)c=Ac∪Bc(A \cap B)^c = A^c \cup B^c(A∩B)c=Ac∪Bc交集的补集 = 补集的并集(推广:(⋂iAi)c=⋃iAic\left( \bigcap_{i} A_i \right)^c = \bigcup_{i} A_i^c(⋂iAi)c=⋃iAic)加法公式的对偶形式P(A∪B)=P(A)+P(B)−P(A∩B)P(A \cup B) = P(A) + P(B) - P(A \cap B)P(A∪B)=P(A)+P(B)−P(A∩B)事件并的概率 = 概率和减交集概率(消除重复计算)P(A∩Bc)=P(A)−P(A∩B)P(A \cap B^c) = P(A) - P(A \cap B)P(A∩Bc)=P(A)−P(A∩B)AAA 发生但 BBB 不发生的概率互斥事件的对偶性质若 A∩B=∅A \cap B = \emptysetA∩B=∅,则 P(A∪B)=P(A)+P(B)P(A \cup B) = P(A) + P(B)P(A∪B)=P(A)+P(B)互斥时:并集概率 = 概率之和若 P(A∪B)=P(A)+P(B)P(A \cup B) = P(A) + P(B)P(A∪B)=P(A)+P(B),则 A∩B=∅A \cap B = \emptysetA∩B=∅逆关系:概率可加性蕴含事件互斥Borel-Cantelli 引理的对偶∑n=1∞P(An)<∞ ⟹ P(lim supAn)=0\sum_{n=1}^{\infty} P(A_n) < \infty \implies P\left(\limsup A_n\right) = 0∑n=1∞P(An)<∞⟹P(limsupAn)=0事件列若概率和收敛,则“无限发生”概率为 0∑n=1∞P(An)=∞ 且独立 ⟹ P(lim supAn)=1\sum_{n=1}^{\infty} P(A_n) = \infty \text{ 且独立} \implies P\left(\limsup A_n\right) = 1∑n=1∞P(An)=∞ 且独立⟹P(limsupAn)=1事件列若独立且概率和发散,则“无限发生”概率为 1(对偶结论)独立性的对偶条件P(A∩B)=P(A)P(B) ⟹ A,B 独立P(A \cap B) = P(A)P(B) \implies A, B \text{ 独立}P(A∩B)=P(A)P(B)⟹A,B 独立独立性的基础定义形式P(A∣B)=P(A)(当 P(B)>0)P(A \mid B) = P(A) \quad \text{(当 } P(B)>0\text{)}P(A∣B)=P(A)(当 P(B)>0)对偶表达:条件概率 = 无条件概率(独立性在条件概率中的体现)P(A∣B)=P(A∣Bc)P(A \mid B) = P(A \mid B^c)P(A∣B)=P(A∣Bc)独立性等价于:BBB 发生与否不影响 AAA 的条件概率
对偶性在概率论中的意义:
对偶公式揭示了概率运算中互补结构的对称性(如并/交、发生/不发生、独立/相关),是化简复杂概率问题和证明极限定理的核心工具。尤其当问题涉及补事件或互逆结论时(如“至少发生一次” vs. “永不发生”),对偶关系常提供简洁的转换路径。
三、随机变量与分布
符号名称公式/定义说明X,YX, YX,Y随机变量函数 X:S→RX: S \to \mathbb{R}X:S→R将结果映射为实数FX(x)F_X(x)FX(x)累积分布函数 (CDF)FX(x)=P(X≤x)F_X(x) = P(X \leq x)FX(x)=P(X≤x)单调不减、右连续离散型pX(x)p_X(x)pX(x)概率质量函数 (PMF)pX(x)=P(X=x)p_X(x) = P(X = x)pX(x)=P(X=x)离散随机变量概率连续型fX(x)f_X(x)fX(x)概率密度函数 (PDF)P(a≤X≤b)=∫abfX(x) dxP(a \leq X \leq b) = \int_a^b f_X(x) \, dxP(a≤X≤b)=∫abfX(x)dxfX(x)≥0f_X(x) \geq 0fX(x)≥0, (\int_{-\infty}^{\infty} f_X(x) , dx = 1$公式CDF与PDF关系FX(x)=∫−∞xfX(t) dtF_X(x) = \int_{-\infty}^{x} f_X(t) \, dtFX(x)=∫−∞xfX(t)dtfX(x)=ddxFX(x)f_X(x) = \frac{d}{dx} F_X(x)fX(x)=dxdFX(x)
四、重要数字特征
符号名称公式说明E[X]E[X]E[X]期望离散: ∑xip(xi)\sum x_i p(x_i)∑xip(xi) 连续: ∫xf(x) dx\int x f(x) \, dx∫xf(x)dx随机变量平均值Var(X)\text{Var}(X)Var(X)方差E[(X−E[X])2]=E[X2]−(E[X])2E\left[(X - E[X])^2\right] = E[X^2] - (E[X])^2E[(X−E[X])2]=E[X2]−(E[X])2度量离散程度σX\sigma_XσX标准差Var(X)\sqrt{\text{Var}(X)}Var(X)方差的平方根Cov(X,Y)\text{Cov}(X,Y)Cov(X,Y)协方差E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y]E[(X-E[X])(Y-E[Y])] = E[XY]-E[X]E[Y]E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y]衡量两变量线性相关性ρX,Y\rho_{X,Y}ρX,Y相关系数Cov(X,Y)σXσY\dfrac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y}σXσYCov(X,Y)$Skew(X)\text{Skew}(X)Skew(X)偏度E[(X−μσ)3]E\left[\left(\frac{X-\mu}{\sigma}\right)^3\right]E[(σX−μ)3]分布不对称性度量Kurt(X)\text{Kurt}(X)Kurt(X)峰度E[(X−μσ)4]−3E\left[\left(\frac{X-\mu}{\sigma}\right)^4\right] - 3E[(σX−μ)4]−3分布尖锐或平坦程度(减3后正态为0)
五、极限定理
以下是大数定律主要形式的结构化对比表格,包含核心公式、条件及收敛目标:
大数定律类型条件公式表达(收敛形式)收敛目标应用场景伯努利大数定律独立重复试验(nnn 次),固定事件概率 ppplimn→∞P(∣μnn−p∣<ε)=1\lim_{n \to \infty} P\left( \left| \frac{\mu_n}{n} - p \right| < \varepsilon \right) = 1limn→∞P(nμn−p<ε)=1频率 μnn\frac{\mu_n}{n}nμn → 概率 ppp频率稳定性(抛硬币等)切比雪夫大数定律随机变量序列 {Xn}\{X_n\}{Xn} 两两不相关,方差一致有界(D(Xi)≤CD(X_i) \leq CD(Xi)≤C)limn→∞P(∣1n∑i=1nXi−1n∑i=1nE(Xi)∣<ε)=1\lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \frac{1}{n} \sum_{i=1}^n E(X_i) \right| < \varepsilon \right) = 1limn→∞P(n1∑i=1nXi−n1∑i=1nE(Xi)<ε)=1样本均值 → 期望均值 1n∑E(Xi)\frac{1}{n} \sum E(X_i)n1∑E(Xi)异分布随机变量序列分析辛钦大数定律{Xn}\{X_n\}{Xn} 独立同分布(i.i.d.),期望存在(E(Xi)=μE(X_i) = \muE(Xi)=μ,方差可无)limn→∞P(∣1n∑i=1nXi−μ∣<ε)=1\lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \mu \right| < \varepsilon \right) = 1limn→∞P(n1∑i=1nXi−μ<ε)=1样本均值 Xˉn\bar{X}_nXˉn → 总体均值 μ\muμ参数估计(抽样调查)泊松大数定律独立试验(nnn 次),第 kkk 次事件概率为 pkp_kpk(概率可变)limn→∞P(∣μnn−1n∑k=1npk∣<ε)=1\lim_{n \to \infty} P\left( \left| \frac{\mu_n}{n} - \frac{1}{n} \sum_{k=1}^n p_k \right| < \varepsilon \right) = 1limn→∞P(nμn−n1∑k=1npk<ε)=1频率 μnn\frac{\mu_n}{n}nμn → 平均概率 pˉ\bar{p}pˉ变概率事件长期规律(如故障率)马尔可夫大数定律满足马尔可夫条件:limn→∞1n2D(∑i=1nXi)=0\lim_{n \to \infty} \frac{1}{n^2} D\left( \sum_{i=1}^n X_i \right) = 0limn→∞n21D(∑i=1nXi)=0limn→∞P(∣1n∑i=1nXi−1n∑i=1nE(Xi)∣<ε)=1\lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \frac{1}{n} \sum_{i=1}^n E(X_i) \right| < \varepsilon \right) = 1limn→∞P(n1∑i=1nXi−n1∑i=1nE(Xi)<ε)=1样本均值 → 期望均值 1n∑E(Xi)\frac{1}{n} \sum E(X_i)n1∑E(Xi)广义随机序列(无相关性要求)
补充说明:
统一数学表达:
所有大数定律均可概括为:
1n∑i=1nXi→Pμ(n→∞)
\frac{1}{n} \sum_{i=1}^n X_i \xrightarrow{P} \mu \quad (n \to \infty)
n1i=1∑nXiPμ(n→∞)
其中 μ\muμ 是总体期望或期望的平均,→P\xrightarrow{P}P 表示依概率收敛。
符号:
μn\mu_nμn:事件发生次数(伯努利/泊松)Xˉn=1n∑Xi\bar{X}_n = \frac{1}{n} \sum X_iXˉn=n1∑Xi:样本均值ε\varepsilonε:任意小的正数(收敛精度)D(⋅)D(\cdot)D(⋅):方差
💡 核心思想:大量独立重复试验下,随机现象的偶然性偏差被稀释,样本统计量稳定趋近于理论期望值。
⚠️ 注意:大数定律不消除单次试验的随机性,也不解释微小偏差的长期累积效应(如赌徒谬误)。
六、常见离散概率分布
分布PMF期望方差应用场景伯努利 Bern(p)\text{Bern}(p)Bern(p)p(1)=p, p(0)=1−pp(1)=p, \, p(0)=1-pp(1)=p,p(0)=1−ppppp(1−p)p(1-p)p(1−p)单次二元试验(如抛硬币)二项 Bin(n,p)\text{Bin}(n,p)Bin(n,p)(nk)pk(1−p)n−k\binom{n}{k} p^k (1-p)^{n-k}(kn)pk(1−p)n−knpnpnpnp(1−p)np(1-p)np(1−p)nnn 次独立伯努利试验成功次数几何 Geom(p)\text{Geom}(p)Geom(p)(1−p)k−1p(1-p)^{k-1}p(1−p)k−1p1p\frac{1}{p}p11−pp2\frac{1-p}{p^2}p21−p首次成功所需试验次数泊松 Pois(λ)\text{Pois}(\lambda)Pois(λ)λke−λk!\frac{\lambda^k e^{-\lambda}}{k!}k!λke−λλ\lambdaλλ\lambdaλ单位时间/空间内稀有事件发生次数
七、常见连续概率分布
分布PDF期望方差应用场景均匀 Unif(a,b)\text{Unif}(a,b)Unif(a,b)1b−a, x∈[a,b]\frac{1}{b-a}, \, x \in [a,b]b−a1,x∈[a,b]a+b2\frac{a+b}{2}2a+b(b−a)212\frac{(b-a)^2}{12}12(b−a)2区间内等可能取值正态 N(μ,σ2)\mathcal{N}(\mu,\sigma^2)N(μ,σ2)1σ2πe−(x−μ)22σ2\frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}σ2π1e−2σ2(x−μ)2μ\muμσ2\sigma^2σ2自然界广泛存在的分布指数 Exp(λ)\text{Exp}(\lambda)Exp(λ)λe−λx, x≥0\lambda e^{-\lambda x}, \, x \geq 0λe−λx,x≥01λ\frac{1}{\lambda}λ11λ2\frac{1}{\lambda^2}λ21无记忆性的等待时间分布伽马 Γ(α,β)\Gamma(\alpha,\beta)Γ(α,β)βαxα−1e−βxΓ(α)\frac{\beta^\alpha x^{\alpha-1} e^{-\beta x}}{\Gamma(\alpha)}Γ(α)βαxα−1e−βxαβ\frac{\alpha}{\beta}βααβ2\frac{\alpha}{\beta^2}β2α多阶段等待时间、可靠性分析
说明:
符号体系差异:不同教材/文献可能存在符号差异(如方差 D(X)D(X)D(X) 或 σX2\sigma_X^2σX2)。上下文依赖:符号含义需结合上下文理解(例如 σ\sigmaσ 可表示标准差或参数)。分支领域扩展:信息论(熵 H(X)H(X)H(X))、随机过程(马尔可夫链 PijP_{ij}Pij) 等有其专用符号。测度论基础:严格定义中概率空间记为 (Ω,F,P)(\Omega, \mathcal{F}, P)(Ω,F,P),其中 F\mathcal{F}F 是 σ\sigmaσ-代数。