自然地理解「正态分布概率密度公式」

Lingfeng2024-01-21

自然地理解「正态分布概率密度公式」

1. 问题提出

在最开始学习正态分布时,有很多令我很疑惑的点,包括概率密度公式的由来

Definition (一元正态分布(Univariate Normal Distribution))

而且最令人费解的是公式前面的,当然我知道这是为了确保.
但是高斯在进行计算积分时使用了一个匪夷所思的方法, 即引入了一个对称的积分与之相乘:

再使用极坐标变换, 令, 得到
注意到后面的积分正好为1, 因此得到

通过"人为"地引入一个对称积分把一个一元积分变成了二元积分, 从而顺利解决问题, 思路很巧妙. 但问题是如果不引入这样的对称积分, 这个积分会很难求解. 因此, 我们想找到一种合理的解释来说明这个方法的本质.

似乎还可以用留数定理去计算这个积分

2. 正态分布的导出

在说明这个问题之前, 我们先介绍一种推导出正态分布概率密度公式的方式. [1]

射击弹落点分布 在火器射击问题中, 假如过射击中心作直角坐标系x轴及y轴. 每次射击弹落点会受随机因素影响偏离目标, 因此坐标是一个二维随机变量. 现在我们假设其坐标满足如下3个条件:

  1. 分别具有相同且连续的密度函数;
  2. 相互独立;
  3. 的密度函数在点的值仅与它到原点的距离有关.

在推导之前, 我们先说明一下3个条件的含义. 前两个条件是比较显然的, 以便的密度函数有良好的性质. 而第三个条件可以理解为关于上是满足均匀分布, 且相互独立, 也符合我们的常识.

证明:
的联合密度函数, 为极坐标变换下的密度函数, 显然有

由假设3可知
在这里我们为了避免根号运算, 设, 即
由假设2可知
代入得到关键式子
为了使这个式子更明显一点, 我们还可以再作一次代换, 令, 得到
这样代换后, 很容易观察出应该是一种指数形式, 因为这正好满足指数函数性质, 并且函数满足连续性. 实际上这正是方程的一种变形, 我们期望最后要得到, 为了凑出方程的形式, 这里我们应该两边除掉(用反证法可以证明出).

具体过程如下, 注意到在中, 令, 有, 因此代入

两边除以得到
我们设, 因此有
显然由柯西方程可得到, 即
这样就得到了我们预期的结果, 当然这与最终的式子还有一点小小的差距, 我们还需要确定系数. 下面我们采用一个巧妙的方法, 我们重新回到式子, 将代入有
这里我们再采用极坐标变换, 得到
注意到有一个关键等式成立
注意到这里显然是一个小于0的常数, 我们不妨令, 代入则有
后面的积分显然为1, 因此有
这样便完美得到了一元正态分布的表达式. 到了这里, 如果有敏锐的观察力, 可以注意到, 在最后推导的过程中, 惊人的相似! 因此, 我们可以很自然的回答最开始的问题.

3. 问题解答

我们重新理一下证明的逻辑, 本质上根据各向同性(isotropic), 即概率分布只与有关, 因此得到, 进而通过柯西方程解出表达式. 事实上, 我们频繁采用极坐标而不是直角坐标, 正是因为极坐标恰好能反应各向同性这个性质.

当我们得到满足瑞利分布, 满足均匀分布, 从而

再重新变换为直角坐标系中, 显然有
可以看出困扰我们的系数的确定是很显然的, 当随机变量经过标准化之后, 正好有
事实上, 从数学的直观上理解, 一定与某种对称的几何关系, 或者更简单的说, 跟有关系. 而在这个例子中, 关于满足均匀分布恰好提供了一种类似于圆的几何关系. 这样解释, 正态分布概率密度函数中出现似乎就是显然的了!

我们还需要解释为什么一定要引入一个对称的变量, 这是因为各向同性必须在多元情况下才能体现, 一元情况无法体现这个性质. 换句话说, 多元正态分布才真正反应了正态分布的性质, 一元正态分布可以看成是多元正态分布的退化/坍缩情况. 在这样的情况下, 高斯的证明过程, 以及最后的结果都可以得到一个相对令人满意的解释.

但有意思的是, 高斯推导出正态分布似乎并不是通过所给的这种方式, 而是在误差分析中得到(实际上就是中心极限定理). 至于为什么能想出这样巧妙的计算方式, 只能归结于他敏锐的数学天赋了.


  1. 李贤平, 陈子毅.概率论基础学习指导书[M]. 北京:高等教育出版社,2011: 201-202. ↩︎

Last Updated 12/14/2025, 2:00:14 AM