自然地理解「正态分布概率密度公式」
自然地理解「正态分布概率密度公式」
1. 问题提出
在最开始学习正态分布时,有很多令我很疑惑的点,包括概率密度公式的由来
而且最令人费解的是公式前面的,当然我知道这是为了确保.
但是高斯在进行计算积分时使用了一个匪夷所思的方法, 即引入了一个对称的积分与之相乘:
通过"人为"地引入一个对称积分把一个一元积分变成了二元积分, 从而顺利解决问题, 思路很巧妙. 但问题是如果不引入这样的对称积分, 这个积分会很难求解. 因此, 我们想找到一种合理的解释来说明这个方法的本质.
似乎还可以用留数定理去计算这个积分
2. 正态分布的导出
在说明这个问题之前, 我们先介绍一种推导出正态分布概率密度公式的方式. [1]
射击弹落点分布 在火器射击问题中, 假如过射击中心作直角坐标系x轴及y轴. 每次射击弹落点会受随机因素影响偏离目标, 因此坐标是一个二维随机变量. 现在我们假设其坐标满足如下3个条件:
- 与分别具有相同且连续的密度函数;
- 与相互独立;
- 的密度函数在点的值仅与它到原点的距离有关.
在推导之前, 我们先说明一下3个条件的含义. 前两个条件是比较显然的, 以便和的密度函数有良好的性质. 而第三个条件可以理解为关于在上是满足均匀分布, 且与相互独立, 也符合我们的常识.
证明:
设为的联合密度函数, 为极坐标变换下的密度函数, 显然有
具体过程如下, 注意到在中, 令, 有, 因此代入有
两边除以得到我们设, 因此有显然由柯西方程可得到, 即这样就得到了我们预期的结果, 当然这与最终的式子还有一点小小的差距, 我们还需要确定系数. 下面我们采用一个巧妙的方法, 我们重新回到式子, 将代入有这里我们再采用极坐标变换, 得到注意到有一个关键等式成立即注意到这里显然是一个小于0的常数, 我们不妨令, 代入则有后面的积分显然为1, 因此有即这样便完美得到了一元正态分布的表达式. 到了这里, 如果有敏锐的观察力, 可以注意到, 在最后推导的过程中, 和是惊人的相似! 因此, 我们可以很自然的回答最开始的问题.3. 问题解答
我们重新理一下证明的逻辑, 本质上根据的各向同性(isotropic), 即概率分布只与有关, 因此得到, 进而通过柯西方程解出表达式. 事实上, 我们频繁采用极坐标而不是直角坐标, 正是因为极坐标恰好能反应各向同性这个性质.
当我们得到满足瑞利分布, 满足均匀分布, 从而
再重新变换为直角坐标系中, 显然有可以看出困扰我们的系数的确定是很显然的, 当随机变量经过标准化之后, 正好有事实上, 从数学的直观上理解, 一定与某种对称的几何关系, 或者更简单的说, 跟圆有关系. 而在这个例子中, 关于满足均匀分布恰好提供了一种类似于圆的几何关系. 这样解释, 正态分布概率密度函数中出现似乎就是显然的了!我们还需要解释为什么一定要引入一个对称的变量, 这是因为各向同性必须在多元情况下才能体现, 一元情况无法体现这个性质. 换句话说, 多元正态分布才真正反应了正态分布的性质, 一元正态分布可以看成是多元正态分布的退化/坍缩情况. 在这样的情况下, 高斯的证明过程, 以及最后的结果都可以得到一个相对令人满意的解释.
但有意思的是, 高斯推导出正态分布似乎并不是通过所给的这种方式, 而是在误差分析中得到(实际上就是中心极限定理). 至于为什么能想出这样巧妙的计算方式, 只能归结于他敏锐的数学天赋了.
李贤平, 陈子毅.概率论基础学习指导书[M]. 北京:高等教育出版社,2011: 201-202. ↩︎