【华山论剑】
20世纪初期到中期 , 中心极限定理的研究几乎吸引了所有的概率学家 , 这个定理俨然成为了概率论的明珠 , 成为了各大概率论武林高手华山论剑的场所 。 不知道大家对中心极限定理中的“中心”一词如何理解 , 许多人都认为'中心'这个词描述的是这个定理的行为:以正态分布为中心 。 这个解释看起来确实合情合理 , 不过并不符合该定理被冠名的历史 。 事实上 , 20世纪初概率学家大都称呼该定理为极限定理(LimitTheorem) , 由于该定理在概率论中处于如此重要的中心位置 , 如此之多的概率学武林高手为它魂牵梦绕 , 于是数学家波利亚(G.Polya)于1920年在该定理前面冠以'中心'一词 , 由此后续人们都称之为中心极限定理 。
数学家们总是极其严谨苛刻的 , 在一个给定条件下严格证明了中心极限定理之后 , 数学家就开始探寻中心极限定理成立的各种条件 , 询问这个条件是否充分必要条件 , 并且进一步追问序列和在该条件下以什么样的速度收敛到正态分布 。 从1922年Lindeberg基于一个比较宽泛容易满足的条件 , 给中心极限定理提出了一个很容易理解的初等证明 。 这个条件我们现在称之为Lindeberg条件 。 然后概率学家费勒和列维就开始追问Lindeberg条件是充分必要的吗?基于Lindeberg的工作 , 费勒和列维都于1935年独立的得到了中心极限定理成立的充分必要条件 , 这个条件可以用直观的非数学语言描述如下:
[中心极限定理充要条件]假设独立随机变量序列Xi的中值为0 。 要使序列和S=∑i=1nXi的分布函数逼近正态分布 , 以下条件是充分必要的:
· 1. 如果Xi相对于序列和S的散布(也就是标准差)是不可忽略的 , 则Xi的分布必须接近正态分布
· 2. 对于所有可忽略的Xi,取绝对值最大的那一项 , 这个绝对值相对于序列和也是可忽略的
事实上这个充分必要条件发现的优先权 , 费勒和列维之间还着实出现了一些争论 , 当然他们俩都是独立的在几乎同一时间解决了这一个问题 。 在列维证明这个充分必要条件的过程中 , 他发现了正态分布的一个有趣的性质:我们在数理统计中都学过 , 如果两个独立随机变量X,Y具有正态分布 , 则S=X+Y也具有正态分布;奇妙的是这个定理的逆定理也成立:
[正态分布的血统]如果X,Y是独立的随机变量 , 且S=X+Y是正态分布 , 那么X,Y也是正态分布 。
正态分布真是很奇妙 , 就像蚯蚓一样具有再生的性质 , 你把它一刀两断 , 它生成两个正态分布;或者说正态分布具有极其高贵的优良血统 , 正态分布的组成成分中只能包含正态分布 , 而不可能含有其它杂质 。 一流的数学家都是接近上帝的人 , 善于猜测上帝的意图;1928年Levy就猜到了这个定理 , 并在1935年使用这个定理对中心极限定理的充分必要条件作了证明 。 有意思的是列维却无法证明正态分布的这个看上去极其简单的再生性质 , 所以他的证明多少让人觉得有些瑕疵 。 不过列维的救星很快就降临了 , 1936年Cramer证明他的猜想完全正确 。
中心极限定理成为了现代概率论中首屈一指的定理 , 事实上中心极限定理在现代概率论里面已经不仅是指一个定理 , 而是指一系列相关的定理 。 统计学家们也基于该定理不断地完善拉普拉斯提出的元误差理论 , 并据此解释为何世界上正态分布如此常见 。 而中心极限定理同时成为了现代统计学中大样本理论的基础 。
6.2 进军近代统计学
花开两朵 , 各表一枝 。 上面说了正态分布在概率论中的发展 , 现在来看看正态分布在数理统计学中发展的故事 。 这个故事的领衔主演是凯特勒(Adolphe Quetelet)和高尔顿(FrancisGalton) 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
