概率论的起源、发展、应用

概率论源于游戏和赌博,发展过程和数学理论密不可分。

(一)概率论的起源

早期的埃及人为了忘记饥饿,经常聚集在一起玩一种叫做“猎犬与胡狼”的游戏,实际上就是今天的掷骰子游戏,相对面的数字之和是7的骰子大约产生于公元前1400年的埃及,骰子就是游戏中常用的随机发生器,这类游戏也叫做机会性游戏。17世纪中叶,人们开始对机会性游戏的数学规律进行探讨。它的发展与数学史上一些伟大的名字相联系,如帕斯卡、费马、惠更斯、詹姆斯、伯努利、棣莫弗、拉普拉斯等。

1654年,费马与帕斯卡的通信中关于分赌注问题的讨论被公认为是概率论诞生的标志。问题是这样的:“两个赌徒相约赌若干局,谁先赢s局就算赢了,当赌徒A赢a局(a < s),而赌徒B赢b局(b < s)时,赌博被迫中止,应该怎样分配赌注才合理?” 在三年后,惠根斯亦用自己的方法解决了这一问题,并写成了《论赌博中的计算》一书,这就是概率论最早的论著,他们三人提出的解法中,都首先涉及了数学期望﹝mathematical expectation﹞这一概念,并由此奠定了古典概率的基础。

(二)概率论的发展

1713年,伯努利的遗著中发表了概率论中的第一个极限定理——[伯努利大数定理]即“在多次重复独立的试验中,事件发生的频率有越来越稳定的趋势。”这正是频率稳定性的定理形式。到了1730年,法国数学家棣莫弗出版的著作《分析杂论》中包含了著名的「棣莫弗─拉普拉斯定理」。这就是概率论中第二个基本极限定理的雏形。接着拉普拉斯在1812年出版的《概率的分析理论》中,首先明确地对概率作了古典的定义。另外,他又和数个数学家建立了关于「正态分布」及「最小二乘法」的理论。后来,泊松将伯努利大数定律做了推广,研究得出了一种新的分布,就是泊松分布。概率论发展到1901年,中心极限定理被严格的证明了,数学家们利用这一定理第一次科学地解释了为什么实际中遇到的许多随机变量近似服从以正态分布。后期的中心研究课题则集中在推广和改进伯努利大数定律及中心极限定理,比如柯尔莫戈洛夫的概率公理化结构、以几乎处处收敛定义的强大数定律、林德伯格-费勒中心极限定理等等,另一方面,一些数学家将兴趣逐渐转向研究随机现象随时间演变过程的规律性,衍生出另一门重要的学科——随机过程。

(三)概率论的应用

目前,以概率理论作为基础的学科有很多,而最典型的莫过于统计学。各大高校非数学系本科生使用的概率统计教材都是建立在随机变量基础上的理论,很少有非数学类的学习以测度论为基础的概率理论。通过引入“随机变量”的定义,可以将抽象的样本空间映射到实空间中,方便我们能较好的用数学方法处理任何数据格式(比如实数数据和名义数据等)。概率论中另一个重要的定义则是“条件数学期望”,让人们在做推断的时候想到了利用经验信息(先验信息),由此发展出来的贝叶斯思想(贝叶斯统计)现在可以用到任何领域。

独立同分布场合的大数定律(辛钦大数定律)为一类参数估计奠定了理论基础,因为在简单随机抽样下得到的样本正好是独立同分布的,按照“样本矩依概率收敛到总体矩”的思想,矩估计方法诞生了。这正是为什么我们用样本均值去估计总体期望的原因,它也启发人们用概率论的想法构造模型从而实现数值计算,比如蒙特卡洛方法。此外,参数估计中最著名的极大似然估计方法(MLE)则是来源于对已今发生的随机事件的概率的假定,人们承认一次观察中出现的那些样本就是最有可能出现的样本,极大它的概率得到了参数的估计,MLE是目前十分流行的参数估计方法。反过来,利用“小概率事件在一次试验中实际不发生”的原理,人们实现了假设检验,方差分析、相关分析、卡方检验、秩和检验等都是基本的假设检验方法。

中心极限定理则解释了为什么正态分布在统计中占有不可替代的地位,也告诉我们现实当中什么样的数据可以认为是正态的。自从高斯认为误差服从正态分布以后,到今天,在正态总体下建立的许多估计方法和检验方法非常成熟,例如回归分析、判别分析、因子分析等等。同时,在非正态总体下,许多参数估计和检验也是稳健的,基于样本均值渐近无分布的参数方法的理论基础正是中心极限定理。但是,没有参数方法适用于处理名义变量或次序数据,因此而发展起来的就是非参数统计,典型的方法如:列联表、秩检验、核密度估计、局部多项式等等。介于二者之间则是半参数统计了。

概率论的起源、发展、应用》有8个想法

  1. 大哥,你把那最牛逼的俄罗斯人给忘记了。。。要是没有他奠定测度论,人们连概率到底是什么东西都不知道。为什么概率可以衡量evidence?首先一个最重要也最关键的问题是,根据不同事件或者数据得到的不同的这个叫概率的东西是on the same scale,也就是说他们必须在任何时刻任何情况下都是可比的,不然怎么去下结论说某件事情比某件事情发生的概率大?早年的时候,概率学界是分为两派的,一派把概率论叫possibility theory,一派叫probability theory。 目前看来,两者都有优势,但是后者最强大的地方就在于它解决了我说的这个问题。前者现在发展了evidence theory (dempster-shafer theory), 模糊理论。但是在这个本质问题上没有精确的论证,所以这一派的基本理论依据就是,probability theory是一个基础,possibility theory 研究的就是怎么去approximate 那些在前者中无法计算的诸多难题。

  2. the statistics just like the gremlin hiding in the daily life, leaving some unvisual clue to these special lovely guy

  3. 简单但有启发性,尤其是“大数定律是矩估计的理论基础”

  4. A.N. Kolomogorov
    Kolmogorov一开始并不是数学系的,据说他17岁左右的时候写了一片和牛顿力学有关的文章,于是到了Moscow State University去读书。入学的时候,Kolmogorov对历史颇为倾心,一次,他写了一片很出色的历史学的文章,他的老师看罢,告诉他说在历史学里,要想证实自己的观点需要几个甚至几十个正确证明才行,Kolmogorov就问什么地方需要一个证明就行了,他的老师说是数学,于是Kolmogorov开始了他数学的一生。
    二十年代的莫斯科大学,一个学生被要求在十四个不同的数学分支参加十四门考试;但是考试可以用相应领域的一项独立研究代替。所以,Kolmogorov从来没有参加一门考试,他写了十四个不同方向的有新意的文章。Kolmogorov后来说,竟然有一篇文章是错的,不过那时考试已经通过了。
    http://blog.163.com/bit_runner/blog/static/532422182010112853056594/

发表评论

电子邮件地址不会被公开。 必填项已用*标注