IMS:一个洲际人际交流网络(为学生免费提供会员资格)

译者注:原文刊登于 IMS Bulletin,作者为国际数理统计学会(Institute of Mathematical Statistics)现任主席郁彬教授。郁彬是加州大学伯克利分校统计系和电子工程与计算机科学系的讲席教授,是美国国家科学院、美国艺术与科学院双院士。她曾在威斯康星麦迪逊和耶鲁大学都任过教,并且曾经是贝尔实验室的技术研究成员。她在2009年到2012年间担任加州大学伯克利分校统计系系主任,还是北大微软统计和信息技术实验室的创办者和主任之一。

本文由肖楠、尤晓斌和蔡占锐翻译,邱怡轩、郁彬老师校对。

随着我在IMS(国际数理统计学会)的主席任期行将结束,继而成为“前任主席”之际, 我想为吸纳新成员作出努力而回顾 IMS 的作用。正如 IMS 网站所述:“ IMS 的宗旨在于促进统计和概率的理论与应用的发展和传播”。伴随着数据科学的出现,统计和概率思维在数据科学中扮演着越来越出众的角色,而 IMS 能否吸引更多的成员也变得至关重要。尤其是在诸如统计,概率,应用数学,计算机科学,电子工程和其他数据科学相关学科行将获得学历的人才,都将成为IMS的关注对象。对于这些年轻人而言,他们有一大部分职业生涯会在本职工作岗位,而另一部分将会是在诸如 IMS 等专业学会中。

IMS 是个什么样的组织呢?回忆一下 IMS 的起源将会让我们更好地认识它。1930 年,Annals of Mathematical Statistics(数理统计年刊)成立。随后的 1935 年,在密歇根大学统计教授 Carver 的努力下促成了 IMS 独立于 ASA(美国统计协会)而组建,以帮助数理统计学家建立联系的纽带。1938 年,年刊的编委会由诸多重量级统计学者组成,Wilks(主编),Fisher,Neyman,Hotelling,Pearson,Darmois,Craig,Deming,von Mises,Rietz,Shewhart 均在编辑之列。1973年期刊被分为两份刊物,一为 Annals of Statistics(统计学年刊),另一为 Annals of Probability(概率论年刊)。之后,Statistical Science(统计科学),Annals of Applied Probability(应用概率论年刊)及 Annals of Applied Statistics(应用统计学年刊)随之创立。此外 IMS 也和其他学术组织合作创办了期刊,例如 Electronic Journal of Probability(概率论电子期刊),the Electronic Journal of Statistics(统计学电子期刊),the Journal of Computational and Graphical Statistics(计算机及图形统计期刊),Probability Surveys(概率论与统计调查)以及 Statistics Surveys(统计学与统计调查)。从一开始,IMS 的重点就在高质量的期刊上。今天,IMS 已有更多重点,包括举办主要学术峰会和颁发统计概率领域重要奖项

继续阅读

COS访谈第16期——加州大学戴文斯分校蔡知令教授

受访者:蔡知令;采访者:朱雪宁

简介:蔡知令,加州大学戴维斯分校管理学院杰出教授和讲席教授。曾被MBA学生14次评选为年度教师。

tsai_web

Xuening: 听说您的求学经历比较曲折,能给我们讲讲嘛?

Tsai: 念书就是从小学考初中,没考顺利,然后初中考高中也没考好,就是读夜校。一般人就是认为说这个学生的程度不是很好。然后高中考大学第一年没考取,第二年就考到淡江(文理学院)。所以在台湾求学经历比较坎坷。但是就我自己而言,上大学以后,专业是数学,还有一点兴趣,至少不讨厌。我当时志愿填数学的理由很简单,数学不像工学一样要画图啊,不像物理化学一样要做实验啊,就是想法很单纯填了数学。大学四年是纯数学,所以我就没有接触过统计课程。念书过程中我觉得唯一不错的就是,我能提早准备,比如说我寒暑假都留在学校,基本上不太回家,除了看爸爸妈妈。在学校就是去图书馆读大量的书籍,所以提前大致就可以知道课要教什么了。有些也读不懂,读不懂就自己写下来,对以后做研究也有点帮助就是自己可以学着怎么去写summary(总结),把自己的感想心得写下来,日积月累,大学四年念下来,收获还是蛮大的。

Xuening: 您刚才提到一开始对于数学的兴趣没有这么浓厚,但是您大学四年的学习可以说相当认真努力,主要来源于什么动力呢?

Tsai: 有几个。一个动力就是因为家里环境不好,我是老大,我母亲曾经建议我去念军校,因为考到私立大学负担很重,下面还有弟弟妹妹要念书;我爸爸做了一辈子军人,他认为我个性不适合,说再苦也要让我去念个大学。所以对我来说就是家里的期望,就是好好念,念得好坏不一定,但是我每次就是尽个力吧。我真正兴趣来的时候就是观察老师还有学长的学习,我们那个大学虽然一般,但是数学系很是不错,可以和台湾大学或者清华大学齐名。有一些活动比如说有微积分社,我举个例子,学长就会跟学弟学妹交流,比如微积分的起源啊应用啊,一起分享。老师中那个时候博士很少,一些讲师他们就住在学校,平时一起打打球、下下棋,这个氛围让我耳濡目染,慢慢感觉还蛮有兴趣的,然后自己又慢慢摸索,学起来觉得虽然抽象但是有它的逻辑性所在。真正开始有兴趣差不多大三以上,大一大二就是必修,大三以上就比较专注一点,比如现代代数、微分几何、拓扑等等,学起来还觉得蛮有兴趣,那个时候开始产生的兴趣。

继续阅读

rlist:基于list在R中处理非关系型数据

本文作者:任坤,厦门大学王亚南经济研究院金融硕士生,研究兴趣为计算统计和金融量化交易,pipeR,learnR,rlist等项目的作者。

近年来,非关系型数据逐渐获得了更广泛的关注和使用。下面分别列举了一个典型的关系型数据表和一个典型的非关系型数据集。

关系型数据:一组学生的基本数据,包括姓名(Name)、性别(Gender)、年龄(Age)以及专业(Major)。

Name Gender Age Major
Ken Male 24 Finance
Ashley Female 25 Statistics
Jennifer Female 23 Computer Science

非关系型数据:一组程序开发者的基本信息,包括姓名(Name)、年龄(Age)、兴趣爱好(Interest)、编程语言以及使用年数(Language)。 继续阅读

[火光摇曳]神奇的伽玛函数(下)

原文链接: http://www.flickering.cn/?p=203

五、$ \Gamma(n) = (n-1)!$ 还是 $ \Gamma(n) = n! $ ? 

伽玛函数找到了,我们来看看第二个问题,为何伽玛函数被定义为满足 $\Gamma(n)=(n-1)!$? 这看起来挺别扭的,如果我们稍微修正一下,把伽玛函数定义中的 $t^{x-1}$ 替换为 $t^x$
$$ \Gamma(x) = \int_0^{\infty} t^{x}e^{-t}dt , $$
这不就可以使得 $\Gamma(n)=n!$了嘛。估计数学界每年都有学生问这个问题,然而答案却一直有一些争议。

欧拉最早的伽玛函数定义还真是如上所示,选择了$\Gamma(n)=n!$,事实上数学王子高斯在研究伽玛函数的时候, 一直使用的是如下定义:
$$ \Pi(x)=\int_{0}^\infty t^x e^{-t}\,dt ,$$
然而这个定义在历史上并没有流传开来。

legendre

勒让德肖像水彩画

欧拉在伽玛函数的推导中实际上引入了两类积分形式
$$ \int_0^1 t^{x}(1-t)^{y}dt, \quad \quad \int_0^{\infty} t^{x}e^{-t}dt $$
现在我们分别称为欧拉一类积分和欧拉二类积分。勒让德追随欧拉的脚步,发表了多篇论文对欧拉积分进行了深入的研究和推广,不过在勒让德的研究中,对积分中的参数做了 $-1$的移位修改,主要定义为
$$ B(x, y) = \int_0^1 t^{x-1}(1-t)^{y-1}dt $$

$$ \Gamma(x) = \int_0^{\infty} t^{x-1}e^{-t}dt .$$
$B(x,y)$ 现在称为贝塔积分或者贝塔函数。其中$\Gamma(x)$ 的这个定义选择导致了 $ \Gamma(n) = (n-1)!$ 。实际上伽马函数中的$\Gamma$符号历史上就是勒让德首次引入的,而勒让德给出的这个伽玛函数的定义在历史上起了决定作用,该定义被法国的数学家广泛采纳并在世界范围推广,最终使得这个定义在现代数学中成为了既成事实。

继续阅读

[火光摇曳]神奇的伽玛函数(上)

原文链接: http://www.flickering.cn/?p=163

一、开篇

数学爱好者们汇集在网络论坛上的一大乐事就是对各类和数学相关的事物评头论足、论资排辈。如果要评选历史上最伟大的数学家,就会有一大堆的粉丝围绕高斯、黎曼、牛顿、欧拉、阿基米德等一流人物展开口水战;如果要讨论最奇妙的数学常数,$e, \pi, \phi=\frac{\sqrt{5}-1}{2} $ 肯定在候选队列中;如果要推举最美丽的数学公式,欧拉公式 $e^{i\pi} + 1= 0$ 与和式 $ 1 + \frac{1}{2^2} + \frac{1}{3^2} + \frac{1}{4^2} + \cdots = \frac{\pi^2}{6} $ 常常被数学爱好者们提及;如果有人追问最神奇的数学函数是什么? 这个问题自然又会变得极具争议,而我相信如下这个长相有点奇特的伽玛函数
$$ \Gamma(x)=\int_0^{\infty}t^{x-1}e^{-t}dt $$
一定会出现在候选队列中。

伽玛函数不是初等函数,而是用积分形式定义的超越函数,怎么看都让人觉得不如初等函数自然亲切。然而伽玛函数也被称为阶乘函数,高等数学会告诉我们一个基本结论:伽玛函数是阶乘的推广。通过分部积分的方法,容易证明这个函数具有如下的递归性质
$$\Gamma(x+1) = x \Gamma(x)$$
由此可以推导出,对于任意的自然数$n$
$$\Gamma(n) = (n-1)! .$$
由于伽玛函数在整个实数轴上都有定义,于是可以看做阶乘概念在实数集上的延拓。

如果我们继续再学习一些数学,就会惊奇地发现这个具有神秘气质的伽玛函数真是才华横溢。她栖身于现代数学的各个分支,在微积分、概率论、偏微分方程、组合数学, 甚至是看起来八竿子打不着的数论当中,都起着重要的作用。 并且这个函数绝非数学家们凭空臆想的一个抽象玩具,它具有极高的实用价值,频繁现身于在现代科学尤其是物理学之中。

笔者对数学的涉猎很有限,主要是从概率统计中频繁地接触和学习这个函数,不过这个函数多年来一直都让我心存疑惑:

  • 都说$n!$ 和伽玛函数是近亲,可是从相貌上这两个数学公式都差了十万八千里,历史上数学家们是如何找到这个奇特的函数的?
  •  现代数学对伽玛函数的定义使它满足 $\Gamma(n) = (n-1)!$,既然号称是$n!$ 的推广,为何定义伽玛函数的时候不让它满足$\Gamma(n) = n!$?这看起来不是更加舒服自然吗?
  •  伽玛函数是唯一满足阶乘特性的推广函数吗?
  •  伽玛函数在各种概率分布的密度函数中频繁出现,伽玛函数本身是否有直观的概率解释?

带着这些疑问,笔者翻阅了许多讲解伽马函数历史和应用的资料,发现伽玛函数真是一个来自异族的美女,与生俱来携带着一种神秘的色彩。你要接近她并不难,然而她魅力独特,令你无法看透。从她出生开始,就吸引着众多一流的数学家对她进行解读。 历史上伽玛函数的发现,和数学家们对阶乘、插值以及积分的研究有着紧密的关系,而这最早要从著名的沃利斯公式讲起。

继续阅读