所有由COS翻译组发布的文章

关于COS翻译组

COS翻译组,旨在翻译关于数据科学方面的趣味性强、启发性高的文章、新闻等。目前成员有施涛、冷静、尤晓斌、霍志骥、李妙竹、牟官迅、姜晓东、郝智恒、陈逸波等人,欢迎大家加入COS翻译小组

Breiman访谈实录

COS编辑部按:本文是一篇Richard Olshen对Leo Breiman的采访稿(原文发表在Statistical Science)。翻译工作已经得到作者授权。翻译: 张晔、成慧敏、李宇轩。审校:高涛、侯澄钧、丁鹏、魏太云。此外,郑重感谢施涛、丁鹏、郁彬老师为文章的翻译指导和版权沟通提供的帮助。

译者简介:张晔,毕业于华南统计科学研究中心,现严肃科技平台开发工程师,主要负责docker容器调度系统开发。成慧敏,就读于中央财经大学统计与数学学院,硕士研究生二年级,研究兴趣为复杂网络分析与深度学习。李宇轩,就读于中国人民大学统计学院,大二本科生,目测统计有关都可以是学习方向。

1928年1月28日,Leo Breiman生于纽约。5年后,他们家搬到了旧金山,然后Leo开始了他的学业。在他读初中的时候,他们家又搬去了洛杉矶。1945年,Leo从Roosevelt高中毕业后考进了加州理工学院,在那里他花了4年时间主修物理。1950年,Leo拿到了哥伦比亚大学的数学硕士学位,1954年,他又拿到了加州大学伯克利分校的数学博士学位。

Leo对科学和数学有着广泛的兴趣,包括信息论和博弈论。他曾参与汽车交通、空气质量和有毒物质识别等方向的研究。 他写过一篇著名的关于概率论的毕业论文,他是分类回归树(CART, Classification and Regression Trees)及其配套软件$CART^R$的四位作者之一,另外他还写了两本专著。Leo和Jerome Friedman一起开创了ACE(alternating conditional expectations)算法,该算法描述了因变量和自变量之间的非线性回归关系。 他开创性地提出将”bagging”和”arcing”这两种需要大量计算的方法用于分类,目前很多学者对此十分感兴趣。

Leo的职业履历包括,加州大学洛杉矶分校(UCLA)数学系教职,13年的独立咨询顾问,加州大学伯克利分校(UC Berkeley)统计系教授,同时也是该校统计计算实验室的创始人兼主任。 另外,他还是斯坦福大学和耶鲁大学的客座教授。 由于他的诸多贡献,Leo被授予数理统计研究所(Institute of Mathematical Statistics)和美国统计协会(American Statistical Association)的荣誉基金。 同时,他还是美国艺术与科学学院(American Academy of Arts and Sciences)的选举成员,并被加州大学授予Berkeley Citation荣誉奖项。

Leo Breiman是一个兴趣广泛的人,他不仅是专业的统计学家和概率学家,还在其他方面也取得了很多成就。他在Catskills当过服务员,在Merchant Marine当过洗碗工,同时他是一名探寻过热带雨林核心地带的背包客,是一群来自墨西哥农村孩子的慈爱父亲,是Santa Monica学校董事会的主席,是他美丽小屋的建筑师,还是一个技艺高超的雕刻家。Leo和他的妻子Mary Lou,居住在加州伯克利,他们育有两个女儿,Rebecca和Jessica。

采访者简介:Richard Olshen,斯坦福大学生物统计教授,生物统计方向(Division of Biostatistic)首席科学家,卫生研究和政策系(Department of Health Research and Policy)的副主任,斯坦福大学电气工程系和统计系兼职教授。该访谈于1999年2月19日在Leo和他的妻子Mary Lou的家中进行。 继续阅读Breiman访谈实录

有效统计实践的十项简明原则

本文作者:Robert E. Kass; Brian S. Caffo; Marie Davidian; Xiao-Li Meng; Bin Yu; Nancy Reid

原文出处

Ten Simple Rules for Effective Statistical Practice. Kass RE, Caffo BS, Davidian M, Meng X-L, Yu B, Reid N (2016) PLoS Comput Biol 12(6): e1004961. doi:10.1371/journal.pcbi.1004961

引言

数月前,广受好评的“十项简则”系列(“Ten Simple Rules” series)的创始人和长期作者 Phil Bourne 建议一些统计学家写一篇关于统计学“十项简则“的文章。(既然如何写好PLOS“十项简则”文章的原则之一就是请 Phil Bourne 加入作者群 [6], 我们希望在这对Phil的热情赞美也能达到足够的效果。)

在如何写“十项简则”的指导方针[6]里暗含了一条原则: 了解你的读者。因此,我们罗列在本文的这些原则主要是针对符合这些条件的研究者:具有一定统计知识,并且有可能得到周围统计学家的帮助,或者有亲力亲为的态度并在电脑里已经安装了一些统计软件。本文提及的原则是我们从合作研究与教学经验,以及不止一次的令人沮丧的求助:“麻烦看一下我学生的毕业论文/我的基金申请/审稿人的意见:这需要再加点统计内容,但还要看上去简洁明了。”中总结出来的。

读者也可以找到一些更细致地解释本文观点的优秀文章:比如我们最欣赏的 [4],[12],[15],[11],[17] 和 [21]。

统计学的每一篇文章一般都有一个防止被误解的声明。我们声明是:在本文中,“科学”一词代表了那些通过数据来解决感兴趣的问题的研究。这包括了社会科学,工程学,数字化人文学科,金融等领域。当然统计学家也不会羞于提醒管理者统计科学对任何机构的几乎所有活动都有影响的事实。

原则 1:统计方法应使得数据能够解决科学问题

初级统计使用者和统计专家之间的巨大差别在他们思考如何利用手头的数据时就显露出来。 尽管实验数据显然是为了解决科学问题而收集的,初级使用者往往潜意识里就已经默认数据和所研究的科学问题之间存在联系,然后直接考虑该用哪种方法对数据进行操作,而不是思考研究目标。例如,给定一张基因表达数据的表格,初级使用者往往会问“我该用什么方法去检验?”并寻找相应方法,而一个经验丰富的研究员则会先思考“表达有差异的基因是哪些?”,接着再思考能用数据解决研究问题的各种统计方法。某个正式的统计检验可能非常有用,但是一些其他的方法也可以作为备选,例如热图或者聚类技术。与之类似,在神经影像学中,在不同的实验条件下理解大脑活动是首要目标,用好看的图像来展示这些活动则是次要目标。这种从统计方法到科学问题的观念转变会重塑一个人数据收集和分析的方式。在充分了解这些问题后,统计专家会和他们的合作者讨论数据如何能解决问题以及哪种方法是最有效的。与此同时,他们会确认各种变异性(variablility)的来源和哪些未考虑的情况会打破数据和统计推断之间联系的假设。在完成这些之后,他们才试着建立分析目标和策略。这就是为何与统计学家合作会对研究非常有帮助,以及越早合作,效果就越好的原因 。详情请参考原则 2

继续阅读有效统计实践的十项简明原则

IMS:一个洲际人际交流网络(为学生免费提供会员资格)

译者注:原文刊登于 IMS Bulletin,作者为国际数理统计学会(Institute of Mathematical Statistics)现任主席郁彬教授。郁彬是加州大学伯克利分校统计系和电子工程与计算机科学系的讲席教授,是美国国家科学院、美国艺术与科学院双院士。她曾在威斯康星麦迪逊和耶鲁大学都任过教,并且曾经是贝尔实验室的技术研究成员。她在2009年到2012年间担任加州大学伯克利分校统计系系主任,还是北大微软统计和信息技术实验室的创办者和主任之一。

本文由肖楠、尤晓斌和蔡占锐翻译,邱怡轩、郁彬老师校对。

随着我在IMS(国际数理统计学会)的主席任期行将结束,继而成为“前任主席”之际, 我想为吸纳新成员作出努力而回顾 IMS 的作用。正如 IMS 网站所述:“ IMS 的宗旨在于促进统计和概率的理论与应用的发展和传播”。伴随着数据科学的出现,统计和概率思维在数据科学中扮演着越来越出众的角色,而 IMS 能否吸引更多的成员也变得至关重要。尤其是在诸如统计,概率,应用数学,计算机科学,电子工程和其他数据科学相关学科行将获得学历的人才,都将成为IMS的关注对象。对于这些年轻人而言,他们有一大部分职业生涯会在本职工作岗位,而另一部分将会是在诸如 IMS 等专业学会中。

IMS 是个什么样的组织呢?回忆一下 IMS 的起源将会让我们更好地认识它。1930 年,Annals of Mathematical Statistics(数理统计年刊)成立。随后的 1935 年,在密歇根大学统计教授 Carver 的努力下促成了 IMS 独立于 ASA(美国统计协会)而组建,以帮助数理统计学家建立联系的纽带。1938 年,年刊的编委会由诸多重量级统计学者组成,Wilks(主编),Fisher,Neyman,Hotelling,Pearson,Darmois,Craig,Deming,von Mises,Rietz,Shewhart 均在编辑之列。1973年期刊被分为两份刊物,一为 Annals of Statistics(统计学年刊),另一为 Annals of Probability(概率论年刊)。之后,Statistical Science(统计科学),Annals of Applied Probability(应用概率论年刊)及 Annals of Applied Statistics(应用统计学年刊)随之创立。此外 IMS 也和其他学术组织合作创办了期刊,例如 Electronic Journal of Probability(概率论电子期刊),the Electronic Journal of Statistics(统计学电子期刊),the Journal of Computational and Graphical Statistics(计算机及图形统计期刊),Probability Surveys(概率论与统计调查)以及 Statistics Surveys(统计学与统计调查)。从一开始,IMS 的重点就在高质量的期刊上。今天,IMS 已有更多重点,包括举办主要学术峰会和颁发统计概率领域重要奖项

继续阅读IMS:一个洲际人际交流网络(为学生免费提供会员资格)

COS访谈第十二期:Terry Speed教授,2013年总理科学奖得主

【COS编辑部按】本译文原文来自澳大利亚Science in Public,讲 述Terry Speed,一位著作等身的统计学者,对学术和社会生活的热情;原文版权归 Science in Public所有。本文译者:尤晓斌(新加坡国立大学);审校:李妙竹(上海生科院)、施涛(The Ohio State University)。

“统计学本来就应该成就其他学科,我太爱统计了,它像把钥匙一样让我们能溜进任何学科的后院里随便玩耍”

—Terry Speed

alt

图1 Terry Speed

 

用数字同癌症抗争

Terry Speed从不觉得能很快在媒体的头条上看到类似“统计学家治愈癌症”的标题,不过他坚信数学和统计学可以有效地帮助研究者认识癌症背后的诱因,从而减少手术的需要。身兼数学家和统计学家,Terry笔下诞生了不少鲜有人读得懂的精美学术著作,但除此之外,他还有学术成就以外的另一面,他曾出席法庭作证,帮助农户和采钻矿工,还为生物学家提供统计工具以解决基因的进化问题。

20年前,生物学家们只能孤立的研究一两个基因。而今,他们已经能够同时跟踪同一个细胞里的上千个基因,但若想真正理解这些信息,得到他们想要的结果,生物学家们就还需要运用Terry提出的统计方法。

当Terry年近古稀,他专注于挑选正常细胞与癌细胞不同之处,更加接近有效治疗癌症的临床研究,并同业界一同合作研发检测甲状腺细胞增殖是否发生癌变的工具。

因其在解释基因组的解释以及相关技术的研发做出的杰出贡献,这位WEHI医学研究所生物信息学领头人荣获2013年总理科学奖(Prime Minister’s Prizes for Science)继续阅读COS访谈第十二期:Terry Speed教授,2013年总理科学奖得主

COS访谈第十一期:郁彬教授

【COS编辑部按】:受访者:郁彬             采访者:施涛

原文刊登于ICSA。本文由COS翻译组策划翻译。译者是密西根大学的冷静、新加坡国立大学的尤晓斌和中国人民大学的霍志骥,全文最终由采访者施涛和被访者郁彬审核、修改、定稿,个别地方对英文原文作了补充。本翻译征得了ICSA、郁彬和施涛的同意和支持,在此表示诚挚的谢意。此外,陈丽云、高涛、肖楠、牟官迅、邓一硕、姜晓东、邱怡轩、魏太云对译文也提出了一些修正建议,在此一并表示感谢。

郁彬是加州大学伯克利分校统计系和电子工程与计算机科学系的Chancellor’s Professor。她曾在威斯康星麦迪逊和耶鲁大学都任过教,并且曾经是贝尔实验室的技术研究成员。她在2009年到2012年间担任加州大学伯克利分校统计系系主任,还是北大微软统计和信息技术实验室的创办者和主任之一。

她在顶尖的科学期刊上发表了70余篇论文,涉及统计、机器学习、信息论、信号处理、遥感、神经科学和网络研究等领域。她还在许多期刊中担任编委,比如统计年刊(Annals of Statistics)、美国统计学会会刊(Journal of American Statistical Association)、机器学习研究期刊(Journal of Machine Learning Research)和技术计量学(Technometrics)。

她是美国艺术与科学学院(American Academy of Arts and Science)的院士。2006年当选Guggenheim Fellow,2012年作了伯努利协会的图基纪念演讲(Tukey Memorial Lecturer)。她还是泛华统计协会2012年首届许宝騄奖的三位获得者之一。她也是AAAS(American Association for the Advancement of Science,美国科学促进会)、IEEE(Institute of Electrical and Electronics Engineers,电气和电子工程师协会)、IMS(Institute of Mathematical Statistics,数理统计协会)和ASA(American Statistical Association,美国统计协会)的会士。

她是IMS的主席。她担任过Statistical and Applied Mathematical Sciences Institute的国家科学委员会的联合主席,现在是Institute for Pure and Applied Mathematics的科学顾问组,以及布朗大学Institute for Computational and Experimental Research in Mathematics的执政委员会。

2013年2月13日,郁彬在她位于伯克利埃文斯教学楼的办公室里接受她以前的学生、现于俄亥俄州立大学任教的施涛的采访。以下是采访的全部内容。

继续阅读COS访谈第十一期:郁彬教授