分类目录归档:职业事业

统计学的职业、事业(包括留学)

美国统计协会开始正式吐槽(错用)P值啦

(图片来源:https://xkcd.com/1478,一幅讽刺滥用P值的漫画)

今天美国统计协会(ASA)正式发布了一条关于P值的声(吐)明(槽),算起来可以说是近期统计学界的一件大事了。为什么这么说呢?首先,P值的应用太广,所以对P值进行一些解释和声明非常有必要。其次,对P值的吐槽历来有之,但今天是第一次被一个大型的专业协会以非常正式的形式进行澄清,多少带有一些官方的意思。声明的全文可以在这个页面中下载。

那么这则声明里面都说了什么呢?小编整体读了一遍,把我认为重要的信息概括在这篇文章之中。

首先,ASA介绍了一下这则声明诞生的背景。2014年,ASA论坛上出现了一段如下的讨论:

问:为什么那么多学校都在教 p = 0.05?

答:因为那是科学团体和期刊编辑仍然在用的标准。

问:为什么那么多人还在用 p = 0.05?

答:因为学校里还在这么教。

看上去多少有点讽刺的味道,但事实却也摆在眼前。从舆论上看,许许多多的文章都在讨论P值的弊端,小编摘录了几条言辞比较激烈的:

这是科学中最肮脏的秘密:使用统计假设检验的“科学方法”建立在一个脆弱的基础之上。——ScienceNews(Siegfried, 2010)

假设检验中用到的统计方法……比Facebook隐私条款的缺陷还多。——ScienceNews(Siegfried, 2014)

针对这些对P值的批评,ASA于是决定起草一份声明,一方面是对这些批评和讨论作一个回应,另一方面是唤起大家对科学结论可重复性问题的重视,力图改变长久以来一些已经过时的关于统计推断的科学实践。经过长时间众多统计学家的研讨和整理,这篇声明今天终于出现在了我们面前。

P值是什么

这份声明首先给出了P值一般的解释:P值指的是在一个特定的统计模型下,数据的某个汇总指标(例如两样本的均值之差)等于观测值或比观测值更为极端的概率。

这段描述是我们通常能从教科书中找到的P值定义,但在实际问题中,它却经常要么被神话,要么被妖魔化。鉴于此,声明中提出了六条关于P值的准则,作为ASA对P值的“官方”态度。这六条准则算是这条声明中最重要的部分了。

继续阅读美国统计协会开始正式吐槽(错用)P值啦

COS沙龙第34期(北京)纪要

主题:医疗问题中复杂系统的建模,检测,优化以及控制问题

嘉宾:黄帅

主办:统计之都

场地:中国人民大学

组织:蔡锐 魏太云 王建桥

纪要:钟琰

简介:第34期沙龙(北京)与2015年12月19日在北京大学顺利举办。本次沙龙由人大统院本科生王健桥主持,嘉宾黄帅老师现任职美国华盛顿大学-西雅图分校的工业工程系助理教授。黄老师于2007年在中国科技大学少年班系获得统计学位,于2012年在美国亚利桑那州立大学工业工程系获得博士学位。其主要研究方向是结合统计、机器学习、运筹方法,去研究一些医疗管理以及工程领域里面的复杂决策问题。具体应用比如老年痴呆、青少年糖尿病、手术感染等问题的监测和预防等等。从医疗问题出发,这些研究成果可以被广泛的应用在其他各类复杂系统之上,比如制造业或者供应链管理。他的研究获得了美国自然科学基金(National Science Foundation),Juvenile Diabetes Research Foundation 以及其他一些医学基金会以及医学机构的资助。

继续阅读COS沙龙第34期(北京)纪要

如何更好的展示你的研究成果

【COS编辑部按】本文作者是美国统计协会(ASA)的会员、莫纳什大学教授Dianne Cook 。她的研究方向包括数据可视化,探索性数据分析,多元方法,数据挖掘和统计计算。曾参与制作软件XGobi,ggobi,cranvas和几个R包。原文发表在 The R journal ,本文由陈妍翻译,高涛、肖楠和谢益辉审校,王小宁编辑。dicook-2014

摘要 

随着国际R用户会议“user!2011”的临近,许多与会者可能正在思考如何通过演讲集中展现自己的一些想法,本文便为大家就演讲和制作海报等问题提供了一些建议。

背景

在即将到来的几次学院工作面试中,我准备介绍我的博士研究项目,就在我刚完成一次面试的演练时,我的导师安德烈·布加(Andreas Buja)让我坐下来:重新起草我的讲稿!我本初是参照罗格斯大学每周一次的研讨会上许多演讲者那样做的——通过幻灯片一张接一张的展示自己研究工作的细节,但安德烈说,那可能很适合论文的展示,但并不是作为讲稿的最佳选择。我们列出了我的研究中的重点问题,然后插入了一张幻灯片简单的写道“欲知后事如何,请听下回分解”。我们在之后的几张幻灯片中阐述了研究方法,在报告临近结束时才给出了问题的答案。 继续阅读如何更好的展示你的研究成果

COS访谈第十七期:褚挺进

 

SAMSUNG CAMERA PICTURES

【COS编辑部按】

受访人:褚挺进老师   

采访人:王小宁

整理:王小宁

 

褚挺进老师现任中国人民大学统计学院讲师, 于2012年获得美国科罗拉多州立大学统计学博士学位。他主要从事空间统计和数据挖掘方法的研究, 已在重要学术期刊上发表多篇论文, 包括统计学顶级期刊The Annals of Statistics和Journal of the Royal Statistical Society, Series B。

问:您最初学的数学,为什么在读PhD转为统计呢?统计学有什么吸引您的地方

褚:我一开始做得是数学,然后感觉自己又解决不了什么巨大的数学问题,所以感觉做偏数据和偏应用的比较好一点。然后大家都说统计是处理数据的科学,所以选择了统计。当然,另外一个原因是那时候学长们都说统计比较容易找工作。统计学吸引我的地方是它的应用价值比数学要强点,统计虽然有一些理论推导但是比数学少多了。

问:您觉得国内的统计学和国外的统计学教学模式有什么区别?

褚:我感觉在国内的本科生把研究生的课程都上了,甚至国外没开的课都开了,我觉得我们的同学的统计基础比国外的学生强多了。我记得那边没有非参数统计这门课,并且那边的研究生也不会上测度论,他们的那边的研究生学的概率论大体上是我们的本科关于概率论的介绍。我们当时研究生的课程主要有数理统计、概率论、回归分析、实验设计、抽样技术和时间序列,博士的话和老板做一些研究写paper,研究的理论基础主要会用到数学分析、高等代数和实变函数。

问:听说您念PhD时就已经发了四大的文章,您分享下其中的故事么?您觉得发出一篇好文章最重要的是什么?

褚:其实也没有什么故事啦。刚开始的时候是和导师一起做的,起初是做一些模拟,做的多了发现里面有很多值得研究的地方,那篇论文做了1年多。我认为发论文最重要的是要有想法,要让别人知道这是一件很有意义的事情。先要明白之前别人做过的东西,你发现了其中的不足,然后再去改进。另外,在学科的交叉处比较容易出成果。我主要是搞空间统计的,把经典的统计的理论拿到空间统计中来进行分析,就比较容易写出来东西。当然了,不能排除投稿的随机性,这得看自己的运气了。

问:您认为统计研究对编程要求高吗?您对本科生做科研有什么建议? 继续阅读COS访谈第十七期:褚挺进

COS每周精选:寒假来了,小编分享一些学习资料

本期投稿: 谢益辉 王威廉  蔡占锐 王小宁

编辑:王小宁

R可视化

用rgl包绘制彗星的3D图形

Kimmel癌症研究中心发表论文称“患癌症主要是因为你运气不好(而不是因为抽烟喝酒烫头发)”,对此奥克兰大学教授Thomas Lumley(他被人熟知的身份是R核心开发成员)提出了质疑,他将文中的一幅散点图在不同的坐标轴下重画了一下,发现原文宣称的“2/3的癌症可以被DNA复制过程中的随机错误解释”不可靠,若坐标轴不取对数,这个比例会大大下降。

继续阅读COS每周精选:寒假来了,小编分享一些学习资料