分类目录归档:经典理论

统计学基础知识、学习经验等

降维攻击:目标,比率指标

作者简介:陈丽云,在eBay从事 Experimentation Analytics Research。网络上素来自黑为“落园园主”。

在这个互联网数据唾手可得的时代,但凡有数据的地方,就有战争。一场战役,有人登高摇旗呐喊,有人趁夜暗度陈仓。在以浩瀚数据为目标的战场上,大家费尽心思用尽招数,各种降维攻击,只是没有《三体》里面的体外文明那种强行把三维生物体打击到二维空间的那么残忍罢了。实践中,我们利用各种统计模型对数据进行一而再、再而三的降维,最终获得屈指可数的统计量来做进一步判断。园主一时起意,打算记录一下一场针对比率指标的降维攻击,以飨读者。

简单介绍一下实战的背景。互联网产业是一个快速更迭的产业,而大量的新产品上线和旧产品改良过程牵扯到一个重要的测试手段:A/B实验。A/B实验其实是最简单的随机对照实验(randomized control experiment),想法便是对不同的访客我们呈现不同的网站版本,然后比较一下版本之间的效果差异就好了。这是一种客观和简洁高效的判定方式,但也是陷阱无数。

园主常驻某电商网站的A/B实验咨询服务台,负责回答各种古灵精怪的问题。一日,有人跑过来问, “咦,我们最近想看一下实验对于网站上卖的东西的价格有没有影响,是不是有bug啊我没找到。” 等一下,你们难道不知道不能这么跟程序员讲话的么?

你不能对一个程序员说:你的代码有bug。他的第一反应是:1,你的环境有问题吧;2,傻逼你会用吗。如果你委婉地说:你这个程序和预期的有点不一致,你看看是不是我的使用方法有问题。他本能地会想:操,是不是出bug了!

image01

园主表面故作淡定的说,打发走了咨询者之后,查了一下来龙去脉,还真是个历史遗留bug…说起来这个价格指标也不是很复杂,其实就是在一个A/B实验期间,实验组和对照组用户购买的所有商品的平均价格的差异。听起来不就是算个平均数然后减一下嘛,这有什么难算的?在园主看来,有三个重要的问题需要注意,下面一一解释。

继续阅读降维攻击:目标,比率指标

如何更好的展示你的研究成果

【COS编辑部按】本文作者是美国统计协会(ASA)的会员、莫纳什大学教授Dianne Cook 。她的研究方向包括数据可视化,探索性数据分析,多元方法,数据挖掘和统计计算。曾参与制作软件XGobi,ggobi,cranvas和几个R包。原文发表在 The R journal ,本文由陈妍翻译,高涛、肖楠和谢益辉审校,王小宁编辑。dicook-2014

摘要 

随着国际R用户会议“user!2011”的临近,许多与会者可能正在思考如何通过演讲集中展现自己的一些想法,本文便为大家就演讲和制作海报等问题提供了一些建议。

背景

在即将到来的几次学院工作面试中,我准备介绍我的博士研究项目,就在我刚完成一次面试的演练时,我的导师安德烈·布加(Andreas Buja)让我坐下来:重新起草我的讲稿!我本初是参照罗格斯大学每周一次的研讨会上许多演讲者那样做的——通过幻灯片一张接一张的展示自己研究工作的细节,但安德烈说,那可能很适合论文的展示,但并不是作为讲稿的最佳选择。我们列出了我的研究中的重点问题,然后插入了一张幻灯片简单的写道“欲知后事如何,请听下回分解”。我们在之后的几张幻灯片中阐述了研究方法,在报告临近结束时才给出了问题的答案。 继续阅读如何更好的展示你的研究成果

COS每周精选:再谈P值

本期投稿:尤晓斌 冷静 王威廉  数学文化

编辑:王小宁

统计之都主站之前有一篇《不得不提的P值》曾引发众多的讨论,去年的《P值之死》也曾在圈内引起不小的骚动,编者罗列了一些新的资料供各位客官慢慢欣赏,孰是孰非,您来决断。

一篇 pvalue applet,作者Jim Berger有一系列关于pvalue的好文章,提醒人们慎用pvalue。跳出来想,对比CS对待数据科学的态度,统计人还是有些保守悲观的。学术需要保守,业界需要激进。这么大费篇幅的“自我检讨”其实并不利于学科的推广。

继续阅读COS每周精选:再谈P值

因果推断简介之八:吸烟是否导致肺癌?Fisher versus Cornfield

这一节介绍一个有趣的历史性例子:吸烟是否导致肺癌?主要涉及的人物是 R A Fisher 和 J Cornfield。前者估计上这个网站的人都听过,后者就显得比较陌生了。事实上,Cornfield 在统计、生物统计和流行病学都有着非常重要的贡献。来自 Wikipedia 的一句介绍:“He was the R. A. Fisher Lecturer in 1973 and President of the American Statistical Association in 1974.” 虽然 Cornfield 和 Fisher 学术观点不同(本节介绍),但是 Cornfield 还是在 1973 年给了 Fisher Lecture。

下面我们先介绍 Fisher 和 Cornfield 关于观察性研究中因果推断的两种观点,再给出技术性的细节。

继续阅读因果推断简介之八:吸烟是否导致肺癌?Fisher versus Cornfield

因果推断简介之七:Lord’s Paradox

在充满随机性的统计世界中,悖论无处不在。这一节介绍一个很有名,但是在中文统计教科书中几乎从未介绍过的悖论。这个悖论是 Educational Testing Service (ETS) 的统计学家 Frederic Lord 于 1967 年提出来的;最终由同在 ETS 工作的另外两位统计学家 Paul Holland 和 Donald Rubin 于 1982 年圆满地找出了这个悖论的根源。这部分先介绍这个悖论,再介绍 Holland 和 Rubin 的解释,最后是一些结论。

一 Lord’s Paradox
考虑下面一个简单例子,具体的数字是伪造的。某个学校想研究食堂对于学生体重是否有差异性的影响,尤其关心食堂对于男女学生体重影响是否相同。于是统计学家们收集了如下的数据:学生的性别 $G$;学生在 1963 年 6 月入学时候的体重 $X$;学生在 1964 年 6 月放暑假时候的体重 $Y$。

第一个统计学家,采取了一种很简单的方法。如图所示,横轴表示 1963 年 6 月入学前的体重 $X$,纵轴表示 1964 年 6 月前放假的体重 $Y$。个体上来看,男女入学前和入学后一年体重都会有些变化,男女学生体重的散点图分别用绿色和红色标出。从男女学生生平均体重来看,男生入学前后一年平均体重均是 $150$ 磅(图中右上角的黑点),女生入学前后一年平均体重均为 $130$ 磅(图中左下角的黑点)。图中的虚线是对角线 $Y=X$,两个黑点均位于对角线上。因此,第一个统计学家的结论是食堂对于男女学生体重都没有影响,因此对男女学生体重的作用相同。
继续阅读因果推断简介之七:Lord’s Paradox