分类目录归档:职业事业

统计学的职业、事业(包括留学)

COS访谈第24期:郭绍俊老师

【COS编辑者按】受访者:郭绍俊      采访者:冯璟烁、于嘉傲     校对:于嘉傲    

郭绍俊     2003年毕业于山东师范大学,2008年获得中国科学院数学与系统科学研究院理学博士学位。博士毕业后留中国科学院数学与系统科学研究院工作,助理研究员,任期至2016年。工作期间,于2009年-2010年赴美国普林斯顿大学运筹与金融工程系博士后研究,做高维数据分析方面的研究工作,并于2014-2016年在英国伦敦经济学院统计系做博士后研究,做大维时间序列建模方面的研究。 现为中国人民大学统计与大数据研究院副教授。目前主要研究方向有:高维统计学习;非参数及半参数统计建模;大维统计计算;生存分析及函数型数据分析等。 继续阅读COS访谈第24期:郭绍俊老师

RStudio的前世今生——RStudio创始人专访

本文是一篇Joseph B Rickert(简称JBR)对J.J. Allaire(RStudio的创始人和首席执行官)的采访稿,原文在此。统计之都与作者沟通后得到授权将其翻译为中文,希望可以让广大读者能够更多了解在R的世界中这个叫RStudio的地方。在这次采访中讨论了RStudio的历史、使命和J.J.的未来愿景。 短暂的交谈中讨论了各种各样的主题,包括RStudio的业务、R语言的发展、R联盟对R社群的重要性以及J.J.对R新手们的建议。

 

J.J. Allaire
J.J. Allaire

继续阅读RStudio的前世今生——RStudio创始人专访

张志华教授:机器学习——统计与计算之恋

编辑部按:本文是从张志华老师在第九届中国R语言会议和上海交通大学的两次讲座中整理出来的,点击此处观看幻灯片张志华老师是上海交通大学计算机科学与工程系教授,上海交通大学数据科学研究中心兼职教授,计算机科学与技术和统计学双学科的博士生指导导师。在加入上海交通大学之前,是浙江大学计算机学院教授和浙江大学统计科学中心兼职教授。张老师主要从事人工智能、机器学习与应用统计学领域的教学与研究,迄今在国际重要学术期刊和重要的计算机学科会议上发表70余篇论文,是美国“数学评论”的特邀评论员,国际机器学习旗舰刊物Journal of Machine Learning Research 的执行编委,其公开课《机器学习导论》和《统计机器学习》受到广泛关注。

张志华

张志华老师和他的学生们

大家好,今天我演讲的主题是 “机器学习:统计与计算之恋。我用了一个很浪漫的名字,但是我的心情是诚惶诚恐的。一则我担心自己没有能力驾驭这么大的主题,二则我其实是一个不解风情之人,我的观点有些可能不符合国内学术界的主流声音。

最近人工智能或者机器学习的强势崛起,特别是刚刚过去的AlphaGo和韩国棋手李世石九段的人机大战,再次让我们领略到了人工智能或机器学习技术的巨大潜力,同时也深深地触动了我。面对这一前所未有的技术大变革,作为10多年以来一直从事统计机器学习一线教学与研究的学者,希望借此机会和大家分享我个人的一些思考和反思。

在这场人工智能发展的盛事里,我突然发现,对我们中国的学者来说,好像是一群看热闹的旁观者。不管你承认还是不承认,事实就是和我一代的或者更早的学者也只能作为旁观者了。我们能做的事情是帮助你们—中国年轻的一代,让你们在人工智能发展的大潮中有竞争力,做出标杆性的成就,创造人类文明价值,也让我有个加油欢呼的主队。

继续阅读张志华教授:机器学习——统计与计算之恋

统计之都十周年感言

呐,统计之都已经创建十周年。作为所谓的创始人,自然也是时候卷起袖子跟大家一起干一大碗鸡汤,毕竟十年这个时间长度听起来好像还蛮厉害的。不巧最近这些天挺忙,加上我其实并不太喜欢专门写文字给乌泱乌泱的客官们看,年龄越大,就越不愿意去安利别人。这篇十周年感言如何写,每天晚上苦苦思考三分钟之后就睡得特别香。想全面概括这十年的发展是不可能的,只能用我最擅长的意识流方式想到哪儿说到哪儿了,这篇文章基本上是纯个人视角,无意借机强行输出价值观。10th

想当初创建统计之都那会儿,朕是天不怕地不怕,心高气傲,不懂就放狗搜了若无其事地回来装懂,在满论坛的点赞声中深藏功与名。有时候在论坛回帖回到半夜一两点,就是那种“扶朕起来朕还能回”的感觉。时间长了,偶尔会有不知情的热心网友称谢教授,嗨别介,我就一逗比本科生而已,然而心里自然窃喜不已,三条腿的蛤蟆好找,二十二岁的教授不常见啊。现在想想人不轻狂枉少年,虚荣心也不是什么坏事,我的 R 语言技能,大致就是在三天两头帮人看函数文档中学出来的。话说那时候 R 帮助文档还是 CHM 格式的,现在的娃估计都不知道咩是 CHM 了。这话题切换到 R 也忒快了。 继续阅读统计之都十周年感言

美国统计协会开始正式吐槽(错用)P值啦

(图片来源:https://xkcd.com/1478,一幅讽刺滥用P值的漫画)

今天美国统计协会(ASA)正式发布了一条关于P值的声(吐)明(槽),算起来可以说是近期统计学界的一件大事了。为什么这么说呢?首先,P值的应用太广,所以对P值进行一些解释和声明非常有必要。其次,对P值的吐槽历来有之,但今天是第一次被一个大型的专业协会以非常正式的形式进行澄清,多少带有一些官方的意思。声明的全文可以在这个页面中下载。

那么这则声明里面都说了什么呢?小编整体读了一遍,把我认为重要的信息概括在这篇文章之中。

首先,ASA介绍了一下这则声明诞生的背景。2014年,ASA论坛上出现了一段如下的讨论:

问:为什么那么多学校都在教 p = 0.05?

答:因为那是科学团体和期刊编辑仍然在用的标准。

问:为什么那么多人还在用 p = 0.05?

答:因为学校里还在这么教。

看上去多少有点讽刺的味道,但事实却也摆在眼前。从舆论上看,许许多多的文章都在讨论P值的弊端,小编摘录了几条言辞比较激烈的:

这是科学中最肮脏的秘密:使用统计假设检验的“科学方法”建立在一个脆弱的基础之上。——ScienceNews(Siegfried, 2010)

假设检验中用到的统计方法……比Facebook隐私条款的缺陷还多。——ScienceNews(Siegfried, 2014)

针对这些对P值的批评,ASA于是决定起草一份声明,一方面是对这些批评和讨论作一个回应,另一方面是唤起大家对科学结论可重复性问题的重视,力图改变长久以来一些已经过时的关于统计推断的科学实践。经过长时间众多统计学家的研讨和整理,这篇声明今天终于出现在了我们面前。

P值是什么

这份声明首先给出了P值一般的解释:P值指的是在一个特定的统计模型下,数据的某个汇总指标(例如两样本的均值之差)等于观测值或比观测值更为极端的概率。

这段描述是我们通常能从教科书中找到的P值定义,但在实际问题中,它却经常要么被神话,要么被妖魔化。鉴于此,声明中提出了六条关于P值的准则,作为ASA对P值的“官方”态度。这六条准则算是这条声明中最重要的部分了。

继续阅读美国统计协会开始正式吐槽(错用)P值啦