分类目录归档:新闻通知

统计之都新闻通知

第九届中国R语言会议(杭州)

中国R语言会议是由统计之都发起,并同国内高校共同举办的R语言与数据科学会议。本次中国R语言会议(杭州)将由统计之都与浙江财经大学联合主办,浙江财经大学数据科学学院承办。中国R语言会议再次走进中国电子商务之都、长江三角洲中心城市、享有“人间天堂”美誉的魅力之都——杭州,愿与更多的数据爱好者与研究者探讨数据科学,共同进步提高!中国R语言会议,欢迎各位的到来!

自2008年在中国人民大学举办第一届中国R语言会议起,到2016年中国R语言会议已经成功地走过了第九年,先后在全国七个城市举办,影响日渐扩大,前后报名参与人数已过万人。会议内容覆盖数据科学及R语言在各行各业的应用,包括天文、地理、医疗、生物、金融、能源、互联网等领域。十年磨一剑,破鞘天下惊。在R语言会议发展壮大的同时,统计之都也已走过十年风雨。十年间,统计之都服务着广大统计学爱好者,推动着R语言在中国的传播和发展,见证着数据科学时代的逐渐崛起。迄今为止,统计之都已先后出版八本R语言相关图书,举行五十余期海内外沙龙;未来,我们将再接再厉,继续为国内统计学和数据科学的发展贡献自己的力量。2

继续阅读第九届中国R语言会议(杭州)

第九届中国R语言会议(成都)会议通知

2016年是统计之都发起主办的中国R语言会议第九年,也是统计之都成立十周年。本届中国R语言会议(成都)将由统计之都与西南交通大学联合主办,西南交通大学经济管理学院智慧营销实验室协办。这次R会议首次走进西南地区,愿与更多的数据爱好者探讨数据科学,共同进步提高!中国R语言会议,欢迎各位的到来!xinanjiaoda
一、会议概况

继续阅读第九届中国R语言会议(成都)会议通知

2016年“大数据时代的统计学”教学研讨会通知

 2016年“大数据时代的统计学”教学研讨会  

暨第五届全国高校统计类专业骨干教师研修班

应用统计硕士教指委与五校联合大数据分析

硕士培养协同创新平台联合推出

主办单位

全国应用统计专业学位研究生教育指导委员会秘书处

五校联合大数据分析硕士培养协同创新平台(中国人民大学 北京大学 中国科学院大学 中央财经大学 首都经济贸易大学)

协办单位

中国人民大学出版社 继续阅读2016年“大数据时代的统计学”教学研讨会通知

第九届中国R语言会议(北京)纪要

第九届中国R语言会议(北京会场)、第七届中国人民大学国际统计论坛与2016百分点数据与价值国际论坛共同组成的大统计与数据科学联合会议于2016年5月27日至29日在中国人民大学成果举办。5月27日主会场位于世纪馆,5月28、29日各个分会场分别位于逸夫报告厅、国学馆报告厅及第一教学楼。

DSC04026

一、会议概况

今年是中国R语言会议举办的第九年。本次会议由统计之都与中国人民大学、北京大学、伦敦政治经济学院、百分点集团联合主办,并得到了考拉征信和量邦科技等战略合作伙伴的鼎力支持协办,以及微软、Tableau、懒投资、RStudio、记健康和纽约数据科学学院等友情合作伙伴的大力支持。在三天的会议时间里,数据科学各行各业的同仁们欢聚一堂,共襄盛举,畅所欲言。在大会会务组的不懈努力下,本次会议比往届有了更大的突破。会议共设有22个分会场,126场主题报告,覆盖大数据技术、互联网金融、量化投资、人网物联、生物信息等诸多当下热门话题。报名非常火爆,人数突破5000人,报名单位超过1500个。不仅创下历届之最,也使本次会议成为亚洲地区规模最大的数据科学盛会之一。

二、会议内容

本次会议分为第一天的主会场和其后两天的22个分会场。主会场演讲嘉宾包括学界杰出代表、业界大咖等。分会场包括互联网征信专场(考拉征信专场)、可视分析专场(Tableau冠名)、量化金融专场(量邦科技冠名)、软件工具专场(微软冠名)、经济金融专场(懒投资冠名)、汽车联网专场、自然语言专场、概率统计专场、医疗健康专场、智能制造专场、计算平台专场、生物医疗专场、商务分析专场、生物统计专场、生物信息专场、机器学习专场、智慧城市专场、计算广告专场、社交网络专场、时空数据专场,涵盖了数据科学的各个领域,讨论了数据科学在诸多领域的最新进展。 继续阅读第九届中国R语言会议(北京)纪要

美国统计协会开始正式吐槽(错用)P值啦

(图片来源:https://xkcd.com/1478,一幅讽刺滥用P值的漫画)

今天美国统计协会(ASA)正式发布了一条关于P值的声(吐)明(槽),算起来可以说是近期统计学界的一件大事了。为什么这么说呢?首先,P值的应用太广,所以对P值进行一些解释和声明非常有必要。其次,对P值的吐槽历来有之,但今天是第一次被一个大型的专业协会以非常正式的形式进行澄清,多少带有一些官方的意思。声明的全文可以在这个页面中下载。

那么这则声明里面都说了什么呢?小编整体读了一遍,把我认为重要的信息概括在这篇文章之中。

首先,ASA介绍了一下这则声明诞生的背景。2014年,ASA论坛上出现了一段如下的讨论:

问:为什么那么多学校都在教 p = 0.05?

答:因为那是科学团体和期刊编辑仍然在用的标准。

问:为什么那么多人还在用 p = 0.05?

答:因为学校里还在这么教。

看上去多少有点讽刺的味道,但事实却也摆在眼前。从舆论上看,许许多多的文章都在讨论P值的弊端,小编摘录了几条言辞比较激烈的:

这是科学中最肮脏的秘密:使用统计假设检验的“科学方法”建立在一个脆弱的基础之上。——ScienceNews(Siegfried, 2010)

假设检验中用到的统计方法……比Facebook隐私条款的缺陷还多。——ScienceNews(Siegfried, 2014)

针对这些对P值的批评,ASA于是决定起草一份声明,一方面是对这些批评和讨论作一个回应,另一方面是唤起大家对科学结论可重复性问题的重视,力图改变长久以来一些已经过时的关于统计推断的科学实践。经过长时间众多统计学家的研讨和整理,这篇声明今天终于出现在了我们面前。

P值是什么

这份声明首先给出了P值一般的解释:P值指的是在一个特定的统计模型下,数据的某个汇总指标(例如两样本的均值之差)等于观测值或比观测值更为极端的概率。

这段描述是我们通常能从教科书中找到的P值定义,但在实际问题中,它却经常要么被神话,要么被妖魔化。鉴于此,声明中提出了六条关于P值的准则,作为ASA对P值的“官方”态度。这六条准则算是这条声明中最重要的部分了。

继续阅读美国统计协会开始正式吐槽(错用)P值啦