COS每周精选:统计学中的新鲜事

本期投稿:谢益辉 冷静 王小宁

编辑:王小宁

数据可视化:

世界上最高的螺旋楼梯,好冷啊

学界VS业界

“如果我像科学对待我一样对待我老婆,她恐怕早就跑了”,从学术界跳槽到业界当数据科学家的John Stanton-Geddes 如是说.小编认为学术界并非不再重要,而是已经开始供大于求,学界追求方法创新,业界更偏重实用,现今创新的速度也许超过了实用的需求。

贝叶斯统计

Karl Broman洗完衣服从烘干机里清理出11只不重样的袜子,他猜测自己应该还有更多袜子,那到底他有多少只袜子呢?好基友Rasmus
Bååth对这个“小数据”问题用近似贝叶斯计算方法(Approximate Bayesian
Computation)做了一个估计,最后结果和真实袜子数目惊人地接近.小编看完后感叹现在计算资源这么发达(文中的计算方法除了先验分布的选取之外可谓纯暴力计算),还读统计博士作甚啊。

描述统计

埃博拉的死亡率怎么算?这个简单的频数/总数的问题让统计学家们纠结无比。这篇AAAS的文章指出,因为计算方法的差异,死亡率结果可能大相径庭

继续阅读

COS沙龙第22期(北京)


2014-10-19 162807

 

2014年10月19日,第22期COS沙龙(北京站)在北京大学光华管理学院如期举行。各位统计爱好者冒着京城茫茫的雾霾前来,统计沙龙为大家呈现了一场主题为“移动音频推荐系统实践二三事”的精彩分享。本次沙龙由人大统院本科生闫晗主持,嘉宾是考拉FM&考拉电子狗推荐系统的负责人陈开江继续阅读

第七届中国R语言会议(广州会场)通知

R是一门用于数据分析和图形展示的语言、平台和环境,其官方机构每年都会举办useR!会议,各个国家及地区也定期有R用户的交流活动。在国内,自2008年以来,中国已经在北京和上海成功举办了六届R语言会议,促进了R语言乃至数据科学在中国的推广和发展。为了进一步加强各领域R语言使用者之间的交流和互动,中山大学数学与计算科学学院、华南统计科学研究中心和统计之都将于2014年11月15日在中山大学南校区举办第七届中国R语言会议(广州会场)。这将是R语言会议首次在华南地区举办。

除了统计之都主站,会务信息还会通过统计之都微信(扫描本页面右侧微信公众平台二维码即可关注)、微博(@统计之都)来发布,欢迎大家关注获取最新消息。

会议的相关情况如下:

一、会议时间

2014年11月15日。

二、会议地点

广州市海珠区新港西路135号中山大学南校区网络中心报告厅。中山大学
继续阅读

R绘制中国航线分布夜景图

本文作者:李根,资深数据分析师,数学爱好者。

绘制数据地图是一种有效展现空间数据的方法,美丽的数据展示更容易引起读者的共鸣。本地图设计的初衷是展示中国航线的分布规律,进而可以分析成本、客流量等问题。

flight-night-scene本文参考了以下文献进行绘制:
http://spatialanalysis.co.uk/2012/06/mapping-worlds-biggest-airlines/

一、地图数据来源

地图所使用的数据均可以从网上下免费下载。
航线、机场坐标:http://openflights.org/data.html

  • 机场:airports.dat
  • 航线:routes.dat

板块地图、都市地图:http://www.naturalearthdata.com/downloads/

  • 世界地图:ne_10m_admin_0_countries.shp
  • 都市地图:ne_10m_urban_areas.shp

(注:都市地图是用来绘制灯光效果的。)

继续阅读

郁彬:让我们拥抱数据科学(Let us own data science)

郁彬教授8月22日在北京大学做了名为让我们拥抱数据科学(Let us own data science)的讲座。在演讲中郁彬从一个统计学家的角度出发,讲述了数据科学的兴起历史和目前状况,并且对统计学科、从事统计相关工作的人士如何跟上时代步伐拥抱数据科学给出了非常多的建议。经过郁彬的允许和支持,本文分享了她此次演讲的幻灯片和视频!

演讲人介绍:郁彬是加州大学伯克利分校统计系和电子工程与计算机科学系的讲席教授,是美国国家科学院、美国艺术与科学院双院士。她曾在威斯康星麦迪逊和耶鲁大学都任过教,并且曾经是贝尔实验室的技术研究成员。她在2009年到2012年间担任加州大学伯克利分校统计系系主任,还是北大微软统计和信息技术实验室的创办者和主任之一。

讲座摘要:This talk is a repeat of my IMS Presidential Address in Sydney at the joint conference of Statistical Society of Australia and IMS in July, 2014. It is about the history of the statistics discipline, the intimate connections between statistics and computing, and the need for Statistics to embrace data science.

幻灯片:http://www.stat.berkeley.edu/~binyu/ps/papers2014/IMS-pres-address14-yu.pdf

中文演讲视频:

在悉尼的英文演讲视频(略有不同):http://www.youtube.com/watch?v=92OjsYQJC1U