分类目录归档:网站导读

统计之都网站导读系列

COS每周精选:A visual explanation of Markov Chains

本周投稿:谢益辉 冷静 施涛

  •  Norm Matloff教授的开放书籍一本:我觉得这老爷子挺擅长写东西给初学者的
  • Terence’s Stuff: Give Industry a Chance
  •  百年地震数据供查询,数据为王的时代,珍贵矿藏还不赶快收藏~
  • 一本关于R的文本数据处理的免费电子书,正所谓书到用时方恨少,事非经过不知难。电子书一本接着一本,你可看过多少?
  •  上哪儿找数据?(不要点我,不要点我)
  • 有闲功夫的人真多啊,看这里有一个“牛说”的R包。但宠萌系的童鞋一定不要错过,各种喵神汪神齐聚于此。
  • 各种排序算法的声音,强迫症患者看了一定觉得通体舒展,混乱的数值最后被排得整整齐齐。
  • 新书快递《实践可重复性研究》:虽然小编参与撰写了其中一章,这个话题也很重要,但学术界应该心知肚明这种集合编写的书的质量……好吧,我承认只是我这章其实没怎么走心,请看官绕道……
  • 神经网络、流形和拓扑 一篇观点详实,证明充分的好文章~
  • 猫眼窥R 一份初级R语言教程。
  • 一个关于心理学中“锚定效应”的试验:Thomas Lumley大人又顽皮了,他让学生把自己的电话号码所有数字加起来,然后再估计非洲有多少个国家,本来这是两个不相关的变量,但学生似乎受了电话号码数字之和的影响,和越大,他们的估计越高。话说大家可知道这个网站专门存放着其他地方不让放的吗,等待大家探秘哟。
  • – 如果你只知道一位女性的名字,如何估计她的年龄
  • 斯坦福教授Art Owen(江湖绝技:经验似然)放出了一本关于蒙特卡洛的免费电子书“Monte Carlo theory,methods and examples” 。大家当做茶余饭后的甜点看看可好?
  • 论画图需要标明坐标轴的重要性。此图甚冷,大家做好准备。
  • 又一个关于大数据、数据科学和统计学的讨论,不过这次出手的是Terry Speed,大大。有什么值得学习的地方吗?
  • 马尔可夫链的可视化。此处光看图也是一种享受O(∩_∩)O~

COS每周精选:统计学者的工作及风范: 灵感、抱负与雄心

本周投稿:谢益辉 冷静 施涛  

  • News:Dr. Yihui Xie at RStudio Inc. has been selected as ICSA Bulletin’s editor-in-chief 2015-2018.
  • 从历史上看, 一个国家要变成大国, 变成真正受人尊敬的大国, 或者一个科学界, 要衡量它的成熟以及它本身的品质, 其中一个很重要的衡量标准是它怎么对待学术成就和学术风范。吴建福教授所谈论的三重境界可以看做我们自我认识的一座标杆。传送门。以及吴建福教授在北大的讲座
  • R与网络:与普通的扩散研究不同,网络扩散开始考虑网络结构对于扩散过程的影响。在各式各样的网络中扩散过程都是何种形式?用R出手,一目了然
  • R Application in Stock:看来经济学诺贝尔奖的余温未平,虽然长期的股票价格表现出一些规律,但短期内却显得繁芜丛杂,不看长线看短线,股票价格是可预测的嘛?
  • R画图:R能输出SPSS那样漂亮的图表输出嘛?有需要的童鞋看过来
  • R与Data Science:“秀恩爱,死的快。”相信脸谱网前两天关于情侣关系的展示给了您深刻的印象。什么什么,striking points, no details?来看看这位极客大侠给我们的解译
  • Machine Learning:用机器学习的方法玩Flappy Bird游戏,正所谓高端大气,狂炫酷拽。(这位兄台你这么酷,你女朋友知道吗?咳咳,花这么多时间研究这个怎么会有女朋友……)
  • 新鲜的老生常谈:当我们谈论数据科学的时候,我们在谈论什么?这是一群新生的探索,也是一群老生的总结。不愤不启,不悱不发,正确的提出问题,才有可能找到解答。在一问一答中,理解数据科学。
  • 数据可视化: 数据可视化中颜色的运用。数据可视化中,用色彩来表示一些变量往往可以起到很显著的视觉效果,但是在颜色的HSV(hue, saturation, value)表示中的等距对人的视觉来说不一定等距,这就可能造成一些理解上的偏差。文章介绍了几个避免的方法。愿意深入了解的可以看看IBM的博文: Why Should Engineers and Scientists Be Worried About Color? 探其因,穷其理,辨其思。
  • Timeline of statistics: 温故而知新,可以为师矣。从上古开天辟地,到如今的数据科学,了解过去的发展,才能知道未来的走向。
  •  数据科学远见:(普渡众生大学)的Cleveland老爷子,在2001年就写了一篇文章,提出了他的对数据科学这个学科设置的构想。
    •   Multidisciplinary Investigation (25%) — collaboration with subject areas
    • Models and Methods for Data (20%) — more traditional applied statistics
    • Computing with Data (15%) — hardware, software, and algorithms
    • Pedagogy (15%) — how to teach the subject
    • Tool Evaluation (5%) — keeping track of new tech
    • Theory (20%) — the math behind the data
  • 这篇文章是一系列其它有关统计教育的文章中的一篇,这一期文章的目录参见链接。可以看看21世纪初的时候,统计学家们认为统计学科应该何处去。

COS每周精选:谈钱不伤感情

本周投稿:谢益辉 冷静 施涛   肖楠

 

  • 谈钱不伤感情:Revolutions 做了一项调查,发现掌握R语言的人的工资水平在11万美元左右(年薪),比Mapreduce, hadoop 都要高。。哎,别跟我谈钱,多俗啊!忍不住的快来看闪闪发光的标题《R skills attract the highest salaries
  • 生活中的选择:三楼的正能量励志贴,原来我统是这样被羡慕嫉妒恨啊。同时也要告诉自己,两者选其一叫选择,而干不了就换一不叫选择,而叫做逃避
  • 马尔科夫链: 如果你对一些事物还不是很熟悉(例如,红酒,恋爱),但又想显得见多识广,驾轻就熟,那么让马尔科夫链告诉你应如何表达观点。有了理论支持 是不是觉得底气十足?
  • R大战Matlab:一个小系列,比较R和Matlab各自的优势 。第一轮Matlab胜。感兴趣的同学可以自己试一试。
  • R语言:R3.0.3已经发布。先睹为快~
  • R Markdown: 其实新版的R Markdown也有超级牛力,不过现在还不是推广的时候:不过,也许看看也行?R studio官网。
  •  R Function:统计R中最常用的函数 
  • 生活中的大数据: 大数据是什么?在生活中我们能用大数据来做什么?来看看大家都怎么。(来源于quora,多图慎点)。
  •  为什么女科学家这么少?女孩子不够聪明?学数学的女孩不够酷?这是事实导致的差异还是文化引导的结果?来看看女科学家作何解。英文版
  • 图模型/温故而知新,可以为师矣:Eric Xing老师的Probabilistic Graphical Model课程终于完结了,听过Daphne Koller老师PGM在线课程的同学可以再温习下哦,一天看一集,补脑又提神。注意:无字幕,有口音,听习惯就好:)。点击链接 提神醒脑XD。
  •  Hamiltonian蒙特卡洛方法的JavaScript实现。小编不明觉厉,暂且不做评价。
  • 贝叶斯 :尽信书不如无书,且看贝叶斯大家Xi’an对《贝叶斯数据分析》一书中的后验预测P值的质疑
  • 贝叶斯 : 一个“八个学校”的例子教会了我贝叶斯统计,PhillipPrice如是说:点击这里。这个例子展现了一个最基础的贝叶斯分层模型。

COS每周精选:听过来人说

本期投稿: 谢益辉 邱怡轩 冷静 施涛 熊熹

  • 有感而发: 陈大岳老师的新作《统计学科:大有用武之地》新鲜出炉。虽说一定对自己的”孩子”偏爱有加,但也不失客观。信息丰富,结构明晰,算是一篇不错的文章。
  • 出来唠唠:美国人口调查局的一位统计学家在工作了几年之后重返校园读博士的一些感想。世殊时异,感慨万千,且听徐徐道来。
  • P-Value:Nature上发表了一篇关于P值的文章——P值一直为大家所诟病,但你永远杀不死它。
  • SVD图片压缩(后续)楠神写了一个非常gelivable的Shiny应用,用来动态展示图片压缩的效果随k的变化情况。谢大大把这个应用放到了RStudio的服务器上,大家可以点进去玩玩看了。
  • R语言: RedMonk 上个月公布了最新的编程语言排名,R语言位列十五。这里是Revolution的评论。排名年年有,今年特别多。
  • R语言:不少程序员抱怨R跑循环太慢,但是把程序向量化(vectorize)就可以很好地避免这种问题。这位Alyssa Frazee同学分享了一些很实用的向量化的方法:let’s talk about vectorization 
  • R画图3行代码告诉你怎样用R成为艺术地形图画家。
  • 并行计算:Matloff老爷子在推出《Art of R Programming》之后再创重磅力作:《Programming on Parallel Machines》,想了解并行机制以及在R中的实现的朋友们不要错过。
  • 迟到的情人节:用R画个情人节礼物。当然如果只送个这个你会死的。。。
  • 恋爱让生活更美好:恋爱会让人精神愉悦,生活充实!这本不是新鲜事,但从数据的角度看,有别有风味了。Facebook data science group做的这一系列都挺好玩。一开始微博都在疯转
  • 一幅GIF动画解释LOESS的原理

COS每周精选:再谈knitr

本期投稿: 谢益辉  肖楠

  • knitr: 小编的好哥(ji)们(you)KarlBroman大人写了一份knitr in a knutshell》。买不起书或看长篇文档伤不起的同学们不妨看他的简明教程,外加一门《可重复性研究》的课程。
  • Simply Statistics:2013年度大盘点
  • 统计学:William H. Press教授的“奇葩”统计学视频,内容偏向概率论和数理统计。(其实挺正统的)
  • 机器学习:Yaser Abu-Mostafa教授的机器学习导论程。有视频有讲义有作业,想要掌握机器学习基础,什么都有,就缺你的时间了(为什么一股冷汗)
  • 可视化:纽约时报科学图形编辑 Jonathan Corum 的演讲《雨水的重量》。作者以雨后绿植枝叶沉降这一“顿悟时刻”开篇,讲述了纽约时报在过去一年中对好奇号火星任务和开普勒号太空望远镜观测数据的可视化设计工作。我们在一年前曾经报道过这位大人的《用数据讲故事》 。评:扣人心弦的可视化作品,永远站在技术与人文的十字路口。
  • 新书速递:结合自己发表的文章来写书中的课题,真枪实弹,看起来应该还是一本不错的书噢。生物信息领域的童鞋可以点击新书《R语言与Bioconductor生物信息学应用》
  • 除非你是处女座,否则你不应该显示小于2e-16的P值。欲知详情,请点击处女座(为何黑的如此露骨)。
  • 这位老大觉得在线抓数据太麻烦,抄起键盘就写了个抓数据的网站。猛人不需要解释。COS论坛中的讨论
  •  Google Trends上显示人们对数据科学家的兴趣在本月首次超过了统计学家:不知道各位有何感想?–详情
  • 央视也玩大数据?央视今年携手百度看春运,是否你也深有感触?数据新闻,引领未来新时尚。百度迁徙