分类目录归档:统计图形

各种统计图形介绍及应用

用交互式图形探索一个五百年前的脑洞

按惯例先跑几段火车,赶时间的请直接从下面油画处开读。我很少看电影,欠的稿子都写不完还看毛线电影,不过前段时间《大鱼海棠》的精美海报画面还是吸引了我的注意力(又是从涛妹的票圈看到的),深为赞叹现在国内的动画制作技术。然而过了几天,好像评论的风向就变了。可惜了情怀这个词,现在也成了为人不齿的陈词滥调了:情怀,情你个锤子的怀,你才情怀,你全家都情怀。遥想当年,萌主(周扬)在明德楼地下咖啡厅的小房间里给我们展示 R/ECharts/Shiny 的时候,第一次提到情怀一词,小板凳上的我们都感受到了内心的一团火。“厉害啊!”萌主洋洋自得。

据说《大鱼海棠》可惜在用了辣么精良的画面,却愣是没讲好一个故事(重申一遍:我没看,只是据说);相比之下,人家徐克老爷子二十年前用简陋的技术却做出动画片《小倩》,同样是用中国传统故事素材,但比《大鱼海棠》不知道高到哪里去了。

“要来找我哦,我家就在北村,门口有棵好大好大的桃花树,记得一定要来找我哦!”

那我们就来谈谈讲故事的事。在统计之都十周年感言中我曾经提到过“精致的脑洞”,今天我就给大家解说一个五百年前的脑洞,这个脑洞是我压箱底的货,一般人我不告诉他,我第一次讲它是在我的博士论文答辩会上,后来便很少提它了。讲这个洞有两个目的,一是谈谈我对讲故事本身的一些想法(讲故事本不是我擅长的,但这个洞很适合讲故事),二是演示一下交互式图形的基本概念。 继续阅读用交互式图形探索一个五百年前的脑洞

可能是目前最好的词云解决方案wordcloud2

:广大的段子手朋友们,下次再用R做词云的时候,记得在wordcloud后面加个2
无论是install.packages(“wordcloud2”)
还是library(wordcloud2)
或者wordcloud2(data)
留下一个无法辩驳的理由,作为一个有情怀的语言,主函数的第一个变量不应该是data.frame么?

download

最近写了一个wordcloud2的R包。调用一个JS的库(wordcloud2.js)实现wordcloud。 与旧的wordcloud相比,新的wordcloud2 能更有效的利用词与词的间隔来插入数据,更可以根据图片或者文字来绘制定制化的词云。

install.packages("wordcloud2")
library(wordcloud)
library(wordcloud2)
wordcloud(demoFreq$word, demoFreq$freq)
wordcloud2(demoFreq)

1

由于使用了Rstudio出品的htmlwidgets框架,knitr和shiny也都支持。以下是wordcloud2包的一个基本介绍。

基本的函数有两个:

  1. wordcloud2: 提供基本的词云功能
  2. letterCloud: 使用选定的词绘制词云(就像刚才那个wordcloud2的图片)

为了文章的流畅性,详细的使用参数我就不细说了,可以去看下我留在CRAN的文档。下面会给大家介绍三种模式,按需选择。

  • 懒人模式:默认参数,顺便自己可以调一调颜色角度什么的;
  • 自定义模式:根据字符来生成词云;
  • 极客模式:根据输入的图片来生成同样形状的词云。

继续阅读可能是目前最好的词云解决方案wordcloud2

股市稳赚不亏?标普 500的 40 年的投资回报

本文翻译自 GitHub 项目 zonination/investing 的描述文件 README.md。译者对原文顺序有所改动。

原文以 MIT 协议发布,已征得作者  Zoni Nation 许可进行翻译。译文版权归统计之都所有,转载请注明出处。

很多人是从 Reddit 上的 “个人理财”(/r/personalfinance)板块的贴子和评论里认识我的。我最近也经常逛“美丽数据”(/r/dataisbeautiful)板块。(译者注:Reddit 是一个在美国受众广泛的娱乐、社交及新闻网站。它与论坛类似,注册用户可以在网站上发布文字和链接。)

前段时间,我开始了我的第一个数据可视化项目。我先从 Robert Shiller 的标普 500 数据项目中下载了标普 500 的一些数据,开始了疯狂的数据可视化之旅。

最近,我终于把手头上的其他几个项目处理好,安定下来,于是我又回到这些数据上,同时决定用它完成一个完整的可视化项目。

这里引用美联储主席 Alan Greenspan 对 股神 Warren Buffet 说过的一段话:

Warren,你让我太震惊了!你只要不去理会股票市场的短期甚至长期的衰退,咬紧牙关,什么也不做,不卖出任何一支股票,你就总能获得好的股票收益。也就是,你只要把你所有的钱都投到股票里,然后回家看也不看它们一眼,之后你获得的收益比每天尝试进行股票交易的情况还要高。

“个人理财”板块上经常有人在讨论长期持仓(buy and hold)策略的资金安全问题,是选择长期持仓,还是选时操作捕捉市场(time the market)。在这个可视化项目中,我尝试做下面三件事情:

  • 客观地回顾标普 500 相关股票的各个切面的长期投资收益(过去和现在)。
  • 验证和量化 “Invest Early and Invest Often” “早投资,勤投资” 这一格言。
  • 观察使用长期持仓策略会带来什么,以及这个策略的收益。

长期持仓收益

长期持仓收益

继续阅读股市稳赚不亏?标普 500的 40 年的投资回报

REmap入门示例

REmap是一个基于Echarts2.0 http://echarts.baidu.com 的一个R包。主要的目的是为广大数据玩家提供一个简便的,可交互的地图数据可视化工具。目前托管在github,https://github.com/lchiffon/REmap

使用如下步骤安装:

library(devtools)
install_github('lchiffon/REmap')

REmap目前更新到V0.3,提供百度迁徙,分级统计,百度地图,热力图等功能的实现。

提示:请使用Chrome或者Firefox来作为默认浏览器

最后要声明的一点:这个包的目的是简化使用和学习的流程,如果你是一个好学的geek,请深入的学习Echarts!

特性

  1. 使用Echarts2.0封包,地图绘制使用的是SVG图形
  2. 采用百度API来自动获取城市的经纬度数据
  3. 支持Windows!

继续阅读REmap入门示例

利用shiny包快速搭建可视化原型系统

作者:谢佳标(乐逗游戏,深圳)

前几周给大家分享了一篇《利用R语言进行交互数据可视化》的文章http://cos.name/2016/06/using-r-for-interactive-data-visualization/。文章末尾提到的在R的环境中,动态交互图形的优势在于能和knitr、shiny等框架整合在一起,能迅速建立一套可视化原型系统。今天接着给大家分享如何将动态交互图形与shiny框架整合在一起,迅速建立一套可视化原型系统。

Shiny是R中的一种Web开发框架,使得R的使用者不必太了解css、js只需要了解一些html的知识就可以快速完成web开发,且shiny包集成了bootstrap、jquery、ajax等特性,极大解放了作为统计语言的R的生产力。

Shiny应用包含连个基本的组成部分:一个是用户界面脚本(a user-interface script),另一个是服务器脚本(a server script)。

`M_86@S224HF$W_AKSLVE{N

继续阅读利用shiny包快速搭建可视化原型系统