所有由陈堰平发布的文章

关于陈堰平

雪晴数据网(http://www.xueqing.tv)、北京数博思达信息科技有限公司(SupStat Inc.)创始人

COS访谈第三期:易丹辉教授

【COS编辑部按】受访人:易丹辉教授

简介:易丹辉教授是中国人民大学统计学院的教授,博士生导师,主要从事统计方法在经济、金融、保险、医疗、管理等领域应用的研究。具体介绍参见学院网站。本文根据易老师的邮件回复和采访录音整理而成,如有不当之处,责任都由编辑承担。

我的学业之路

1966年高中毕业,准备高考之际,突如其来的文化大革命终结了我们的大学梦。1977年恢复高考,我考入呼兰师专数学专业,1981年考入中国人民大学统计学专业读硕士,1984年毕业留校任教至今。

说起进入数学专业学习,既是偶然也有其必然,尽管我从来没想过要学数学。1977年高考,黑龙江省要考两次,先进行初试,我考虑十年没有摸这些数理化书本,选择了报考文科。初试结束体检时一个同学色盲,考理工科受限,他知道初试数学成绩我是全团第一,提出要和我换,于是我成了理科考生,又因为复试数学成绩,被送进了数学专业。后来才知道,我报的所有学校和专业都不招收我这么大年龄的农工。

学习对我来说没有问题,可是学出来做什么,却是一个需要考虑的问题。当老师?继续深造?还学数学,学完做什么?我带着满脑子疑问和教我们概率的高洪英老师聊天。当时正值国家改革开放,我总觉得学出来得有点什么用才有意义。

高老师了解到我的心思,告诉我:可以学习统计。统计,对我来说一个毫不知晓的领域,但却开启了我追求的另一扇窗,成为了我一生致力于研究的方向。为报考统计的研究生,1981年初寒假,我来到在武汉财经学院任教的庭叔家。他领我见了统计系的周兆麟老师。很短的时间,他不可能给我讲解什么是统计,但他告诉我:有了数学基础学统计没有问题。虽然我对经济一窍不通,但他的鼓励成就了我最终选择报考中国人民大学。因为徐前和唐寅老师的开明,没有将我拒之门外;因为导师王文声的精心,将我引进了预测之门。

我欣赏运用数据说话、解读实际;我享受遨游在数据中间,探寻其背后奥秘和规律的快乐;我喜欢统计中那富含的哲学理念,随时随地教会你用客观的眼光看待世界、看待自己。

你想过为什么所有统计模型的随机干扰项都要求?正态分布是因为其优良性质对于很多推断的证明有益;独立是因为需要将所有有用信息都反映在模型中而不能被放弃;同方差则告诉我们只能在同质的条件下建立反映量变规律的模型。许许多多模型不就是因为解决异方差才应运而生吗?!想想这里有什么哲学啊?

继续阅读COS访谈第三期:易丹辉教授

《R语言编程艺术》

R语言编程艺术
《R语言编程艺术》

由统计之都的几位成员翻译的《R语言编程艺术》终于就要面市了。本书的译者有陈堰平邱怡轩潘岚锋熊熹,负责校审的有林宇、严紫丹、程豪。这里有本书的译者序,读者可以在本书的github页面下载数据和代码。读者可以在本页留言提问,我们也会在这里公布本书的勘误。想查找更多好书,请看图书出版频道。

内容推荐

本书是R语言领域公认的经典著作,著名计算机科学家兼统计学家撰写,Amazon五星级畅销书。它是一本面向R语言开发者的纯编程类书籍,不需要读者具备统计学基础,从编程角度而非统计学角度系统讲解了R语言的数据结构、编程结构、语法、TCP/IP网络编程、并行计算、代码调试、程序性能优化、编程技巧以及R语言与其他语言的接口等所有与R编程相关的知识,几乎面面俱到。本书的实用性也非常强,44个精选的扩展案例,充分展示了R语言在数据处理和统计分析方面的强大能力。

全书一共16章:第1章介绍了学习R语言需要掌握的预备知识以及它的一些重要数据结构;第2~6章详细讲解了R语言的主要数据结构,包括向量、矩阵、数组、列表、数据框和因子;第7~13章全面讲解了R语言的语法,包括编程结构、面向对象特性、数学运算与模拟、输入与输出、字符串处理、绘图,以及R语言的调试方法。第14~16章讲解了R语言编程的高级内容,如执行速度和性能的提升、R语言与C/C++或Python的混合编程,以及R语言的并行计算等。

本书核心内容:

  • R语言的完整语法以及R语言的编程技巧。
  • 创建精美图形来展示复杂数据和函数。
  • 使用并行计算和向量化的方法编写更高效的代码。
  • 使用R对C/C++和Python的接口来提高计算速度或增加功能。
  • 文本分析、图像处理等领域新的R包。
  • 使用高级调试技巧清除代码里恼人的错误。
  • 包含许多“扩展案例”,展示完整的、特定用途的函数,并针对同一个问题讨论了不同的设计方案,以便分析高效准确的做法。
  • 在恰当的时候介绍R语言与其他语言的差异,给那些了解其他语言的开发人员提供参考。

继续阅读《R语言编程艺术》

《ggplot2:数据分析与图形艺术》现已上市

ggplot2
ggplot2:数据分析与图形艺术

由统计之都操刀翻译的《ggplot2:数据分析与图形艺术》一书已经上市了。这本书的译者包括邱怡轩(第1~2章)、主伟呈(第3~4章)、肖楠(第5~6章)、高涛(第7~8章)、潘岚锋(第9章)、魏太云(第10章、附录以及翻译过程的协调安排和全书的LaTeX排版工作)。谢益辉为本书写了译者序

这里查看书中的所有代码,点这里下载全部代码。

这里可以看见最新的勘误(标记为红色的bug即是)。

读者可以在本页或者在统计之都论坛报告错误。

内容推荐

ggplot2 是R中新颖的数据可视化包,功能强大、灵活便捷,其灵感源自 Leland Wilkison的《图形的语法》一书。使用 ggplot2 可以轻松实现:

  • 高质量图形的绘制,自动化添加图例。
  • 叠加来自不同数据源的多个图层(点、线、地图、瓦片图、箱线图等),自适应通用标度。
  • 利用 R 强大的建模功能添加平滑曲线,如 loess 、线性模型、广义可加模型和稳健回归。
  • 保存任意ggplot2 图形,方便修改或重复使用。
  • 制作主题,满足内部定制或杂志风格的需求,便捷地应用到多幅图形上。
  • 从视觉角度上审视你的图形,斟酌每一部分数据如何呈现在最终图形上。

如果你想将枯燥的数据转化为生动、形象的图片,本书绝对大有裨益。你需要了解 R 的基本知识(比如如何将数据导入到R),不过 ggplot2 是专门为绘图量身打造的“迷你语言”,在本书中你就可以学到你需要的所有知识。在阅读完本书之后,你就可以针对你的问题绘制出精确定制的图形,并且发现将脑海中的图片绘制在屏幕上已经变得轻而易举了。译者亲切地称之为“玩转数据可视化的瑞士军刀!”

目录

1. 简介
2. 从qplot开始入门
3. 语法突破
4. 用图层构建图像
5. 工具箱
6. 标度、坐标轴和图例
7. 定位
8. 精雕细琢
9. 数据操作
10. 减少重复性工作
附录A 不同语法间的转换
附录B 图形属性的定义
附录C 用grid操作图形

《R语言实战》

r-in-action

由统计之都三位成员高涛肖楠陈钢翻译的《R语言实战》现已正式出版。请点击这里下载随书代码。如果读书在阅读过程中遇到什么问题,可以留言提问。您也可以访问本书在图灵社区的主页,阅读部分试读章节。我们还会不定期地在这里发布本书的勘误,请读者留意@统计之都的微博。近期统计之都还有其他图书出版,请关注本站图书出版栏目。

有热心读者在论坛上贴出了学习笔记

内容介绍

R是一个开源项目,具有强大的统计计算及制图能力,是从大数据中获取有用信息的绝佳工具,在各种主流操作 系统上都可以安装使用,其基本安装就提供了数以百计的数据管理、统计和图形函数。另外,社区开发的数以千计的扩展(包)为R增加了更多强大功能。《R语言实战》注重实用性,是一本全面而细致的R指南,高度概括了该软件和它的强大功能,展示了实用的统计示例,且对于难以用传统方法处理的凌乱、不完整和非正态 的数据给出了优雅的处理方法。作者不仅仅探讨统计分析,还阐述了大量探索和展示数据的图形功能。《R语言实战》适合数据分析人员及R用户学习参考。

作者简介

Robert I. Kabacoff R语言社区著名学习网站Quick-R(http://www.statmethods.net/)的幕后维护者,现为全球化开发与咨询公司Management研究集团研发副总裁。此前,Kabacoff博士是佛罗里达诺瓦东南大学的教授,讲授定量方法和统计编程的研究生课程。Kabacoff还是临床心理学博士、统计顾问,擅长数据分析,在健康、金融服务、制造业、行为科学、政府和学术界有20余年的研究和统计咨询经验。

继续阅读《R语言实战》

分层线性模型软件HLM6.0操作简介

分层线性模型 (Hierarchical linear Model,简称 HLM,又称多层线性模型,Multilevel Linear Model),HLM6.0 是分层线性模型软件,包含线性和非线性部分,可以读取大部份统计软件的数据如 SPSS, SAS, SYSTAT及STATA等等。HLM常用于社会科学和行为科学,因为它常有嵌套结构(Nested Structure)的数据,因此需用次模型(Sub-Model)或分层线性模型(Hierarchical Model),HLM就是设计来专门解决此类问题的,HLM提供的模型包括2-level models、3-level models、Hierarchical Generalized Linear Models (HGLM)和Hierarchical Multivariate Linear Models (HMLM)等。

下面是中国人民大学统计学院分层线性模型的课件,主要内容为HLM6.0的操作

下载地址:http://cos.name/wp-content/uploads/2009/09/intro2HLM6.zip