标签归档:统计之都

《Rcpp:R与C++的无缝整合》

RcppSeamless R and C++ Integration with Rcpp

[法] 德克·埃德比特尔 著    寇强 张晔 译

内容简介

Rcpp是R应用最为广泛的语言扩展包,它被应用于超过100个CRAN和BioConductor的包中。这本书是关于Rcpp的第一本综合性导论。Rcpp使得用户可以在R和C++之间来回传递数值、向量、列表或者完整的R对象,在给R分析框架带来深度的同时,也带来了C++的威力、速度和效率。

继续阅读《Rcpp:R与C++的无缝整合》

第八届中国R语言会议(上海)

更新:点击下载会议手册,包括所有演讲摘要。

中国R语言会议自2008年以来,已经办到了第八届。2015年,在统计之都和各地高校的支持下,已经成功举办了西安、广州、北京、南昌、武汉的会场,创造了会场数和参会人数的新纪录。上海会场,作为中国R语言会议2015年的收官之作,将于11月21日和22日在华东师范大学中山北路校区举办。我们已做好最充分的准备,热诚欢迎各界朋友的到来。希望大家一同享受这场R语言与大数据的盛宴!

China-R-Logo-trans

会议的相关情况如下: 继续阅读第八届中国R语言会议(上海)

模型选择的一些基本思想和方法

作者:高涛  编辑:王小宁

0. 引言

有监督学习是日常使用最多的建模范式,它有许多更具体的名字,比如预测模型、回归模型、分类模型或者分类器。这些名字或来源统计,或来源于机器学习。关于统计学习与机器学习的区别已经有不少讨论,不少人认为机器学习侧重于目标预测,而统计学习侧重于机制理解和建模。个人更加直观的理解是,统计学习侧重于从概率分布来描述数据生成机制,除了预测之外,还关心结果(参数假设、误差分布假设)的检验,而机器学习侧重于从函数拟合角度来描述数据生成机制,基本目的就是为了拟合和预测,缺乏严谨的参数、误差的检验机制,比如下式:
\[
Y = f(X) + \epsilon
\] 继续阅读模型选择的一些基本思想和方法

一个数据科学家的这些年

【COS编辑部按】 作者:李舰 

简介:李舰先生现任堡力山(PMI)集团副总,曾任 Mango Solutions 中国区数据总监。专注于数据科学在行业里的应用。擅长R语言的工程开发与分析建模,是 Rweibo、Rwordseg、tmcn  等 R 包的作者。与肖凯合著了《数据科学中的R语言》,参与翻译了《R语言核心技术手册》、《机器学习与R语言》。李舰先生也曾有多篇文章在统计之都主站上发表。个人主页:http://jianl.org/
引言:这篇文章来自于我和肖凯的新作《数据科学中的R语言》的前言。原书受篇幅和语言风格所限,前言经过了一些删减,在这里将全文和增补的内容发布出来。为了尽量避免为新书打广告的嫌疑,先提前声明我们会把书中一些自认为比较有价值的经验和见解发布到统计之都上,只是希望对数据科学和R语言有个基本的认识或者了解一些作者的建议和感悟的读者大可不必去买这本书,只有对具体案例和技术感兴趣并且愿意实际操作才值得去购买。

僭称科学家我本来是不敢的,不过如今人们对数据的研究和应用的主战场在业界,“数据科学家”通常指的是一个职位的名称。现在很多公司(包括我自己的)招聘的职位都流行写“Data Scientist”,所以我自称数据科学家应该还好。从我本科进入中国人民大学学习统计学专业开始到现在的10多年时间里,我所有的求学经历和职业生涯都在和数据打交道,在数据应用的最前线感受到了业界对于数据价值理解的巨大变化。也亲身经历了从数据被冷遇到如今“大数据”成为显学这一激动人心的变革。这些年的很多经验都化成了这本书中的内容。在这里,我回顾自己在数据科学家道路上的一些经历,用自己的视角来总结这个数据时代的变化,也作为这本书的前言。

继续阅读一个数据科学家的这些年

2015数据与价值欧亚论坛暨R会议西安分论坛通知

大数据时代为社会带来了一场新的变革,庞大的数据资源使得各个领域开始了量化进程,对数据的有效分析、提取价值的需求更加急迫。论坛以数据分析为立足点,着眼于大数据时代下如何发现数据中的有效信息,从而实现数据的价值。我们相信,数据背景下的理论与应用问题会愈发受到学界和业界的关注,同时也将倡导企业和科研单位的有机融合以及数据的有效分析挖掘会为社会创造更多的价值!

R是一门用于数据分析和图形展示的语言、平台和环境,其官方机构每年都会举办useR!会议,各个国家及地区也定期有R用户的交流活动。在国内,自2008年以来,中国已经在北京和上海等地成功举办了七届R语言会议,促进了R语言乃至数据科学在中国的推广和发展。

为了完美的实现从数据到价值的转化,促进各领域R语言的使用者之间的交流,西安欧亚学院、统计之都、北京大学商务智能研究中心将于2015年4月18日在古城西安举办2015数据与价值欧亚论坛暨R会议西安分论坛。这将是R会议首次在西北地区举办。

China-R-Logo-trans

会议的相关情况如下:

继续阅读2015数据与价值欧亚论坛暨R会议西安分论坛通知