标签归档:纪要

第八届中国R语言会议(北京)纪要

第八届中国R语言会议(北京会场)暨2015北大光华数据与价值论坛于2015年6月6日至7日在北京大学成功举办。第一日主会场位于邱德拔体育馆,第二日分会场位于光华管理学院一号楼。

一、会议概况

今年是中国R语言会议举办的第八年。会议由北京大学光华管理学院和统计之都联合主办,由北京大学商务智能中心、北大光华—奥迪管理研究中心、北京大学统计科学中心协办,并得到了百度、一汽—大众奥迪、乐递等战略合作伙伴的鼎力协助和懒投资、百分点、航旅纵横、量邦科技、微量网、一杯汤EasySoup、考拉征信等友情合作伙伴的大力支持。在两天的会议时间里,数据科学各行各业的同仁们欢聚一堂,共襄盛举,畅所欲言。

在北大光华、统计之都各位同仁的不懈努力下,本次会议比往届有了更大的突破。会议共设有10个分论坛,68场主题报告,覆盖大数据技术、互联网金融、量化投资、人网物联、生物信息等诸多当下热门话题。本届会议报名非常火爆,人数突破了4200人,报名单位超过1500个,不仅创下历届之最,也使本次会议成为亚洲地区规模最大的数据科学盛会之一。

继续阅读第八届中国R语言会议(北京)纪要

第七届中国R语言会议(北京)纪要【含演讲资料】

作者:霍志骥,中国人民大学统计学院

第七届中国 R 语言会议(北京会场)于 2014 年 5 月 24 日 ~ 25 日在中国人民大学成功召开。第一日举办于如论讲堂,第二日举办于明德商学楼0102,0202以及0302三大分会场。

ruchang2

一、会议概况

会议由中国人民大学统计学院、中国人民大学应用统计科学研究中心、北京大学商务智能研究中心、统计之都(cos.name)主办。量邦科技是本次会议的协办方。在两天的会议时间里,参会者齐聚一堂,就 R 语言在互联网、商业、统计、生物、制药、可视化等诸多方面的应用进行了深入的探讨。

本次会议报名分为三个阶段,报名情况情况火爆,约有1100多名参会者前来参会,规模创历届之最。报名者共六百多家单位,包括两百多家大学及研究机构和四百多家公司。 继续阅读第七届中国R语言会议(北京)纪要【含演讲资料】

第五届中国R语言会议(北京会场)纪要

第五届中国 R 语言会议(北京会场)于 2012 年 5 月 26 日 ~ 27 日在中国人民大学明德法学楼 0201 成功召开。会议由中国人民大学应用统计科学研究中心与中国人民大学统计学院、统计之都 (cos.name) 主办,mango-solutions赞助。在两天的会议时间里,参会者齐聚一堂,就 R 语言在互联网、商业、统计、生物等诸多方面的应用进行了深入的探讨。

会议概况

本次会议报名非常火爆,吸引了 300 多名参会者前来参会,规模再创历届之最。参会者主要来自各大高校、科研机构、企业和事业单位,全体参会者所在单位汇总如下。

高校和研究所:

University of Southern California、University of Wisconsin、北京城市学院、北方工业大学、北京大学、北京大学医学部、北京航空航天大学、北京化工大学、北京市科学技术研究院、北京理工大学、北京林业大学、北京市农林科学院、北京基因组研究所、北京邮电大学、北京师范大学、北京协和医学院、北京中医药大学、东北大学、东北农业大学、对外经济贸易大学、电子科技大学、国防科技大学、河北经贸大学、华北电力大学、华中农业大学、吉林大学、军事医学科学院、机械工业信息研究院、兰州理工大学、宁波工程学院、南京财经大学、南开大学、清华大学、山东大学、首都经济贸易大学、西沃成生态环境研究所、西北农林科技大学、永安期货研究院、云南财经大学、中国传媒大学、中国疾病预防控制中心、中国科学技术大学、中国科学技术信息研究所、中国矿业大学(北京)、中国林科院资源信息所、中国农业大学、中国农业科学院、中国人民大学、中科院半导体所、中科院地理所、中科院动物所、中科院计算技术研究所、中科院北京基因组研究所、中科院数学所、中科院生物物理研究所、中科院自动化研究所、中科院植物所、中南大学、中央财经大学

企业、事业单位:

Allianz Global Assistance、艾美仕咨询公司、埃森哲、艾亿新融资本管理公司、宝宝树信息技术有限公司、暴风影音、百济神州(北京)生物科技有限公司、北京安泰科信息开发有限公司、北京紫博蓝网络技术服务有限公司、北京贝瑞和康生物技术有限公司、北京德昂信息技术有限公司、北京果壳互动科技传媒有限公司、北京名影科漫有限公司、北京雀巢研发中心有限公司、北京瑞星信息技术有限公司、北京神州数码思特奇信息技术股份有限公司、北京网达信联科技发展有限公司、北京雪球财经信息科技有限公司、北京中彩在线科技有限责任公司、北京中软国际信息技术有限公司、北京质量协会、百度、北森、豆瓣、当当网、Doubleday Enterprises、敦煌网、凡客诚品、风行在线、广联达软件股份有限公司、华夏人寿、弘毅远道科技有限公司、IBM、IMS、ICON医药咨询有限公司、京东商城、精品购物指南、江苏百盛工程咨询有限公司、KPMG、乐视网、Mango Solutions、NCUK、Oracle、澳际PMP、奇虎360、去哪儿网、盘古文化传播有限公司、普华基础软件股份有限公司、品友互动、人人网、Springer Beijing Office、山东浪潮齐鲁软件、水利部发展研究中心、SAS R&D(Beijing)、搜浩捌捌(北京)企业管理有限公司、上海证券交易所、腾讯科技、完美世界、新华社中经社控股有限公司、新浪微博、新浪乐居、讯奇、银华基金、优酷网、亚信联创、用友软件股份有限公司、知本咨询、中华英才网、中国环境监测总站、中国建设银行北京市分行、中金公司、中粮我买网、中国气象局

会议现场(点击看大图)

会议内容

本次会议讨论的主题涵盖了 R 语言在推荐系统、机器学习、金融、大规模数据分析、数据可视化、高性能计算、互联网研究等众多方面的最新进展,共进行了 18 场精彩的报告,会场反响热烈。会议的流程和主要内容摘录如下。

1、吴喜之教授致辞

吴喜之教授是国内推广 R 语言的先驱,他在致词中简述了 R 的诸多优势,如免费、公开、容易学习、可扩展、功能强大、不断更新等,并对现场的参会者提出了殷切的期待,希望大家能从 R 中不断学习新的统计知识。吴喜之教授幽默睿智的演讲受到了现场观众的热烈欢迎。

2、李舰 —— 基于 R 和 pentaho 的全套开源 BI 平台的实现

演讲介绍 pentaho 的社区 BI 平台,包括 BI 服务器、ETL 工具、OLAP 引擎、报表编辑器、元数据管理、开发平台、数据挖掘等,还介绍了演讲者开发的 rpentaho 包,演示如何在 R 中创建 pentaho 平台下的 R 应用,包括作图和分析等。此外,也简单介绍了 pentaho 和 hadoop 的集成产品以及 R 与 hadoop 的连接方案。演讲内容精彩,会后演讲者与参会者进行了热烈的讨论。

3、周涛 —— 个性化推荐的十大挑战

演讲介绍了个性化推荐在理论研究与业界应用中遇到的主要挑战和目前的处理方案,包括数据稀疏性问题、冷启动问题、大数据处理与增量计算问题、多样性与精确性的两难困境、推荐系统的脆弱性问题、用户行为模式的挖掘和利用、推荐系统效果评估、用户界面与用户体验、多维数据的交叉利用、社会推荐等十个问题。内容丰富多彩,促进了参会者对推荐系统的理解。

4、肖凯 —— 30 分钟学会 ggplot2

演讲通过类比剑招的学习形象清晰地介绍了 ggplot2 的绘图理念,讲述了 ggplot2 中的几大基本概念:数据、映射、标度、几何对象、统计变换、坐标系统和图层。然后展示了如何绘制基本统计图形,如散点图、直方图、条形图、箱线图等,以及如何自定义图形。最后提供了丰富的学习 ggplot2 的网络资源。

5、邱怡轩 —— R 中大规模数据的整理与分析

演讲将介绍一些用 R 处理大规模数据的常用方法,包括 R 与数据库的连接、ff 软件包以及稀疏矩阵的运算等。报告者首先讲解了 R 与数据库的连接中如何在不超过内存限制情况下进行分批次地进行运算。然后介绍了 ff 软件包,该包可将将 R 中常见的向量、矩阵、数据框等对象存储在硬盘上并数据操作。演讲最后通过微博中的“方寒”大战实例展示了如何进行大规模数据分析。

6、潘岚锋 —— 矩阵的稀疏分解新算法及其应用

演讲介绍了一个由作者提出的非负矩阵分解新算法以及对应的 R 包 bignmf。非负矩阵分解在图像处理、文本挖掘等领域中有着广泛的应用,非负的约束能够使分解的结果具有很好的解释性。新开发的包与现有的 NMF 包使用了不同的算法,算法本身速度很快;并且使用 Rcpp 实现,在速度上有了很大的提升。演讲最后给出了微博数据和图像数据的分析例子。

7、王剑 —— COS 沙龙介绍

演讲介绍了 COS 沙龙的起源、发展理念以及沙龙的组织和流程安排。给出了新 COS 沙龙的第一期交流安排,并面向社会征集沙龙话题,招募筹备小组组长和组员。COS 沙龙提供了一个良好的学习 R 和交流 R 应用心得的平台,期待各位 R 爱好者的积极参与。

7、魏太云 —— knitr 与动态报告生成系统

演讲介绍了 R 文学化编程的 knitr 包,主要用于生成动态报告,目前已经非常流行,在 LyX、RStudio 等 IDE 中都获得了相应的整合。knitr 的想法源于 Sweave,但功能完善了很多,并且规避了 Sweave 很多的不足之处。knitr 支持多种格式的输入 (比如 Rnw、md、rst) 和输出 (比如 HTML、PDF 等),并且支持代码整理、代码高亮、结果缓存等,非常便捷实用,是重复性报告的必备利器。

8、陈丽云 —— 统计辟谣训练营

演讲从一系列生活和新闻中常见的数字和故事出发,利用耳熟能详的统计工具,层层抽丝剥茧,揭开那些神奇数字的迷雾,让我们对于统计数字保持一颗清醒的头脑。

9、邓一硕 —— R 与金融投资分析的框架

演讲讲述金融投资分析的大致框架以及 R 语言在该框架中扮演的角色,具体包括 R 包在获取基础数据、进行财务数据分析、股价波动率分析、投资策略构建等环节中的应用。

10、孟生旺 —— R 在精算中的应用

本报告将主要通过一些示例来说明actuar,lifecontigencies, ChainLadder, glm 和 gamlss 等软件包在精算学习和研究中的应用价值,涉及损失模型、金融数学、寿险精算和非寿险准备金评估以及非寿险定价。

12、陈逸波 —— R 在社会网络分析中的一些应用

演讲大致介绍 R 在社会网络分析中的一些应用,主要通过人人网的数据分析,详细演示了如何利用 R 抓取数据、内容关键词统计、转发路径可视化、好友关系可视化、好友分组等内容,发现了许多有趣的结论。

13、段敏明 —— ORE workshop

演讲介绍了 Oracle 对 R 的支持与集成情况,通过实例的演示,演讲者展示了如何运用 Oracle R Enterprise 进行数据分析,以及如何使用 Oracle R Connector for Hadoop 助力大规模现实数据的处理。

14、黄金山 —— Rcpp 快速入门

演讲主要通过一些简单例子讲解了如何使用 Rcpp 提供的 C++ API。内容主要包括 Rcpp 数据类型和基本操作、as 和 wrap、迭代器和泛型算法、调用 R 中的函数和 Rcpp 语法糖。

15、叶明 —— R 在工业智能中的应用

演讲详细介绍了两个 R 在工业应用的案例,一个是国航飞机发动机润滑油的监控,另一个是上海市铁路局呼叫中心的预测。演讲者在最后还提出了一些有意义的统计发展的方向性问题。

16、陆银波 —— 隐马尔科夫链的理论及其应用

演讲首先介绍了 HMM 的基础理论框架,包括模型定义,参数估计和后续分析。然后利用 R 中的 HiddenMarkov 和 depmixS4 包,通过 3 个具体例子介绍了 HMM 在气象、金融和行为实验中的应用,为这些领域传统的研究方式提供了新的思路。

17、郝智恒 —— 试验设计在机器学习中的应用初探

演讲首先介绍了试验设计的背景,讲述了从 Fisher 的农田试验到如今的计算机试验的发展过程,以及推动试验设计发展的实际背景。然后讲述了将试验设计用于机器学习中训练样本选取的两个模拟实例:一个是序贯设计在 Active Learning 中的应用,它可以减少训练样本数量,达到控制成本的效果;另一个是将近似正交拉丁超立方体抽样以及均匀设计等设计方法运用于 Lasso 变量选择过程的样本选取。

18、李欣海 —— 用 R 实现随机森林的分类与回归

演讲首先简要回顾了随机森林的原理,然后以朱鹮的生境选择为例介绍了随机森林在分类 (朱鹮生境选择与否) 上的应用,以亚洲象生境退缩为例介绍了随机森林在回归 (纬度与 9 种环境变量的关系) 上的应用。

资源下载

经演讲者的授权同意,已将所有同意公开的幻灯片加了超链接供大家下载学习。

感想和建议

如果您对于中国 R 语言会议还有任何感想、意见或建议,欢迎您在本页面、统计之都人人网页面统计之都新浪微博留言,我们会尽力在今后对会议质量进行进一步的改善。

第四届中国R语言会议(上海会场)纪要

第四届中国R语言会议(上海会场)于2011年11月12日~13日在华东师范大学学术交流中心(逸夫楼)成功召开。会议由华东师范大学金融与统计学院主办、统计之都(cos.name)协办。在两天的会议时间里,胜友如云,高朋满座,大家就R语言在行业里的应用进行了深入的探讨。

会议概况

本次会议吸引了270多名各界人士注册报名,有近200位嘉宾来到现场。其中行业里的参会嘉宾人数第一次超过了在校学生的人数,比例为50.4%,为历届大会最高。根据注册报名信息,同意在参会者之间分享个人信息的206位嘉宾所在单位的汇总如下。

高校和研究所:

The University of Auckland、上海交通大学、上海大学、上海对外贸易学院、上海市发展改革研究院、上海生命科学研究院、上海生物信息中心、上海财经大学、东南大学、中国中医科学院、中国人民大学、中国农业大学、中国科学院、中国科学院上海生命科学院、中央财经大学、云南财经大学、华东师范大学、华东理工大学、华中农业大学、南京医科大学、南京理工大学、厦门大学、台湾辅仁大学、同济大学、四川大学、复旦大学、宁波市科技信息研究院、江西理工大学、浙江农林大学、浙江大学、浙江大学宁波理工学院、浙江师范大学、电子科技大学、福建医科大学、第二军医大学、芝加哥大学、西北工业大学

企业、事业单位:

AC尼尔森、JMP of SAS、MacroStat (Shanghai) Ltd.Co.、Mango Solutions、Merkle Inc.、Unilever、上海伯豪生物技术有限公司、上海华腾软件系统有限公司、上海大智慧股份有限公司、上海宝信软件股份有限公司、上海河广信息科技有限公司、上海烟草集团有限责任公司、上海聚胜万合广告有限公司、上海蓝滨石化设备有限责任公司、上海诺铭商务咨询有线公司、上海金蝶软件科技有限公司、上海高达、东南融通、中国平安、云南瑞升烟草技术(集团)有限公司、光大证券研究所、兴业证券、北京网达信联科技发展有限公司、北京高信达通信技术有限公司福州分公司、国泰君安期货有限公司、复旦大学附属肿瘤医院、奥浦诺管理咨询(上海)有限公司、宝景信息技术发展有限公司、富士施乐、山东泰丰、川渝中烟工业公司、德邦证券有限责任公司、支付宝、数库财务咨询(上海)有限公司、新华社中经社控股有限公司、汇添富基金、淘宝网、瑞易信息技术(上海)有限公司、电讯盈科信息技术有限公司、益普索、盛大网络、米其林中国投资有限公司、红星美凯龙集团、美斯达(上海)医药研发有限公司、艾瑞咨询、花旗软件、茂源投资管理有限公司、西安交通大学出版社、说宝堂信息科技有限公司、诺华、释锐教育软件、阿里巴巴

 

会议现场20111112

会议内容

本次会议讨论的主题涵盖了R语言在金融、制药、生物信息、数据挖掘、互联网、图形可视化等众多方面的最新进展,共进行了18场精彩的报告。会议的流程和主要内容摘录如下。

1、汪荣明院长致辞

华东师范大学金融与统计学院的汪荣明院长为本次大会致开幕辞。汪院长是教育部统计学教学指导委员会委员、中国现场统计学会生存分析分会副理事长、中国概率统计学会常务理事、中国概率统计学会精算专业委员会主任、《应用概率统计》杂志副主编、上海市统计学会副会长、华东师范大学第六届学术委员会委员。作为第四届R语言会议上海会场的东道主,汪院长对本次会议进行了关怀和展望。

2、谢邦昌——云计算在统计Data Mining研究之应用及前沿综述

谢教授是辅仁大学商学研究所博士班所长,统计资讯学系教授,中华资料采矿协会理事长。演讲中对CLOUD-R 云计算下的R前沿进行了探讨,同时展望了数据分析的未来。

3、Thomas W. Yee——An Overview of the VGAM Package

Thomas来自于R的故乡新西兰的Auckland大学。为我们介绍了他编写的VGAM包,用来拟合向量广义线性模型和加性模型。

4、李强——淘宝网购数据和建模

李强博士曾经在硅谷的惠普公司等多家公司担任研发,科研,产品工作。现在在淘宝网广告产品部门担任产品经理,主要负责定向广告营销,个性化广告推荐系统和基础的数据模型。这次演讲为我们介绍了淘宝网利用网购数据建模的方法,用来进行广告的精准投放,提高用户的满意度,提高营销的ROI。

5、卢凌坚——利用R来建立更准确的市场预测

卢凌坚1997年投身量化投资行业,曾任瑞士银行(UBS)亚太及澳大利亚首席量化分析师,并连续两年被美国机构投资者杂志评为亚太最佳量化分析师;后加入Ajia Partners任董事总经理及基金经理,负责市场量化策略和风险管理;2011年7月加盟茂源投资管理有限公司。本次报告是用R语言分析处理金融数据的一个实际的例子,属于茂源资本量化模型之选股模型的数据准备部分。

6、刘思喆——Data Mining With RWeka

刘思喆是北京神州数码思特奇信息技术股份有限公司的Chief Engineer。报告介绍了RWeka包的调用方式、以及这种调用方式的优缺点。并沿着数据挖掘的主线,对机器学习中分类算法(classifiers)的评估方法进行了简要介绍。

7、陈丽云——社会网络中的实验与R

陈丽云来自上海河广,介绍了在Fisher提出的实验设计三原则基础之上、社会性实验的设计思路、需要注意的实行要点和结果分析方法,并以USAIDS在高中生中推广基于社会网络的性教育教学方法为例、介绍了一个具体项目的设计思路和流程,展现出更直观的实验思想。

8、余苓——R在烟草及其加工制品研发中的应用

余苓来自于上海烟草集团,介绍了烟草行业中的多元数据的直观分析、多元数据的相关分析以及FactoMineR package的应用。

9、史军——R语言在新药开发中的应用

史军博士在定量药理和新药研发领域有着极其丰富的经验,作为本次大会的一位特邀嘉宾,以一个“老”临床药理工作者的身份介绍了制药行业的概况和新药研发中数据分析软件的选择。

10、钟春燕——R在肿瘤生存分析中的应用

钟春燕是福建医科大学公共卫生学院流行病与卫生统计学专业在读硕士,主要从事肿瘤分子流行病学研究。演讲主要介绍了肿瘤生存分析的基本概念和主要内容,以及半监督回归分割混合模型的背景,优点及分析过程。

11、邵凡——R的商用:案例分享和前景展望

邵凡是Mango Solutions上海代表处的首席代表。演讲展示了芒果咨询的两个案例:新药研发的软件系统Navigator和感官分析的R包。

12、赵明——不同标准化方法对基因集富集分析的影响

赵明是华中农业大学在读硕士,课题方向主要从事免疫系统生物学研究。主要包括基因通路和基因调控网络的构建和分析。本次演讲主要探讨Affymetrix芯片的不同标准化方法对GSEA分析的影响。

13、牟官迅——R与高频交易数据

本报告涉及经由多年积累后成就的数据平台的构建模式,以及通过R获取高频交易数据和对数据的统计展现。

14、陈堰平——R在数据挖掘的应用:以预测股票收益率为例

演讲介绍了预测股票收益率的分析框架和实用技术。内容包括时间序列数据的读取、人工神经网络方法、支持向量机方法、多元自适应样条回归、评价时间序列 模型的蒙特卡洛方法等。

15、邓一硕——R与投资组合分析

本报告主要介绍R在投资组合分析中的应用。内容分为三部分:第一部分,讲述基于均值-方差的投资组合分析及其在R中的实现;第二部分,讲述基于CVaR的投资组合分析及其在R中的实现;第三部分,讲述DEoptim包以及基于Omega、最大跌幅(Maximum Drawdwon)以及R-ratio的投资组合分析在R中的实现。

16、周涛——信息挖掘:预测、排序和过滤

周教授是电子科技大学互联网科学中心主任。主要研究方向为复杂性科学、网络科学、信息物理、人类动力学和群集动力学。本次演讲介绍了信息挖掘中三个重要组成部分:排序、预测与推荐。

17、熊熹、魏太云、邱怡轩、高涛——R与现代统计图形及其实例

演讲内容包括绘图系统、设备、grid、lattice、ggplot、rgl以及动画等。

18、汤银才——R工作环境简介

汤教授是华东师范大学金融与统计学院教授,博士生导师,《应用概率统计编辑部》主任。演讲介绍了适合于R运行的编辑器(ediotors)、图形式用户界面(GUIs)和集成开发环境
(integrated development environment)。

19、李舰——中国R语言会议及相关活动介绍

本次会议主席李舰介绍了中国R语言会议的发展历史和会议的组织过程,并就国内外的R活动以及R在国内的发展展开了讨论。

资源下载

经演讲者的授权同意,已将所有同意公开的幻灯片加了超链接供大家下载学习(持续更新中,请遵循CC 3.0协议:署名-非商业性使用-相同方式共享)。

感想和建议

如果您对于中国R语言会议还有任何感想、意见或建议,欢迎您在本页面、统计之都人人网页面统计之都新浪微博留言,我们会尽力在今后对会议质量进行进一步的改善。

第四届中国R语言会议(北京会场)纪要

第四届中国R语言会议(北京会场)合影
第四届中国R语言会议(北京会场)合影(右键另存为看大图)

第四届中国R语言会议(北京会场)于2011年5月28日~29日在中国人民大学明德法学楼0201成功召开。会议由中国人民大学应用统计科学研究中心与中国人民大学统计学院主办、统计之都(cos.name)协办。在两天的会议时间里,参会者齐聚一堂,就R语言在生物、金融、网络、商业等诸多方面的应用进行了深入的探讨。

会议概况

本次会议吸引了近250名参会者前来参会,规模属历届之最。参会者主要来自各大高校、科研机构、企业和事业单位,全体参会者所在单位汇总如下。 高校和研究所:

Banaras Hindu University、University of Alaska、北京大学、北京大学医学部、北京工业大学、北京化工大学、北京科技大学、北京理工大学、北京林业大学、北京师范大学、大连海事大学、电子科技大学互联网科学中心、对外经济贸易大学、华北电力大学、华东师范大学、华中科技大学、嘉兴学院、军事医学科学院放射与辐射医学研究所、南开大学、清华大学、热带林业研究所、首都经济贸易大学、天津理工大学、西南交通大学、同济大学、中国测绘科学研究院、中国科学技术大学、中国科学院大气物理研究所、中国科学院地理科学与资源研究所、中国科学院计算技术研究所、中国科学院武汉植物园、中国矿业大学、中国林业科学研究院、中国农业大学、中国农业科学院、中国农业科学院农业资源与农业区划研究所、中国人民大学、中国石油大学、中国政法大学、中科院北京基因组研究所、中科院地理所、中科院动物所、中科院武汉植物园、中南大学、中水产科学研究院黄海水产研究所、中央财经大学、中央民族大学

企业、事业单位:

58同城、Mango Solutions、Sanofi Pasteur、SAS北京研发中心、SPSS China、艾瑞咨询、百度、北京安泰科信息开发有限公司、北京风行在线技术有限公司、北京汉端科技有限公司、北京航空航天大学出版社、北京市国富如荷网络科技有限公司、北京网达信联科技发展有限公司上海分公司、北京正和之道管理咨询有限责任公司、北京质量协会、北森、博奥生物有限公司、创维数字、当当网、歌尔泰克、好耶网络广告、华胜天成、甲骨文、酷6网、奇艺网、上海烟草集团有限责任公司、深圳华大基因研究院、深圳茂源投资管理有限公司、首钢、水利部发展研究中心、淘宝、腾讯、同方股份有限公司、无线讯奇、西安交通大学出版社、小米科技、新华社中经社控股有限公司、新华信咨询、新浪、益普索、优酷网、中诚信信用管理、中国电子科技集团公司信息化工程总体研究中心、中国疾控、中国移动、中国邮政集团、卓望信息

会议现场20110528
会议现场(点击图片在新窗口看大图)

会议内容

本次会议讨论的主题涵盖了R语言在生物信息、生态学、金融、混合编程、高性能计算、网络和出版等众多方面的最新进展,共进行了17场精彩的报告。会议的流程和主要内容摘录如下。

1、吴喜之教授致辞

吴喜之教授是国内推广R语言的先驱,他在致词中简述了R的诸多优势,如免费、公开、容易学习、可扩展、功能强大、不断更新等,并对现场的参会者提出了殷切的期待,希望大家能从R中不断学习新的统计知识。吴喜之教授幽默睿智的演讲受到了现场观众的热烈欢迎。

2、李舰——R与高性能运算

演讲指出,S语言的一个设计理念是“人的时间比机器的时间宝贵”,因此R在设计之初并不是纯粹追求高效,而是符合统计的思维方式。演讲针对R的三个事实——解释性语言,数据都读入内存和单线程——详细讲述了R的高性能运算,包括基础优化、大数据、代数运算和并行计算四部分的内容。

3、李欣海——广义线性模型的基本原理及其应用

演讲详细介绍了广义线性模型的概念、组成和估计等内容,重点讲解了Logistic回归的原理和应用。同时,演讲者结合具体的专业背景讲解了广义线性模型在生态学中的应用。

4、肖嘉敏——基于R的网络用户行为研究

演讲中对用户行为的研究包括网站浏览、软件使用和行为特征三个方面,具体的数据操作包括数据预处理、数据库操作、缺失值、变量转换、tapply()应用等。演讲还专门针对网络数据的特点介绍了一些特定的高性能运算算法,来提高网络数据处理的效率。

5、张金龙——R 与进化生态学

演讲介绍了进化生态学的来源和特点,通过几个实例引入了系统发育的相关理论,之后介绍了R中处理相应问题的软件包。演讲人之后对进化树、祖先状态、物种分化速率、群落系统和生态位进化等内容进行了详细的讲解,其中对每一个问题都提供了程序示例和图形等展示内容。

6、李青龙——R与EXCEL VBA及MATLAB混合编程

Excel和Matlab各自在商业和数学领域有广泛的应用,而混合编程可以将不同工具的优势结合起来。演讲详述了混合编程的步骤,并通过R与Matlab和Excel VBA交互的实例讲解了混和编程的操作方法。

7、王洪月——SAS Interaction with R

演讲从SAS的视角对R的特点进行了分析,解释了SAS为什么要集成R,以及如何进行集成。通过实例的演示,演讲者展示了如何利用IML Studio来实现SAS与R的交互。

8、颜林林——R高级编程技巧及Rcpp的介绍

R的高级编程技巧主要包括向量运算和扩展软件包的使用两方面。演讲的第一部分介绍了apply()系列函数的用法,来实现R中的向量化操作;第二部分介绍了Rcpp的相关历史,并详细叙述了Rcpp的使用方法及效率方面的比较。

9、曹宗富——基于R/Bioconductor进行生物芯片数据分析

演讲首先介绍了生物芯片的应用及其对应的数据处理方法,之后介绍了Bioconductor的创始人和历史,并利用相应的软件包对基因芯片进行了一系列的分析,包括预处理、聚类、可视化等。

10、李颖——推进R语言图书的发展

演讲介绍了目前国内R语言图书出版的现状,鼓励R语言的爱好者将编程经验系统化,编写相关的教材或翻译国外的作品。演讲者还对目前正在进行的出版计划进行了介绍。

11、邓一硕——R与现代金融分析

在以往的几届R会议中都没有涉及金融方面的应用,本演讲旨在填补这一部分的空白。演讲总体分为五个部分,介绍了金融时间序列建模、风险度量、技术分析、期权以及投资组合等方面的理论和R语言实现。

12、林伟林——R在量化投资的应用

演讲概述了量化投资在中国的机会与不足,接下来介绍了对套利的研究和时间序列的基本知识,最后针对股指期货和指数的联动关系提出了理论模型及其R语言实现。

13、胡江堂——关于R和SAS的7个广为流传的误解

演讲者指出演讲的目的在于加强R用户和SAS用户的沟通和交流。针对R与SAS之间的7个误解,演讲者进行了澄清和解释。演讲结束后众多听众也都发表了自己的观点,与演讲者进行了热烈的讨论。

14、李舰——R的商用情况简介

演讲介绍了R在工业领域的应用,包括分析咨询,外包,程序开发,培训和支援等。针对每个方面演讲者都举出了R的具体应用范围,并着重对制药行业中R的应用进行了介绍。

15、朱剑锋——R在宏基因组研究中的应用

演讲者首先介绍了宏基因组的背景知识,然后提出了基因数据分析中遇到的问题,并对qvalue、“软”聚类等概念进行了细致的讨论,给出了相应R软件包的使用方法。演讲者还对R的发展提出了展望,指出R的发展离不开行业的发展,希望大家能多进行交流。

16、赵毅——R与.NET混合编程及其在化学计量学中的应用

演讲者介绍了R与.NET环境结合的背景,并结合一个实际的项目分析了R与.NET开发的流程及相应的解决方案。最后演讲者说明了如何将混合编程的方法应用到化学计量学中,并进行了现场演示。

17、卢一鸣——R在基因芯片数据处理中的应用

演讲的第一部分介绍了基因芯片的数据特点和相关的软件包,第二部展示了R在基因芯片数据分析中的高级应用,重点介绍了Lasso方法的原理和R语言实现。

18、张雯——R语言在物种进化分析中的应用

演讲指出,技术革新与交叉学科产生的海量数据使得生物学进入了一个新时代,生物信息学急需对数据进行挖掘,但目前生物研究人员缺乏统计学基础。针对这种现象,R是一个非常强大的工具。演讲者通过一个案例展示了R在物种进化分析中的应用,最后讨论了R语言与Perl语言之间的结合。

资源下载

经演讲者的授权同意,已将所有同意公开的幻灯片加了超链接供大家下载学习。演讲视频请点击这里

感想和建议

如果您对于中国R语言会议还有任何感想、意见或建议,欢迎您在本页面、统计之都人人网页面统计之都新浪微博留言,我们会尽力在今后对会议质量进行进一步的改善。