第八届中国R语言会议(上海)纪要

第八届中国R语言会议(上海会场)于2015年11月21日至22日在华东师范大学中山北路校区成功举办。会议分为第一天的主会场和第二天的四个分会场,第一天主会场位于大礼堂(思群堂),第二天分会场位于科学会堂报告厅和逸夫楼一楼报告厅。

r

一、会议概况

第八届中国R语言会议(上海会场)由华东师范大学经济与管理学部统计学院和统计之都联合主办,并得到了华院数据、辰智咨询、永洪科技、优酷土豆集团等战略合作伙伴的鼎力协助。在华东师范大学统计学院、统计之都各位同仁的不懈努力下,本次会议比往届有了更大的突破。会议共设有5个会场,32场主题报告,覆盖金融大数据、工具与可视化、互联网、统计与机器学习等诸多领域。本届会议报名非常火爆,人数突破了1500人,报名单位超过600个,创下历届之最。

本次大会最年轻的报名者为17岁,最年长为53岁。报名者的中位数为26岁,年龄分布的直方图如下:

年龄

本次大会报名者的男女比例约为3:2。

性别

报名者最多来自上海,比例为89%。其次分别是杭州、北京、南京。

城市

本次大会的报名者来自600多家单位,参会单位的前6位均为高等院校,其中华东师范大学和上海财经大学分占一二位。上海外的院校中,浙江大学的报名人数最多。非院校机构单位中,携程旅行网的报名人数最多。

单位

本次大会参会者职务以数据分析师居多,其次是在校的研究生。

云1

本次大会大家感兴趣的内容首先是R语言,其次就是金融大数据、大数据、数据挖掘等。

云2

二、会议内容

本次会议分为第一天的主会场和第二天的四个分会场。主会场演讲嘉宾包括学界杰出代表、业界大咖等。分会场包括金融大数据专场、工具及可视化专场、互联网专场及统计与机器学习专场,涵盖了数据科学的各个领域,讨论了数据科学在诸多领域的最新进展。

1

1、会议致辞

会议在经济与管理学部统计学院副院长张日权教授的致辞中拉开帷幕。张日权教授对统计学院的现状与发展进行了概述,并对数据科学的重要意义进行了阐述,发人深省、引人思考。

2

随后,会议主席练勇强也对本次会议进行了致辞。他对自身学习R语言的经历做了简要介绍,回顾过去又不忘展望未来,并对辛勤工作的志愿者以及主办方表达了感谢。

3

2、宣晓华:数据科学家的机遇、成长和创新创业

宣晓华是大数据技术和应用公司——华院数据技术(上海)有限公司创始人和董事长。在大数据受到国家、地方政府、企业、资本等的强劲关注下,宣晓华董事长用自己的经验和事例分享了数据科学家的产生和成长,满足创新和创业的呼唤与落地。

4

3、熊杰超:Libra-an R package as Linearized BRegman Algorithm for High Dimensional Statistics

熊杰超是北京大学姚远教授的博士生。作为R包Libra的创建者与维护者,熊杰超博士带我们了解了Libra的魅力与震撼。

5

4、陈为:大数据时代的可视化机遇

陈为是浙江大学计算机学院CAD&CG国家重点实验室教授。作为数据可视化和可视分析的专家,陈为教授向我们介绍数据可视化的基本概念以及新媒体时代下的可视分析的内涵,阐述可视化学术界的近期关注重点,并展示面向大规模数值计算模拟、智慧地球、商业智能、数据新闻等应用的可视分析案例。

6

5、王桐:如何在一个BI平台上实现数据准备、探索式分析和深度分析

王桐是北京永洪商智科技有限公司副总裁。王桐副总代表永洪分析了多年积累的数据化运营最佳实践,让企业里面的每一个人都能轻松发掘大数据的价值,获取深度洞察力。

7

6、刘鹏:互联网变现与计算广告

刘鹏是互联网商业变现专家,《计算广告》作者,现任360高级总监,商业产品首席架构师。刘鹏专家讲述了大量的互联网免费产品在获得了流量与数据以后,是如何规模化地创造收入的?在后向变现的过程中,广告的地位和作用如何?用到了什么样的计算技术?深入浅出地介绍计算广告的行业背景、基本问题、常见产品与技术方向,为大家了解互联网的商业模式,更好地从事互联网行业提供有价值的指导。

8

7、邹庆士:利害数据与关键分析技术

邹庆士是国立台北商业大学(商业技术学院 2004~2014)信息与决策科学研究所教授,台湾数据科学与商业应用协会理事长,中华 R 软件学会理事长。Big Data是近年来热门的话题之一,邹教授从Big的新解谈起,以数据敏感度(data sensitive)与数据解析(data analytical)思维为根基,聚焦到关键的数据上,以解析出真正不同且重要的洞见。内容穿插各式数据分析实例,引出关键的解析技术,期能让数据发挥其利害的功用。

9

8、谢军:当R真的遇到大数据:金融和学生学业质量溯因

谢军是上海雅捷信息技术股份有限公司副总经理及首席数据科学家。谢总报告了上海闵行的大数据实践,指出银行拥有大数据,典型的省级银行拥有5000万客户,9000万账号,其分析基础往往是5000行1000列巨大矩阵的运算。传统技术遇到了巨大挑战。他以GPU为基础的大规模并行技术将数据库查询技术提速至少500倍。

10

9、叶巍岭 :秩序的作用:商品陈列整齐是否总是比凌乱好?

叶巍岭是营销学博士,现任上海财经大学国际工商管理学院市场营销系副教授。上海财经大学“教书育人标兵”,及上海财经大学商学院杰出教学奖获得者。叶教授综合已经有的产品污染和消费者污染效应,结合本研究的“画面效应”,以及研究团队正在进行的研究,对商品陈列整齐是不是总是比凌乱要好,作出全面的回答。针对为什么整齐的陈列(相较于凌乱的陈列)会更有利于消费者对商品给出更高的质量预估这个问题他以及团队提出了“画面效应”,即当商品陈列整齐(相对于凌乱)时,消费者对陈列画面的态度更加积极正面,继而导致消费者对产品质量的预估评价也显著更高。其中,消费者对陈列画面的态度在画面效应中起到完全中介作用。他们进一步指出画面效应的调节变量:产品外观重要性。当消费者认为产品的外观不重要时,画面效应不发生,即凌乱与整齐的陈列不会引起消费者对陈列画面的态度差别,也不会引起消费者对产品质量预估评价的差异;而当产品的外观重要时,画面效应才会发生。

11

10、孙锐: R+Spark=大数据时代的R:SparkR介绍

孙锐是英特尔上海大数据团队架构师,HIVE/Shark/Spark贡献者,SparkR主力贡献者之一。孙锐专家概要地介绍SparkR的背景、历史、架构、API和状态,帮助R社区熟悉SparkR,并希望能吸引R社区参与到SparkR的讨论和开发中。Spark 1.4.0版本在Scala, Java和Python语言之外正式引入了R语言API(即SparkR)。SparkR为熟悉R语言的数据科学家提供了一种新工具,使得他们能够基于Spark大数据平台的分布式引擎在R中处理大数据。

12

11、谢宗震:R在开放数据的应用

谢宗震是清华统计博士,擅长与跨领域专家合作,开发的R包iNEXT被应用于生物、遗传、新闻、文学、电竞等领域。现职为DSP智库驱动知识长,辅导超过300位企业人士成为数据分析人才。谢博士讲述了开放数据为一个尚未被大量开发的巨大资源。政府、企业、非营利组织为了要完成他们的工作或是任务而收集了大量各式各样不同的数据。有越来越多的案例显示,成功的关键在于“善用数据、跨域合作”,从掌握现况、洞悉趋势、服务创新到政策研究,数据的价值和应用层面相当广泛。这场演讲跟各位分享了透过R语言在政府、企业、非营利组织等开放数据进行加值应用的真实案例。

13

12、11月22日分会场

本次会议共设有四个分会场,共22场报告。演讲者有来自学术界的研究人员,也有来自业界的技术大咖和数据科学家等。主题主要包括:金融大数据、工具及可视化、互联网和统计与机器学习。具体的演讲嘉宾和主题如下:

金融大数据会场

刘道明(光大云付互联网):二级市场、数据、趋势

邓一硕(懒投资):互联网金融产品创新及经营活动中的挑战

张昊(同盾科技):大数据反欺诈的实践与应用

任坤(凌云至善量化私募基金):当金融工程遇到R

李孟育(台湾嘉义大学财经系):影响台股指数涨跌的关键变量之分析:递归分类模型之运用

工具及可视化会场

何宇兵(辰智咨询):商业大数据时代,GIS和R更配

胡羡祺(Tableau):R and Tableau: Smart Meets Fast

严紫丹(陆金所):slidify+rCharts+ECharts 制作炫酷HTML5报告

邢代涛(SupStat):借助API快速搭建自然语言处理平台

张云雁(PayPal):从用R读琅琊榜小说讲讲用R读书的一些事

郎大为(雪晴数据网):数据科学的博客:从knitr到jekyll

互联网会场

张翔(淘在路上):旅游O2O行内数据解析

熊熹(京东商城):里子和面子:R语言及数据挖掘助力京东推荐系统

任万凤(诸葛IO):Growth hacking?App增长分析新玩法

谢佳标(深圳创梦天地科技):当游戏数据遇上R语言

唐力(携程旅行网):利用历史业务数据实现系统异常的实时监测

统计与机器学习会场

冯凌秉(澳大利亚国立大学):缺失值处理与R语言

杜传龙(Iowa State University):古典概率的一些通用解法

吴齐轩(国立台湾大学):Introduction to Feature Hashing

陈堰平(SupStat):贝叶斯动态线性模型的商业化应用

肖凯(开智微播):如何攒一台深度学习服务器

毛苏晗(淘在路上):旅游数据中的情感分析

14

三、演讲幻灯片

公开可下载的幻灯片链接:http://pan.baidu.com/s/1nu2uCcT,部分演讲视频发布在雪晴数据网:http://www.xueqing.cc/

 

四、会议组织

本次会议是上海举办的筹备时间最长规模最大的一次R会议,并且第一次由在校学生为主要组织者。在会议筹备的过程中,虽然遇到了很多棘手的问题,比如组委会大部分同学对会议筹备都缺乏经验,同学们平时课程学习时间紧迫(导致基本上每次组委会会议都在晚上9:00之后进行),双11物流扎堆等等,但是最后同学们经过自己的努力以及4位老师的耐心指导,还是克服了重重难关,最终成功举办了这次大会。所以首先要感谢汤银才、林祯舜、李舰、葛建辉4位老师的悉心指导和鼎力相助。其次感谢统计之都理事会和编辑部的成员,为会议宣传和发布做了不少工作。最后感谢华东师范大学统计学院的各位志愿者,为大会的顺利召开付出了辛劳。

 

本次大会的工作人员有

组委会老师:汤银才,林祯舜,李舰,葛建辉

会议主席:练勇强

副主席:刘钟毓

秘书长:龚航俊

组委会学生:胡优,王昱栋,牛青炎,邹苗苗,李浩,杨丹,王旭

统计之都:魏太云,张心雨,冯璟烁等

志愿者:路亭玉,张东,金昱成,郭明明等

 

主办单位

华东师范大学经济与管理学部

华东师范大学统计学院

统计之都

 

赞助单位

辰智咨询

华院数据

永洪科技

优酷土豆集团

15

 

关于COS编辑部

本账户为COS编辑部公共账户,目前由朱雪宁任主编,由王小宁和张心雨担任副总编,编辑有:蔡占锐,常象宇,邓金涛,邓一硕,丁维悦,范超,冯璟烁,冯凌秉,高涛,郎大为,吕翔,彭晨昱,邱怡轩,施涛,覃文锋,王健桥,魏太云,吴佳萍,谢益辉,熊熹,杨舒仪,于嘉傲,主要负责主站文章的规范化编辑以及相关论文、书籍、手册的整理、编纂、出版等工作。

第八届中国R语言会议(上海)纪要》有1个想法

发表评论

电子邮件地址不会被公开。 必填项已用*标注