丑图百讲|好看的统计图都是相似的,难看的统计图各有各的丑

作者:水妈

大家好,我是水妈,在大学工作,主要教统计学。今天代表狗熊会,发起一个新的系列,丑图百讲。这个系列不讲炫酷的、高大上的统计图,而是给大家分享如何画好最基础的统计图

读者可能会问,为什么要分享统计画图?熊大说了,数据分析的第一步,是梳理业务目标,接下来才是分析数据。水妈认为,在分析数据环节,第一步是做描述分析。这里的描述分析,包括三个内容:一、明确行业背景和变量含义;二、用统计图、统计表以及各种统计指标对数据进行描述;三、适当的解读描述的结果,发现问题,支撑后续的建模。其中,第二个环节尤为重要,因为统计图是最容易给人留下深刻印象的。做好了,能给你的报告或者展示加分,帮助你发现数据当中的问题。做不好,那就是一场灾难。

读者可能又要问,最基础的统计图有什么好讲的啊。我看过太多学生的报告,学生看自己画的图,就像是看自己家孩子,越看越喜欢,殊不知别人早就受不了你在朋友圈天天晒娃娃了。大家不要觉得画最最基础的统计图这件事情非常简单容易,可谓不画不知道,一画吓一跳。真的自己动手去画,才知道自己画出来的图有多丑。 继续阅读丑图百讲|好看的统计图都是相似的,难看的统计图各有各的丑

基于机器学习的高价值用户自动发现

作者:

迟保昉 (猎聘大数据研究院)     苏铖 (猎聘大数据研究院)    单艺 (猎聘大数据研究院)

摘要:猎聘每天有数万新用户注册。但是,其中有的用户只是填写了少量的职业信息,即名片信息,而并未完成整个简历的填写。为获得完整的简历,猎聘职业顾问团队(GCDC)需要电话联系该部分用户完善简历。历史数据表明,未填写简历的用户中有相当数量的高价值的用户,而猎聘职业顾问需要能够优先拨打这批高级用户并提升其转化率。 为此,我们研发了基于kNN算法的自动名片用户分类系统——card-rater。该系统根据用户填写的名片信息对新用户的级别进行预测,推断其为高级简历用户的可能性。将评分较高、更有可能是高级的用户推荐给GCDC进行优先电话拨打,显著地提高了高级用户简历转化率。

继续阅读基于机器学习的高价值用户自动发现

一种使用SEM广告展现数据优化投放策略的方法

作者:常莹 (北京博雅立方科技有限公司)

摘要:本文主要介绍了一种使用公开的SEM广告展现数据,判断行业竞争态势及竞争对手动向、并进而优化SEM投放的方法。此方法由SEM第三方代理公司根据教育培训行业客户的通用需求研发,但具备通用性,可以便捷地复制到其他行业或供某一广告主使用。研究中所使用的主要数据是搜索引擎公开展示的SEM广告。整套方法由一个概念模型和一系列用于完成具体数据分析任务的描述性统计方法组成。分析结果包含一套刻画行业(也可以是子行业/业务线/竞争对手/行业重要关键词等维度)SEM广告投放策略特征及变化趋势的图表,以及据此生成的对市场趋势的判断和优化投放建议。这种方法所需的数据容易获取、方法可扩展性好,产出可用来制定有针对性的投放策略和优化方案,是一种非常经济监控竞品以及提升广告投放效果的方法。 继续阅读一种使用SEM广告展现数据优化投放策略的方法

第九届中国R语言会议(北京)

ruc22016年,是统计之都倡导的中国R语言会议第九年,也是统计之都成立十周年。本届R语言会议将与第七届中国人民大学国际统计论坛、2016百分点数据与价值国际论坛联合举办,共同组成迄今为止中国最大的统计盛会——大统计与数据科学联合会议。

中国R语言会议是由统计之都发起,并同国内高校共同举办的R语言与数据科学会议。2008年,中国R语言会议在中国人民大学举办第1届,2015年已发展至全国七个城市举办,报名人数近万人。内容覆盖数据科学及R语言在各行各业的应用,包括天文、地理、医疗、生物、金融、能源、互联网等领域。

R语言会议不断发展,统计之都也已走过了十年风雨。十年间,统计之都服务着广大统计学爱好者,推动着R语言在中国的不断发展,见证着数据科学时代的逐渐崛起。在这样一个值得纪念的时刻,让我们相聚人大,相聚统计之都十周年庆典,也相聚这场数据与统计的盛宴!

会议的相关情况如下:

一、会议时间

2016年5月27日~29日 继续阅读第九届中国R语言会议(北京)

生物医学大数据分析方法研讨会

当前生物医学研究面临着大数据时代的挑战与机遇,统计学习、数据挖掘等大数据技术在医疗实践、临床研究中得到了广泛应用。其中,基因研究、临床治疗等领域中的高维数据分析方法研究已取得长足发展,同时,随着可穿戴设备的不断发展,实时数据采集和实时监测在临床研究中也开始得到应用。为了促进生物医学领域各界同仁的学术交流,北京生物医学统计与数据管理研究会、中国人民大学统计学院、首都医科大学北京市临床流行病学重点实验室、中国现场统计研究会生物医学统计分会将于2016年5月29日举办“生物医学大数据分析方法研讨会”。本次会议拟邀请国内外知名专家学者莅临,届时将就生物医学研究中的统计方法进行深入交流、讨论。

欢迎各位专家学者、研究同仁拨冗参加。

主办单位

北京生物医学统计与数据管理研究会

中国人民大学统计学院

首都医科大学北京市临床流行病学重点实验室

中国现场统计研究会生物医学统计分会 

承办单位 继续阅读生物医学大数据分析方法研讨会