• 主题:大数据时代的数据可视化
  • 嘉宾:包明明
  • 主办:统计之都、北京大学商务智能研究中心
  • 场地:北京大学光华管理学院
  • 组织:蔡占锐、闫晗、吕翔、冯璟烁、陈源韬、王一宁
  • 纪要:吕翔

mmexport1418655675790

2014年12月14日,第25期COS沙龙(北京站)在北京大学光华管理学院顺利举行。各位统计爱好者、投资从业者顶着帝都的寒风纷纷前来,积极探讨,共同完成了一场主题为“大数据时代的数据可视化”的精彩分享沙龙。本次沙龙由人大本科生王一宁主持,嘉宾是现任北京云思科技公司数据产品开发推广负责人包明明先生。

“Seeing is knowing, 信息就隐藏在一堆数据中间,但是你看不见就无法理解,如何将人眼难以处理的表格中的信息突出显示,转换为人脑可以最快理解接受的形式,这就需要数据可视化。”包明明先生以数据可视化的必要性来作为开场白,向我们介绍了数据可视化的基本概念以及实际应用。以下为本期沙龙主要内容的回顾:

一、有哪些可视化?

除了常见的数据分析结果可视化以外,还通常有空间地理可视化和社交网络可视化。

一般的数据分析结果可视化通常是将枯燥,需要花费精力理解的报表中的人快速难以看到并理解的信息突出融合,减少其他无关信息的干扰,让使用者专注于某一部分的信息,使人脑能够在片刻间处理报表中的关键部分。

空间地理可视化往往伴随着地图来显示,反应了某项指标或者分析结果在地理位置上的分布,常常用于侧面辅助人口以及经济分布。

社交网络可视化在最近几年应用逐渐增加,通过此可视化,可以轻易捕捉社交网络中的“意见领袖”节点 ,在反恐和社会舆论控制中的卓有成效,往往要结合文本分析来对特定内容的网络进行可视化。

二、可视化的目的?

Expand memory,扩展记忆,使人脑短期容纳更多信息,将一些决策需要的信息快速呈现出来,比如数据对比,发现异常值,发现趋势,发现关系以及发现结构等等。达到快速的获取信息,瞬间决策响应的作用。

在最初分析时关心的可能不是具体值,而是趋势,异常,大小比较等简单分析结果,后续深入研究才会注意某个具体值,所以可视化一开始不用呈现大量信息,后期再加载所需考察的关键点信息。

三、可视化有哪些元素?

可视化不仅仅是一张图那么笼统,图中的每一个细节都需要仔细斟酌考虑。常见的考虑元素有:点,线,条,角,形状,位置,长度,尺寸,颜色,面积,标签,字体等等,最终汇总为一张输出图,其中的每一个元素的变动都会有截然不同的数据效果。

比如说在地图上就可以用圆的大小或者区域颜色的深浅来表示该位置的某个变量的值大小,这样既可以快速对比又可以避免维度上的增加。或者可以在折线图上用点的尺寸来反映某变量取值随时间变化的趋势,将更多的信息表现在一张图中,方便人们快速处理。

四、可视化的注意点

1. 可视化一定越炫越好吗?

Wrong,可视化的目的是快速呈现信息,以信息为目的,而不是渲染效果。

2. 可视化所呈现的信息越多越好吗?

Very wrong,一开始应只呈现少量数据,需要细节信息时再向下掘取,可以将多张图关联在一起,层层递进或者用悬浮窗显示具体数值。

3. 可视化的呈现有固定的准则吗?

Not even wrong,可视化的呈现要考虑用户的需求,比如一些CEO只关心某几个截面,那么不管多么完整直观酷炫的呈现还不如直接放几个截面指标来的有效。

来自清华大学、北京大学、人民大学、中科院、央财、知名出版社、生科所互联网公司、数据挖掘公司等高校学生、业界人士以及创业者40余人参加了本次活动。嘉宾分享结束后,对数据可视化有丰富经验和深入了解的各位来宾又针对分享环节中的问题进行了充分交流分享,本次沙龙取得圆满成功!

沙龙展示

发表/查看评论