在酿成酒之前去赞美五谷的香醇,在谱成曲之前去赞美音符的神奇,都很难引起人民的共鸣。
同样道理,数据在可视化之前,纵使数据分析师阐述时巧舌如簧,效果也会大打折扣。原因很简单,字不如表,表不如图。数据本身是有沟通障碍的,尤其是当我们的读者或者上级对数据不敏感时,此时的可视化就相当于是一种“翻译”,就像是两个神交已久的人终于相聚却因为语言不同只能你比划我猜,这时如果送上同声翻译,绝对是雪中送炭。
简而言之,做可视化就是将数据以及数据背后的逻辑,准确又高效地传递给对方。
图表可视化的误区主要表现在观念上,这里有两个极端,十分要不得。
一是可视化“无用”。有些厉害人物,文字功力深厚,出口成章妙语连珠,仅凭一己之力就能让甲方满意,领导赞赏,认为可视化就是锦上添花,华而不实,可有可无。
二是过度可视化。可视化很有用但不能神化,要正确看待,正确使用可视化。这个极端有几种表现:
其一是将所有数据逐一可视化。在一份数据分析报告中有结论有佐证,通常只需将结论性的趋势或者重点辅助指标进行可视化,其他诸如本年销售目标、预期利润率等展示类的KPI指标,上一期与本期销售额、两个业务员的销售业绩等数量较少的对比类指标,借由文字阐述即可,数据可视化时过犹不及,要适可而止。
其二是将所有数据集中可视化。有学员曾经问“如何在一张图中清晰地展示一年365天的销售数据及天气变化,并分析这些变化同星期和节假日的关联?”
这是典型的图表负担太重,图表和人一样都有自己的极限,一个人身兼数职同时处理多件事情就会手忙脚乱,图表内容过于丰富只会变得杂乱无章。这个时候如果将数据拆分成12个月,1张图表达1个月的数据,多图经过排版形成图表组合,既专业又美观。
其三是可视化过于追求变化。一种是求变。据我观察有此想法的人不在少数,同一份数据分析报告每次更新都会更换新的可视化类型,或者更换新的配色。这样好不好呢?人既需要新鲜感也需要稳定,比如我们看国家统计局或者专业的分析机构的可视化,有自己的风格并且有延续性。另一种是求新。前一段整个朋友圈都在转发人民日报的“新冠肺炎全球疫情形势”玫瑰图,很多学员都来问我怎么做,为此我第一时间提供了制作方法,同时提醒大家把握好使用尺度和场合,求新本身没错,吓到领导就是你的错了。
其四是过于迷信某种可视化类型。这个观念与求新求变正好相反,可以称之为可视化的保守派。我的一个老朋友特别喜欢折线图,他的报告里90%都是折线图,用折线图表达趋势变化、横向对比、多属性对比,在他眼里折线图就是超级英雄般的存在。其实,不存在万能的可视化类型,一类图表表现一类问题才是常态。
把可视化做好很简单也很麻烦,简单的是只需要满足读者的需求即可,麻烦的是很多时候读者的需求往往飘忽不定,难以捉摸。
读者需求有多难琢磨,这里举个例子。曾有学员问,1张图中有6条折线,领导觉得杂乱看不明白,我建议将图表进行多区域分隔后成功过关。
过了几天这个学员又来问怎样把多折线做得清晰易懂,我很疑惑,学员说上一次通过的方案,这一次领导不喜欢了。
我猜想领导可能想要多方位多维度的分析问题,这时候一张图表往往无法满足需求,于是就建议做成看板,层层剖析数据,学员说领导觉得看板里的图表太多抓不到重点。
于是我接着建议,不妨把折线图做成动态图表,通过按钮选择关注的业务种类,此时关注业务的折线高亮显示,其他折线呈灰色。这个建议同样被PASS,学员说领导不喜欢动态图表,只喜欢静态图表。
实在抓不到这位“领导”的点,我也是无能为力了。没想到几天后学员来报喜说方案通过了,我很好奇,哪个方案这么神奇能得到领导的青睐,学员说最初的方案。
所以想做好图表可视化还是要善于思考,了解喜好,总结规律,保持原则。具体有哪些原则呢?
一是平衡性。
在可视化规范与领导喜好之间寻求平衡点。大名鼎鼎的IBCS建立了关于报表、幻灯片、仪表板、图和表的制作标准,就像下图这样。
有了这些视化规范是不是直接参照就可以呢?还不行,还需要加入一些“中国特色”,也就是领导的喜好,否则可能水土不服。如何把握领导的喜好?作为一个数据分析师,这应该是一个基本功吧。
二是逻辑性。
一个好的分析师会用数据讲故事,数据可视化之后故事会更吸引人,好的可视化就是与数据的逻辑完全契合,想展示什么(数据背后的含义)——依据是什么(数据的趋势变化)——结论是什么(数据反映的问题)。
三是准确性。
可视化要忠于数据,刻意夸大或者美化数据及变化都不可取。举个例子,前一段帮一个朋友做可视化,数据在1-50之间,做成的蝴蝶图中“数据1”对应的条形几乎不可见,这时候朋友就不满意了,明明有数图中却看不见这必须得改,接着又拒绝我增加“折断”的想法,万般无奈之下被逼着将“1”改成了“2”,终于露出一个“尖尖角”。一声长叹,数据可视化时既要满足甲方需求,也要尽可能地坚持原则。
四是稳定性。
刚才在谈可视化的误区时,建议大家不要过于求新求变,不要执着于某一类可视化类型,而是应该保持稳定性,通过增加细节适度微创新,还是领导熟悉的味道只是加了点料,保持了可视化风格延续的同时又有一点小惊喜。比如增加标准线,增加差异箭头、增加区域分隔等等。
常用的可视化工具主要有这4类:
一是在线可视化工具。主要有镝数、花火等,优点是图表种类丰富、类型新颖、配色年轻化,还提供了一些十分酷炫动态图表,操作也比较简单,很多新媒体都在用,缺点是数据保密性不够。
二是编程可视化工具。主要有E-charts、D3、ggplot、Matplotlib、pandas、plt等,优点是可以制作大型数据集和交互动画的图表,高端大气上档次,可视化效果跟脑洞大小呈正比,缺点是需要有编程基础,门槛较高。
三是商业智能工具。比如国内比较有有名的FineBI等,是专业的大数据 BI 和分析平台,主要为企业提供一站式商业智能解决方案,用他们做数据分析和可视化驾驶舱真是妥妥的,不需要写代码,而且操作比较方便,缺点是目前市场上的大部分BI都收费,不过FineBI个人版免费,这一点算是很人性化的
四是基础可视化工具。主要就是Excel,优点是通用、易用、实用,傻瓜式操作,基本上人人都会,使用成本较低,同时还有基于excel开发的图表插件Thinkcell Chart、Zebra Bi,国内可视化大神Peter开发的Easyshu,可以高效地制作出商业图表。缺点是Excel本身主要制作常规性的图表,很多特殊图表无法实现,功能强大的图表插件价格不菲。
山不在高有仙则名,水不在深有龙则灵。工具没有好坏,也不是越多越好,好用趁手就行,对于我个人来说这4类可视化工具各有特色,但要说最容易上手,最适合入门,适合大部分人日常需求的工具,非Excel莫属。
一是多看。
他山之石可以攻玉,多看优秀的可视化作品可以提高审美,比如Power Bi、商务周刊、经济学人、第一财经、数可视等,以及花火、镝数、Thinkcell Chart、Zebra Bi等,都可以从中汲取营养,成为我们可视化灵感的来源。
二是多想。
在一些数据分析讨论群里问的80%以上的问题都是,数据是什么什么样的,应该做成什么样的图表?有这种困惑的主要原因还是对可视化的类型不够熟悉,思考得太少,没有搭建起来可视化与观点呈现之间的桥梁。
三是多练。
练习是提高可视化水平最有效的手段,练习时无需过于追求复杂的制图技术,忽视图表本质。IBCS之所以能成为全世界的商业图表标准,是其对图表的标准化以及对细节的优化,降低了图表的理解难度。这里的多练就是要打好基本功,掌握基本操作+常用技巧。有一个小技巧可以判断基本功是否扎实,就是看到一个图表后大概能分析出来是如何做出来的,大家不妨试试。
四是观念。
可视化需要趁手的工具,个人认为比较理想的状态是熟练掌握一两个软件操作,准备一些趁手的可视化模板随时能用,安装一个能提高制图效率的插件,仅此而已。