黑客动态数据可视化教程下载_黑客动态数据可视化教程

hacker|
219

深入浅出丨带你看懂数据可视化「美」的历程

深入浅出丨带你看懂数据可视化「美」的历程

古人说:“人不可貌相”,但从古至今,人类却是一群感性动物,容易受到外在表象影响,先感性才理性。

《韩非子》里提到,春秋末期鲁国人澹台灭明,天生异像,“额低口窄,鼻梁低矮,不具大器形貌”,拜孔子为师,孔子没有拒绝,但对他不上心,爱答不理,让他坐冷板凳。于是,他毅然决然地离开孔子,自学成才,独辟蹊径,游历讲学,积极传播儒家学说,并培养出很多人才,深受老百姓爱戴。孔子听闻他的事迹之后,幡然醒悟。

在今天,好看这件事也一样是很重要的。“颜值即正义”,长得好看的人,似乎更容易受到欢迎和优待。

但古人也说过:“相由心生”,从一个人的外表和精神状态可以大概知道这个人的内在状况,相反,一个人的内心思想状态,也会投射到形象外表。

因此,我们要注重自身内在涵养的健康发展,也要学会对外在美的表达与审视。

同样地,好的设计也应该是兼具内容与形式。

信息时代让人们的生活节奏加快,人们每一天都变得匆忙,时间被碎片化,甚至没有多少时间完整看完一段文字。文字的力量是有限的。只有借助可视化,信息才能高效地传播。

数据可视化是数据领域一个重要的分支,目的是“让数据说话”,展现数据之美。好的图表会说话,好的图表可以抓住用户的心。

一、历史篇:人类对世界的认知与表达从图画开始

研究发现,人脑处理图片信息是同步进行的,而处理文字信息则是一步一步循序渐进的,而且一篇文字下来,大部分人只记住了其中的20%;人在看报纸时,99%的文字信息会自动被过滤掉,脑子里只残留了可怜的1%;人脑处理图片的速度是处理文字的6000倍。也就是说,如果一篇6000字的文章需要10分钟看完,而压缩成一张图片则只需要10/6000分钟的时间。

图片可以表达的内容要比文字更丰富,同时也可以给人留下很大的想象空间 ,可以体现真实性(有图有真相),可以让人赏心悦目。

其实,在远古时期,我们遥远的祖先——智人就已经学会画画,基于自己对周边生活环境的认知,将人、鸟、兽、草、木等事物以及狩猎、耕种、出行、征战、搏斗、祭祀甚至男女交媾等日常活动刻画在岩石上、石壁上、洞穴里......到目前为止,欧洲、亚洲、美洲、大洋洲的70多个国家150多个地区发现岩画遗址,而仅非洲和澳洲少数族群目前还存有岩画制作的传统,例如著名的岩画遗址拉斯科洞窟壁画、阿尔塔米拉洞窟壁画、大麦地岩画、拉文特岩画、平图拉斯河手洞壁画、非洲大象岩刻、将军崖岩画等。

岩画学家埃马努埃尔·阿纳蒂在《世界岩画:原初语言》一书中提到:随着智人技术水平的提高、抽象和感知能力的增强,促使了复杂语言和艺术的产生,而岩画正是这种语言的一种记录形式;目前所知的70%岩画都是狩猎采集社会的作品,剩余30%是游牧和农耕时期的作品,在这些岩画的结构中存在着共同的记忆和普遍性的认知模式。岩画是象形文字,是无文字时代的写作,是人类隐没记忆的见证。

可见,人类对世界的认知与表达是从图画开始的。

图1. 远古时代的岩画

人类造出文字之前,还经历过“结绳记事”、“图画记事”等阶段。

但随着社会的发展,人类发生了“农业革命”,不再单纯依靠狩猎为生,制造和使用工具更加娴熟,剩余产品逐渐增加,社会组织逐步成熟。这时,社会组织不断产生大量的信息,除法令条纹外,还必须记录各种交易、税收、商品库存、节假日以及打胜仗的日期等。在此之前,人类虽然可以利用图画记事,但更多的还是用自己的大脑记录信息。随着信息的大量产生,容易产生记忆过载,于是就有了文字。

象形文字是由原始的图画发展而来的。由于社会的发展,加上图画效率低,难以满足社会化需求,于是人们逐渐从图画中抽离出一个个元素,形成象形文字。象形文字是一种最原始的造字方法,纯粹利用图形来作文字使用,而这些文字又与所代表的东西在形状上很相像,图画性质减弱,象征性质增强。苏美尔楔形文字、甲骨文、古埃及象形文字、玛雅文字都是独立地从原始社会最简单的图画和花纹产生出来的。

但象形文字也有很大的局限性,因为有些实体事物和抽象事物是画不出来的,而且写起来很慢又难读懂。

图2. 世界四大古文字

随着社会的进一步发展,文字也得到了很大的发展,在象形文字的基础上逐步分化出“表音”和“表意”两种文字。文字是用来记录和传播语言的,而记录和传播只有两种途径,或“表音”,或“表意”。就汉字来说,其发展脉络大致是:结绳记事—图画文字—象形文字—形意文字—意音文字。

社会的发展,推动了文字的发展,使得人们在对事物的表达上可以更加丰富多样,可以指事、象形、形声、会意、转注、假借。人们对世界的认知和表达在广度和深度上也都有了很大的延伸。反过来,由于更多样化的文字,人们能够更加准确、生动、深刻、灵活地记录下所见所闻和所思所想,加快了知识的传播与传承,推动了社会的大发展。

文字即使再丰富,也有难以突破的局限性。文字需要理解,不能一目了然,对抽象事物及个体的表达,还不够形象、到位。因此,在出现文字之后的时代,许多文献就以图文结合的形式流传下来。例如,在1912年发现的伏尼契手稿中,字母和语言至今无人破解,但其中的植物、天体出浴美女等许多图片,甚至出现了构造精致的精美图案,一目了然,让人惊叹。

图3. 伏尼契手稿

二、发展篇:进入了“百花齐放、百家争鸣”的时代

计算机出现之前,人们已经能够灵活地运用柱形图、线图、饼图等基本图表来展示数据,而且也衍生了很多新型、创意的数据图表。

大家应该都知道南丁格尔(国际上以她的生日命名了护士节),但很多人应该不知道南丁格尔玫瑰图(下图)就是她创造的。在克里米亚战争期间,南丁格尔通过搜集数据,发现很多死亡原因并非是“战死沙场”,而是在战场外感染疾病,或是在战场上受伤,却没有得到适当的护理而致死。为了解释这个原因,降低英国士兵死亡率,她画了这个著名的图表,于1858年递交到维多利亚女王手中。(这么漂亮的图表,想必女王一定很受感动)

图4. 南丁格尔玫瑰图

世界著名的绘图大师米纳德,开创了许多重要的主题绘图技巧,改良了其他技术。他是首个把饼图和地图结合在一起的人,并将流线放入地图中。以下图表是米纳德最广为人知的作品,被EdwardTufte认为是史上最杰出的统计图。它描绘了拿破仑的军队自离开波兰-俄罗斯边界后军力损失的状况,在一张图中通过两个维度呈现了六种维度信息:拿破仑军队人数、行军距离、温度、经纬度、移动方向以及时间-地域关系。

图5. 拿破仑行军图

计算机出现后,特别是互联网的兴起,人类社会以“摩尔定律”的速度,进入一个全新的时代,科学技术也得到了前所未有的革新与发展,同时也给人们带来了很多新思维。

技术的进步,让我们能够采集到比以前多得多的信息,数据规模不断成指数量级的增长,数据的内容和类型也比以前要丰富得多,改变了人们分析和研究世界的方式,也给人们提供了新的可视化素材,推动了数据可视化领域的发展。

与以前相比,数据可视化领域发生了很多的变化,得到了很大的发展。

1. 可视化的表现形式和场景更丰富

在当今信息时代,信息出现了“泛滥”与“过载”,人们每天都受到各种信息的“轰炸”。当我们打开网页或手机APP时,首先进入我们视野的就是各种弹出的广告信息。这些信息从内容到形式,都经过了精心设计。我们走在大街上,映入我们眼球的则是满大街的广告海报,还时常有人站在街边向路人派发传单。我们不仅仅只从书上看到了可视化的图表,还从海报、信息图、PPT、数据产品、大屏等获取到了大量的可视化信息。

图6. 可视化的表现形式

2. 可视化展现方式更多样和灵活

数据图表是最常用的可视化元素。除柱形图、条形图、饼图、环形图、线图、散点图、面积图、雷达图、K线图、地图等基本图表外,现在也出现了更多新式的图表,如山峰图、雷达图、气泡图、热力图、漏斗图、树图、箱形图、瀑布图、河流图、词云图、仪表盘、南丁格尔玫瑰图、旭日图、和弦图、桑基图、3D图,等等。另外,智慧的人们也常常创意性地将各种图表混搭,例如下图,地图和饼图、散点图、柱形图等搭配使用。

图7. 各种图表的混搭

除图表外,对图片和图标的灵活运用,使得可视化更加美观、形象、贴切。

图9. 图标的灵活运用

3. 从静态到动态

由于技术的发展,实时数据采集、实时数据传输以及实时数据计算得以实现,人们终于得以欣赏到数据的灵动之美。以前人们只能看到事后数据形成的分析结果,看到的是数据的过去式,领略的是数据的静态之美。而现在,通过实时计算及数据可视化,人们可以知道“当前时刻发生了什么”,看到了数据的变化,看到了数据的动态之美。

4. 设计上更注重用户体验

由“信息泛滥”引起“信息过载”,从而导致“信息焦虑”。无论是风格、元素、配色、文字、交互上还是细节上,人们的可视化作品都越来越注重用户的视觉体验,希望能让用户一目了然,不多花一点儿时间去理解。在设计风格上,从3D拟物化到简洁扁平化再到拟物扁平化的发展变化,也在不断地为用户“做减法”。

三、原则篇:关于设计的四大原则

“别忘了,你是为读者进行可视化设计。”

——《数据之美:一本书学会可视化设计》

所有的设计细节,都必须经过精心构思,都必须站在用户角度来思考。

颜值高或者打扮好看的人,总能牢牢地吸引别人的目光,相反,衣着邋遢不修边幅的人,却往往是别人瞅一眼就嫌弃。那些聪明的人,必然深谙这样的秘诀:好看的PPT报告,总能在第一时间吸引受众,再加上生动的演讲,就会收到很多好评;广告牌做得越好,就越吸引路人的注意力,越能让路人记住,广告效果也就越好。

当你看到别人的可视化作品时,你是否总觉得不好,但怎么也说不出到底哪些地方不好?如果你熟悉以下基本原则,就算不是一个专业的设计人员,你也可以快速看出哪里出了问题并提出非常中肯的建议。如果你还能熟练运用这些原则,那你的可视化作品将焕然一新,更加专业、好看、有趣,也将收获更多读者的赞赏。

亲密性(分组)

在生活中,几乎每件事都有逻辑,人们也喜欢遵循一定的逻辑去理解世间之事,例如时间先后、空间、因果、总-分-总等逻辑结构。

在做可视化设计的时候,我们所要表达的内容一定不能是一些无序呈现,这样会给读者造成理解上的混乱。我们的可视化作品应当能够遵循多数读者所能理解的思维逻辑,将内容分成几部分按顺序一步一步地表达出来。

相同部分的内容,彼此相关,应当靠近,放在一起。这样阅读起来才能被理解成为同一单元的内容,而不是多个孤立的不相关的内容。不同部分的内容,应当明显地区隔开来,例如上下部分内容之间用一空行隔开或者间距放大。这样有助于组织信息,减少混乱,为读者提供清晰的结构。

图10. 亲密性原则

对齐

在版式布局上,任何元素的摆放,都可能会影响甚至主导用户的视觉流程。因此,任何元素都不能随意摆放,否则会造成混乱,而混乱会令人不适。对齐,使每个元素都与其它元素建立起某种视觉联系。对齐,也让可视化作品更加清晰、精巧、清爽。

对齐,不仅包括左对齐、右对齐、顶端对齐、低端对齐,还包括水平居中、垂直居中、横向分布、纵向分布,等。

图11. 对齐原则

重复/统一

我们都有“先入为主”的“陋习”,当看到与之前不和谐不一致的东西,常感突兀,甚至本能抗拒。因此,在可视化作品中反复使用一些视觉要素,建立上下文之间的联系,增加条理性,保持视觉上的统一。

任何视觉元素都可以在同一作品中重复使用,例如颜色、形状、材质、空间关系、线宽、字体、大小和图片,等等。

图12. 重复原则

对比/强调

在做可视化设计时,我们的初心是以图文的形式把所要表达的信息清晰的传递给用户,让用户一目了然,尽量不需要太多思考和理解。为了达到这个目的,我们需要强调重点,弱化次要,避免作品中所有的元素看起来重要程度都是一样的。如果所有的东西都同等重要,那就相当于所有的东西都不重要。

图13. 强调重点,弱化必要

如果你想突出某些信息要点,那就让对应的元素(字体、颜色、大小、线宽、形状、空间等)与其它元素不相同,让它们截然不同,让用户首先能够关注到它们。

图14. 对比原则

表达,力求准确、到位、简洁、易懂

当用户看到我们的可视化作品时,我们最好要保证所表达的信息能被用户正确理解。除使用上面几个原则外,我们还要附加一些辅助信息,例如文字、箭头等。在可视化作品中,文字必不可少,但篇幅要加以控制。

文字的表达,要准确、到位、简洁、易懂,要能引导用户正确地理解图表的意思,要能不引起任何歧义。

图15. 表达,要准确、到位

四、流程篇:要有数据可视化的正确姿势

没有什么比亲手创造美这件事更给人带来成就感了。

当我们满怀激动地开始数据可视化时,请不要马上钻入某个细节里,不要急着考虑用什么酷炫的图表来展现,也不要纠结于用什么颜色、什么字体。我们要有数据可视化的正确打开姿势。

不同形式的数据可视化流程有所不同,这里主要讲重要且相通的部分。

(一) 了解你的需求

关于需求,在实现之前,一定要听清楚做什么,想清楚怎么做,说清楚怎么做。

了解与分析数据可视化需求,主要围绕以下几点来展开:

1. 看什么,即哪些内容需要可视化。

很少需求方能够准确、全面地说出他们真正想要什么。他们只能描述出大概的样子,因此需要不断引导他们以明确真正详细的需求。

· 可视化的目的是什么,用户是谁,在哪里看,什么情况下看,多久看一次;

· 了解数据,看看有哪些指标,哪些指标可以直接取,哪些需要复杂计算,哪些可以实时,哪些只能离线;

· 哪些指标必须展现,哪些指标不展现,哪些指标可展现可不展现;

· 展现的维度有哪些,按时间、部门、地域、指标,看实时数据还是历史数据;

· 通过可视化,期望从中知道哪些信息,等等。

2. 谁看,即用户是谁。

如果面对的是求真务实的老板,那可能需要侧重于内容,追求逻辑的合理性和数据的准确性;如果是来访参观的贵客,那可能为了展示公司实力与形象而追求高大上的图表设计;如果是不懂技术的业务人员,在可视化时可能需要避免过于技术性。

3. 在哪里看,即有哪些可视化形式。

一次性的工作汇报,可使用PPT,如果老板嫌弃做PPT太慢,可以直接用Excel,或者其它工具,如脑图;如果为很多用户提供周期性计算的指标数据,且满足不同条件下的查看,那适合做一款数据产品或者可视化报表;向来访的贵客介绍公司情况时,如果想给客人们提供一种赏心悦目的视觉享受,用大屏可视化数据再合适不过了;如果想给公司各部门同事普及知识、介绍成果、通知活动等,做一张可视化信息图,并在线发布,图文结合,有趣生动,既吸引更多读者关注,提升阅读体验。

4. 什么情况下看。

“第一印象”肯定是重要的。用户“第一眼”感觉不好,当然就没有了然后,就不会有“第二眼”、“第三眼”,也就不会再往下看了。所以,要带给用户“第一眼”足够良好的视觉体验,就要多想想用户会在什么场景下去看你的可视化作品。

例如,打开手机,多数情形下,用户只会根据标题有选择地浏览少量文章,因此,取一个生动、有趣、亮眼的标题,比普通标题更有视觉冲击力,会让你的文章从众多内容中脱颖而出,赢得更多用户点击阅读。

图16. 取一个有吸引力的标题

例如,在企业内部(特别是人多的公司),海报、信息图形式的内容,每天都大量地以邮件地方式群发给各部门人员,或活动通知、或展现成果、或宣传典型,等等。每个员工都“信息过载”,只能阅读少量的信息。

除标题要吸引人外,还需要注意用户打开邮件的实际场景。不少用户打开这种群发邮件时,常常是下面的情况,一堆的收件人,一堆的抄送人,这已经占据了有限电脑屏幕的一部分,剩下的部分就是点击某个邮件时出现的正文内容的部分。因此,在这一区域完整显示出标题(以及内容摘要),才能吸引用户往下看。

图17. 多想想具体的场景

(二)可视化设计

可视化设计是最重要的环节。只有做好这一环节,后面的事情才会变得简单顺畅。

1. 梳逻辑

我们在阅读时,只要遇到稍微难懂的知识,基本上会本能地第一时间选择退缩,不再看下去。之所以觉得难懂,最主要是因为逻辑不清晰给我们带来理解上的困扰。逻辑就像一棵树的树干,如果我们只见树叶不见树干,就会迷失方向。因此,在可视化设计前,一定要站在用户的角度,梳理出清晰的逻辑结构。这一步,想清楚怎么做,很重要,多花点时间也没关系。

对于数据可视化来说,逻辑就是确定各部分的核心内容,以及内容之间的先后次序和关联关系,即讲什么不讲什么,先讲什么后讲什么。

把逻辑设计得简单一些,清晰一些,用户就能越快明白你的“良苦用心”。

2. 定风格

风格营造一种氛围,驱动用户沉浸式阅读。不同的风格,适合不同的用户不同的场景,例如科技、学院、活泼、严肃、可爱,等等。

3. 排版式

版式设计就是关于如何处理信息重点,因为在任何设计中,最重要的信息需要首先被注意到,然后是次要信息。

好的版式就像导盲犬,合理地对内容进行布局,适当地安排版式中的视觉流程,引导用户第一时间看到最需要被关注的部分,暗示用户“先看什么,后看什么”。

一般来说,可视化作品一般包括标题、正文、图表、说明文字等要素。版式就是基于上述提到的几个原则,确定元素之间的层次结构,合理摆放这几个要素。

4. 选图表

不是越酷炫的图表就越适合。这首先要看展现什么数据。某些图表只适合展现相应格式的数据。其次,也需要对展现数据的图表进行个性化定制,包括样式、风格、颜色、字体,使之契合上下文语境,也让图表更有温度。

不要将就而选择默认设置的图表,不要做那个“Mr.差不多”或“Ms.还行”。如果将默认设置的图表放在可视化作品中,总是显得那么突兀和不协调。另外,对默认设置的弃用,可以强迫自己不断精进,不断提升可视化的能力。

5. 调细节

对单个部分的可视化设计,并不能完全保证整体上的和谐一致。因此,回到整体,根据前面提到的几个原则,发现细节问题,对某些细节进行调整,使之整体上保持一致。例如,各部分视觉元素之间保持对齐,如标题、正文、图表等;在配色、字体或其它细节上,各部分要尽量做到统一;各部分之间要有明显的区隔,等等。

(三)指标计算

巧妇难为五米之炊。有数据,才能谈数据可视化。数据的获取、整合、计算,会占用大量的时间。这一部分工作是相对独立的。

但需要注意的是,模拟数据和真实数据是有区别的。根据模拟数据设计的图表,一定要用真实数据展现与验证,验证图表与真实数据的契合程度。例如下图,模拟数据展示的图表中各部门之间存在明显的差异,但改为用真实数据展示时,却“看起来感觉都一样”,这时候就需要调整图表的设置,凸显视觉上的差异。

图18. 用真实数据验证可视化的效果

指标的计算过程,这里略去不讲。

(四)前端开发

数据产品、大屏的可视化实现,还需要前端开发。

理论上来讲,只要设计出的图表,就一定能在前端实现。但这个可能会受到前端开发人员的技术水平和展现工具的限制。所以,可视化设计有时候需要寻求一种关于设计与实现之间的平衡。

可视化设计人员最好事先有所评估,采用复杂图表设计之前最好与开发人员沟通探讨实现的可行性。

五、工具篇:你会用Excel设计图表吗?

Excel是最常用、最基本、最灵活且最应该掌握的图表制作工具。 可以说,大多数图表样式都可以用Excel画出来。如果你认为用Excel画不出来某种样式的图表,有可能是你还未掌握Excel的高阶技巧。

Excel展现的图表是静态的,且支持的数据量比较有限。所以,如果是企业级的动态数据展现,还需要借助专业的大数据可视化工具。

专业可视化工具有很多,大致可分为三类:企业级专业可视化工具、轻量级在线可视化工具、编程式图表工具。

企业级专业可视化工具

ECharts 是国内使用率非常高的开源图表工具,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器,底层依赖轻量级的 Canvas 类库 ZRender,提供直观、生动、可交互、可高度个性化定制的数据可视化图表。ECharts 3 中更是加入了更多丰富的交互功能以及更多的可视化效果,并且对移动端做了深度的优化。

D3.js 是最好的开源数据可视化工具库。D3.js运行在JavaScript上,并使用HTML、CSS和SVG。 D3.js使用数据驱动的方式创建漂亮的网页。 D3.js可实现实时交互。这个JS库将数据以SVG和HTML5格式呈现,所以像IE7和8这样的旧式浏览器不能利用D3.js功能。

Tableau是一款企业级的大数据可视化工具。Tableau 可以让你轻松创建图形,表格和地图。 它不仅提供了PC桌面版,还提供了服务器解决方案,可以让您在线生成可视化报告。服务器解决方案可以提供了云托管服务。

轻量级在线可视化工具

BDP个人版,类似Tableau的在线免费的数据可视化分析工具,不需要破解、不需要下载安装,在线注册后就能一直使用,操作很简单,只需要拖拽。支持几十种图表类型,也支持制作数据地图(自带坐标纠偏)。除可视化之外,BDP还有数据整合、数据处理、数据分析等功能。

百度图说,基于ECharts,在线图表制作工具,采用Excel式的操作方式制作样式丰富的图表,图表自定义的选项很丰富,使数据呈现的方式更加美观个性,易分享传播。

文图主要用在你要出一份包含文字说明的报告时使用,提供几个确定好风格配色的主题供选择,让整个报告风格统一、简洁美观!文图能够良好地适配移动端。但文图的排版不是很好用。

创客贴,在线平面设计工具,简单,快速,轻松完成在线设计,据说是2016最好的在线设计网站。

编程式图表工具

对于掌握编程语言的程序员来说,设计新颖、令人惊艳的数据图表也可以通过代码来实现。

Python有很多具有画图功能的包,如matplotlib、Seaborn、ggplot、Bokeh、pygal、Plotly、Geoplotlib、Gleam、missingno、Leather,等等。

R语言提供了很多数据可视化工具包,例如ggplot2、ggthemes、ggmap、ggiraph、ggstance、GGally、gganimate、ggradar、ggTimeSeries、ggseas、lattice、rgl、ggvis、htmlwidgets、leaflet、dygraphs,等等。

类似提供强大绘图编程功能的语言还有PHP、HTML、JavaScript、CSS等。

六、技巧篇:刻意练习是提升可视化技能的唯一途径

不断练习,不断精进

提升数据可视化技能的唯一途径就是在理解可视化设计原则和方法论的基础上,不断练习,不断精进。

除此之外,还要有点完美主义。

技巧在于平时的积累。多观察,生活中看到好的设计,多想想为什么人家设计那么好,让你忍不住多看几眼。看到不好的设计,多想想到底哪里不好。看到好看的图表,看到别人介绍的小技巧,动手做一做。

技巧太多,这里不做展开细讲。

“去设施倾向”

“这是章北海看到的另一个以前很少有人想象到的现代技术特色——去设施倾向。这种倾向在地球上还只是初露端倪,但‘去设施化’已成为比地球世界更先进的舰队世界的基本结构。这个世界到处都是简洁空荡的,几乎见不到任何设施,只有在需要时,设施才会出现,而且是在任何需要的位置出现。世界在被技术复杂化后,正在重新变得简洁起来,技术被深深地隐藏在现实的后面。”

——《三体》

科幻小说《三体》里面的这段话,给了我们提示。当我们做分析和可视化数据时,如果不用选项框和菜单栏时,应该隐藏起来,用到时才打开。另外,也尽量让所使用的软件最大化。这样可以让内容信息展现在最大的视野区域内,这样有助于让我们从中获取更全面的信息,指导我们下一步做正确的决策。

图19. 限的视野区域,信息最大化

颜色不宜过多,配色要合理

我们在可视化设计时,最好不要使用超过三种以上的主色调。颜色过多,无形中会分散用户的注意力,使得用户无法聚焦。

颜色的搭配要合理。大自然是最好的色彩家,可以借鉴大自然的色彩搭配。另外,如果你第一眼看到别人的设计,感觉很舒服,赏心悦目,那也可以借鉴作品中的色彩搭配。相信你的直觉,至少你的身体不会欺骗你。

图20.颜色不宜过多,配色要合理

图21.从生活和自然中学习配色技巧

图表可视化,让数据说话

在我们工作中可能会有大量的数据是杂乱无章的,我们很难及时去完成领导交代的数据分析任务,即使完成效率也很低,特别浪费时间,本次学习笔记是我根据自己学习图标可视化的学习思考过程,以此记录希望能有所收获。

使用的表格工具为Excel2013年版。

根据领导所需数据要求,进行统计分析,形成最初步的数据表格。

上面的表格很难让老板能第一时间看懂我们想要表达的内容,所以我们需要对表格数据进行可视化操作。

这篇文章记录图标可视化的三种方法:

1.条件格式

2.迷你图

3.动态图表

灵活运用这三种方法,能让数据分析更加高效,领导也能眼前一亮!

在Excel软件中开始栏有条件格式功能区,选择【条件格式】-【数据条】-【选择填充方式】,可以将要直观展示的数据转换成数据条,直观明了。

案例操作步骤:将销售额一栏转换成数据条,并且独立展示。

当我们直接套用色阶条数据格式时,数值也会同步显示,这样不是很美观,所以我们可以通过编辑规则,仅显示数据条。

条件格式中的数据条,非常好用又简单,但是并不能适用于所有的数据表,它只能简单的表示数据的大小,不能表现出数据的增长趋势。

如果我们需要展示出每个月的成交趋势,可以选择使用 迷你图。

在图表的下方插入一行用来放置迷你图,点击【插入】选项卡——进入【迷你图】功能区——根据需要选择迷你图的类型。

案例操作步骤:在表格下方增加两行作为放置折线迷你图和柱状迷你图的区域,点击折线迷你图,选择所需要的数据和放置迷你图的位置,点击确定就生成了网银的全年销售额。

重复操作即可得到网银、支付宝、微信等等分类的全年销售额折线图。

同理,迷你柱状图也是一样的操作,只不过选择插入柱形迷你图,就可以。

迷你柱形图中,都是细小的数据条,可能显示不是太明显,Excel中迷你柱形图可以设计,选中已添加好的柱形迷你图,就会自动出现【设计】选项卡,然后样式功能区的【标记颜色】中,可以选择将你想标记的数据换一种颜色,在案例中我将最高值标记成为了明黄色,便于一眼能看到。

迷你图可以一眼就让人看出趋势,但是要想知道折线之间的差异还是会比较困难,所以还是要借助表格来展示数据的具体差异。

动态表格能通过点击鼠标选择月份,动态显示出该月份的销售数据,并动态呈现表格,这样既方便又美观,同时更加高大上!

案例操作步骤:

1.插入月份显示框,通过进入【开发工具栏】中,进入【控件】功能区,点击【插入】,进入【表单控件】,选择【组合框控件】,在任何空白区域任意画出控件。

2.定义月份区域1-12月,命名为月份

3.将月份,通过控件来控制选择,调整控件大小。

鼠标移动到控件栏,右键选择设置控件格式,点击控制选项卡,输入数据源区域(下拉框要出现的数据),单元格链接(鼠标点击控件中下拉框的数据时,会生成一个数据)。

1.生成月份

通过第三步我们已经知道点击控件中的月份后,单元格链接后会生成相应的数字。

所以我们直接将该数字导入过来,加上“月”这个字,就能完美的达成效果。

2.动态提取总销售表中的的数据

通过INDEX函数和MATCH函数的灵活使用,可以将月份、类别与销售表相匹配,从而完美找出我们想要的数据。

MATCH函数(返回指定内容所在的位置)

MATCH(lookup-value,lookup-array,match-type)

lookup-value:表示要在区域或数组中查找的值,可以是直接输入的数组或单元格引用。

lookup-array:表示可能包含所要查找的数值的连续单元格区域,应为数组或数组引用。

match-type:表示查找方式(取值-1,1,0),用于指定精确查找(0,查找区域无序排列)或模糊查找(-1,1,查找区域升序排列)

INDEX函数(返回指定位置中的内容)

INDEX(array,row-num,column-num)

array:要返回的单元格区域或数组

row-num:返回值所在行号。

column-num:返回值所在的列号

MATCH函数提取出月份和想要类别数据的行号和列号,INDEX函数通过行号和列号返回找到的数值。

案例操作:

我们要求出对应月份的网银销售数

首先运用MATCH函数定位对应月份和网银的行号和列号

行号:输入=MATCH(K10,A1:A13,0),最后得到结果为9,因为8月在表格里的行号对应为9。

列号:表格中的列行均为网银,微信,支付号等种类,所以列号要通过对比“网银”来确定列号

输入:=MATCH(L9,A1:F1,0),最后得到结果为2。

MATCH函数返回出的列号,行号,通过INDEX函数,返回出相应的数值。

输入:=INDEX(A1:F14,MATCH(K10,A1:A13,0),MATCH(L9,A1:F1,0))

其中A1:F14是要查找的数据区域。

通过这个方法以此类推,可以查找出其他种类对应月份的数据。

可以调整第一个公式中的引用方式,将数据区域,查找值,查找区域等绝对引用,将查找网银,微信等种类相对引用,可以自动填充找出相应的值

公式:=INDEX($A$1:$F$14,MATCH($K$10,$A$1:$A$13,0),MATCH( L$9 ,$A$1:$F$1,0))

3.手动输入年度指标

假设年度指标为78000

4.计算出累计完成量,和完成率

当我们点击8月时,要计算出表格中1-8月的销售额

我们采用OFFSET函数和SUM函数联合计算出累积完成量

OFFSET函数:引用函数,表示引用某一个单元格或者区域。

OFFSET(reference,rows,cols,height,width)

reference:引用必须引用单元格或响铃单元格区域,基点,作为偏移基准的参照

rows:左上角单元格引用的向上或向下行数。使用5作为rows参数,可指定引用中的左上角单元格为引用下方的5行。rows可谓正数(这意味着在起始引用的下方)或负数(这意味着在起始引用的上方)

cols:左上角单元格引用的向左或向右行数。使用5作为cols参数,可指定引用中的左上角单元格为引用右方的5行。cols可谓正数(这意味着在起始引用的右方)或负数(这意味着在起始引用的左方)

height:需要返回引用的行高,必须为正数

width:需要返回引用的列宽,必须为正数

案例操作:

以一月的数据为基准,通过月份的选择,定位出引用的数据,再通过SUM函数直接返回出这个区域的值

公式:=SUM(OFFSET(F2,0,0,K1,1))

F2单元格为一月销售额所在的单元格,我们不需要偏移所以rows和cols均为0,height为点击控件月份后背后单元格链接的数据,表示从1月到8月的区域,weight为1,

SUM函数直接求出了F2到F9区域数值的和,这也是我们要的累积完成量

5.完成率

通过与年度指标对比,累积完成量除以年度指标,求出完成率,求出之后更改数据格式成为百分比,可以直接求出完成百分比。

1.柱形图

鼠标框出想要生成柱形图的表格,进入插入选项卡,点击柱形图

可以通过设置将柱形图中的坐标值调整一下,取最小为0,最大为25000(因为数据中没有超过25000的),这样表格会比较饱满

因为动态表格中的数据都有,所以柱形图可以将纵向坐标轴,背景横线都消除

可以调整表格的样式背景颜色,等等让表格变得更加美观并且具有专业气质。

2.生成环比图

将完成率,未完成率(1-完成率)作为指标,选中生成环状图

将环比图的背景改成和大背景一样的背景,将标题,坐标轴都删掉,并且调整环比图格式,使得更加好看

可以设置数据系列格式,调整圆环内径,颜色等数据,最终形成漂亮的环比图。

直接插入文本框在环比图正中央,将完成率公式设置其中,更改格式使其更加美观。

1.可以源表格的数据可以随时修改,最终结果会相应的变化

2.可以通过控件动态实现,一键查找相应的明细,并生成柱状图和环比图

通过这个小锻炼,可以通过excel表格将数据进行分析整理,生成图表。

由此可以发现图表才是数据可视化的大佬,俗话说:字不如表,表不如图,一图胜千言,好好学习动态数据可视化,也能在老板面前更好的表现自己!

本文内容来自于自己学习小记,望以后更加努力,加油!

数据可视化,到底该用什么软件来展示数据

1.使用你最熟悉的软件

学习用编程建立数据可视化不代表要摒弃你已经熟悉的工具。我一般使用任何能够最快速解决问题的工具,这个工具可以是Excel,GoogleSheets,或者是Python。

你不需要只用R或者只用JavaScript做完所有工作,在一项工作中囊括不同的工具是有好处的。你的最终目的是制作可视化图表,每一步的结果会引导你进行到下一步,所以不要太纠结于用“正确”的方法做事。

2.从基础做起

不要期待你第一次尝试就会做出非常高级非常惊艳的视觉效果。尤其在学习的初期,你是有很多路要走的,所以要从基础做起,再慢慢去使用更加高级的技巧。这样你才不会一开始就感到备受打击,从而放弃学习的希望。

在R语言中,有很多工具包可以帮助你做事情,甚至有时候你只要使用一个函数就行了。但是如果你不熟悉R的编程句法,我还是建议你从最基本的R语言学起,即便可能会有些难。

就好比我之前提到的d3.js这个JacaScript函式库,如果你不熟悉JavaScript,或者刚刚开始学习编程,很多类似的东西都会看起来很难。我建议你从MikeBostock写的基础教程学起,慢慢开始了解你做的东西。

3.找一个项目去完成

不要认为要把所有的东西学完再开始做项目,这样你会被耽搁。先学习一些基础知识就可以开始了,这至少可以保证,日后当你遇到问题在网上搜索的时候,能够看懂那些解决方法。

选择一些数据,然后开始着手尝试可视化吧。一开始的进展肯定非常缓慢,你也会觉得很困惑,这都是很正常的。我直到现在还经常因为一些问题感到困惑,但你一定要坚持做完。

做项目的受益之处,在于它逼着你去学习你需要知道的。你每做完一个项目,下一个就会变得容易一些了。

通常一个数据可视化的项目会分成以下的步骤。

处理和格式化数据

Python

当我有一个非矩形分隔的文件 ,或数据比较凌乱时,我会写一些特别的Python脚本。幸运的话,我会找到并重新利用过去已有的脚本。有时会用Beautiful Soup来修饰,有时会用csvkit 。

R

我只有在需要加载csv格式表格时才会用到R,通常只是做数据聚合,合并,或处理从原来的数据中派生的部分。

Tabula

多用于公开的政府数据,包括在 PDF文件中涉及的数据。没有 Tabula的话这个过程将非常痛苦。

Microsoft Excel

只有在有需求的时候才会用到它。数据读入Excel中,然后再导入像Numbers或是OpenOffice这样的工具中。

Google Sheets

有时使用电子表格比写脚本更快,我很喜欢这样简洁的过程。

分析数据

在你去做最后的图形之前,你需要先了解这个数据集。

R

这里我想到的是R。因为R作为一个开源的统计计算语言,它有一个很丰富的社区,数不尽的扩展包,以及在Stack Overflow上大量的已解答的问题。

制作静态图形

这对我来说通常包含两个阶段:(i)在R中进行可视化; (ii)在Illustrator中润色。

R

在R中有可视化工具包,如ggplot2,但我几乎全部使用R自带的那些功能,即base R。

Adobe Illustrator

如果图形要发布给别人看,我会以PDF格式保存R生成的图形,并在Illustrator中编辑。虽然有些矫枉过正,但效果还不错。我也在考虑试着用Sketch。

制作交互式图形

Flash已经过时了,而JavaScript是新的宠儿。R在这里应用不广。

d3.js

我用数据驱动的文档来做交互式的数据可视化(我还在学习中)。有许多例子可以用来试手。但如果我想快速完成一个图表,我有时也会尝试用 Vega-Lite 。

4.认真阅读编程指南和范例

编程指南是很有用的。一开始可能会有些难,但你必须要适应。如果你的程序出了问题,很大可能是因为你写的不对,而不是代码的实现有问题。所以这个时候你就需要仔细阅读指南,确认你的函数运用是正确的。

在R语言中,所有函数的指南都是用相同的格式写的,它会告诉你这个函数有哪些参数,返回值是什么,并且之后会给出使用的范例,这些范例都非常经典。

d3.js函式库的创建者MikeBostock就写了非常好的指南,在网上也有很多其他教程。Bostock在指南中收录的大量范例是非常有用的,每当我遇到问题,在网上搜索解决方法的时候,我一般都会把出现的问题和“mbostock”放在一起搜索。

5.着手去做

我有时会也会因为想太多而迟迟不开始,但是只要你能着手按照以上的小提示去做,能节省很多时间。用工具进行数据可视化,一般会有一个最优的做法,但没有必要从一开始就去寻找它。先把形状和颜色在屏幕上试下,然后将数据编译进去,让数据在大体上看起来没问题。如果有些不对劲(尤其是对于含有互用和动画的可视化项目),你再去寻求更优化的做法。一般情况下,即使不是最优,你的图表也是没错的。

0条大神的评论

发表评论