云计算

    带你走进数据可视化背后的七个秘密

         [ 199IT 转载 ] 暂无评论

    秘密三:真实数据不可替代

      对一个数据集进行清洗和格式化已经很繁琐了,如果你需要设计一个基于多个数据集的可视化呢?比如你需要把公司不同部门的数据进行可视化,而这些部门各自有各自的数据库,而且你也没有时间手工把每个数据集进行清洗。这时候,人们的第一想法可能是抓一些Demo的数据来进行可视化。而且你的可视化库里可能就有一些标准的样本数据。

      很不幸,真实数据不可替代。Demo数据一般遵循正态分布而且数据量有限。是为了展示可视化用的。而一个看上去完美的柱状图,并不能帮助你解决那些数据缺失,异常数据或者现实中的真实问题。如果你过度依赖Demo数据,当你用真实数据时,你就会发现你的数据可视化设计并不能真正满足你的数据分析或者数据表现的需求。

      工具及处理方式:

      1)如果你无法访问整个数据集,不妨先试试从真实数据集中随机取些样本数据。

      2)保留无效或者缺失数据,如果你的数据集在可视化前不准备进行数据清洗,那么也不要清洗样本数据。

      3)真实数据集也许过大。在你使用样本数据时,在生成最终的可视化图前,等比例调整样本数据规模。

    秘密四:细节的地方才最头痛

    带你走进数据可视化背后的七个秘密
    对图片细节的处理

      如上图,当你水平排列数据标识时,数据标识会看不清,如果旋转90度,数据标识是看清楚了,不过又浪费了很大一块空间。选择一个合适的数据标识格式对有些可视化来说是个解决方案,不过也不是对所有方案都适用。

      设计数据标识,注释或者横轴纵轴通常都是在初始可视化后才考虑的。不过这些元素对可视化来说非常重要,而且可能会很困难或者需要大量时间才能把它们做好。特别是在你无法事先预知你的数据的情况下。

      在设计你的可视化的时候,你需要留出相当部分的空间以便你可能需要添加标识只用,通常要在你的图周围留出相对较大的空间。横纵轴上的标识要保证它们不相互覆盖而且可读。如果必要的话,可以将标识进行旋转来增加可读性。如果有一块空间标识过于集中,而你又需要这些标识可读,你可以让考虑把标识离它们所指的元素远一些,然后用连接线把标识和元素连起来。另外一种方式就是把标识整合成一个组,用标识工具提示的方式来进行可视化。如果标识的文字过长,可以考虑进行缩写或者把超出的文字剪掉等方式。

      类似的,对图的注释也需要事先计划好。最简单的方式就是在可视化中保留一部分区域来方便添加注释。不过,这样意味着你的图所占的部分就会减小。为了保留空间,把注释放在图上的空白部分。或者把注释做成可拖拽,这样用户可以把注释移开来看注释遮盖的部分。

      工具及处理方式:

      1)在设计时把数据标识,数据轴及注释的空间在图上留好。

      2)对数据标识,定义最大字符数,超出部分需要裁掉。把相近的标识组合在一起,在用户点到时再显示。

      3)对长注释,可以考虑用滚动或者展开的方式

      4)无论如何,不要忽视这些元素。数据标识在你专注图形设计的时候,可能不是你的最主要考虑,不过它们对可视化的用户来说非常重要。

    秘密五:需要的时候才用动画

      可视化的设计者经常希望能够在最终设计上加上动画。动画是一种连接数据和变化趋势的非常有用的工具。不过动画也常常会导致对你的数据的错误理解。你需要对它会如何影响你的最终效果进行评估,而不是简单地在最后加上动画效果。动画最适合表现的,是揭示数据如何在不同状态下组合在一起,如何随时间变化或者是如何相互影响的等场合。

      一般的设计原则是,动画要简单,可预测并且可以重新播放。让用户能够多次播放动画,可以让他们看到动画元素从哪里开始到哪里停止。要避免不同元素在移动中互相覆盖,不要让元素的运动不可预测。对于复杂的动画,研究表明,可以把动画分解为几个不同的阶段,在每个阶段暂停一会给用户一些时间来体会。这样有助于提高用户的理解。

      工具及处理方式:

      1)尽可能让动画简单

      2)如果动画复杂或者有很多动画元素,可以考虑分阶段动画

      3)一开始动画往往能够给人新鲜感,不过会很快让用户感到厌倦。不要仅仅因为你会加动画就在你的可视化你加上动画。

     秘密六:数据可视化不是分析

      数据可视化可以产生一些分析结果,不过需要指出的是,可视化是一个辅助分析的工具,而不是数据分析的替代,它也不是统计的替代:你的图形可能揭示了一些数据差异或者数据的相关性。不过,要得出存在这些差异和相关性的可靠结论,还需要运用统计的方法。要对你的数据真正了解,需要分析的技能,以及专业的知识。不要指望可视化能够给你这些。因此,在进行可视化项目的时候,要调整客户或者你的CEO的期望值。

      工具及处理方式:

      1)除非你就是数据分析师,你对数据可视化得出的结论不要轻易下判断。如果需要进行结论,最好找一个统计师或者专业人士一起验证后再给结论。

      2)一些细小的设计改变,比如调色板的变化,对某个变量的可视化方式等,都可能改变可视化得出的结论。如果你用可视化进行分析,一定要试试多种可视化方式,而不要依赖于一种方式。

      3)StephenFew的书“NowYouSeeIt”里面介绍了利用可视化进行商业分析的方式,包括对开发者如何设计可供分析使用的可视化工具的一些建议,读者可以参考

    秘密七:数据可视化不仅仅是编程

      现在大量的可视化编程库和教程使得普通的人员在进行基于Web的可视化中,也可以设计出高质量的可视化产品。然而,要想真正设计一个能够提供深入见解,或者能够清楚表达的可视化产品,除了编程之外,还需要很多其他的技能。比如图像设计,数据分析,交互设计,以及对人们认知的了解等待。这些技能,是那些可视化编程库提供不了的。

      不过,好消息是,如果你坚持采用一些数据可视化的基本原则的话。

      你也不需要对这些技能了解太多。对于初学者来说,需要坚持一些最基本的原则,比如,尽量使用柱状图,不要把圆半径设置按线性比例设定(编者:在面积比较时会给用户错误理解),设计要简单(不要用3D,少用动画,不要用阴影)等。按照一些好的可视化样本,初学者也可以创造出好的可视化作品来。

    提示:支持键盘“← →”键翻页
    本文导航
    • 第2页:数据的真实性与数据图细节

    关注排行榜

    产品品牌

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询