公告: 极客数据面向大数据行业从业人员及爱好者分享行业最新资讯以及各种工具使用教程,行业资深大佬可移步至行业专业交流社区 “穹顶喵”!

不良数据可视化:5 个误导性数据举例

3396

对企业而言,c级高管、销售团队、营销团队、客服人员包括HR都可以是数据可视化服务的用户。首席财务官也可以通过单个仪表板查看所有财务指标。对于公司运营而言,数据可视化功能巨大。这也意味着错误的数据可视化呈现结果可能带来一场‘灾难’。
生成数据可视化时,很容易犯导致错误解释,尤其是刚开始的时候。以下是我们应该注意的五个常见错误以及一些说明这些错误的例子。
1.使用错误类型的图表或图表
有许多类型的图表或图表,可以利用它来直观地表示数据。这在很大程度上是有益的,因为它允许在数据可视化中包含一些多样性。但是,如果选择不适合试图说明的见解的图表,则可能会证明是有害的。
有些图表和图表非常适合传达特定类型的信息,但其他图表则不行。当尝试使用不合适的格式可视化数据时,可能会出现问题。
数据的性质通常决定了的可视化格式。最重要的特征是数据是定性的(它描述或分类)还是定量(意思是,它是可测量的)。定性数据往往更适合条形图和饼图,而定量数据最好用图表和直方图等格式表示。
2.包含太多的变量
生成数据可视化的要点是讲述一个故事。因此,的工作是尽可能多地包含相关信息,同时排除不相关或不必要的详细信息。这样做可以确保受众关注最重要的数据。
因此,在构想数据可视化时,应首先寻求识别必要的变量。然后,选择的变量数量将通知的可视化格式。问问自己:哪种格式有助于以最清晰的方式传达数据?
例如,比较太多变量的饼图可能会使人难以看到值之间的差异。它也可能分散观众的注意力。


3.使用不一致的刻度
如果的图表或图表旨在显示数据点之间的差异,则的刻度必须保持一致。如果的可视化比例不一致,可能会给观看者带来严重的混淆。
例如,如果生成使用图像表示条形图中数据量度的象形图,则图像应保持从列到列的相同大小。
4.不清楚线性与对数缩放
理解线性刻度与对数尺度区别的最简单方法是查看每个轴的内置轴。当图表建立在线性刻度上时,沿任一轴的任何两个点之间的值始终是相等且不变的。当图表建立在对数尺度上时,沿任一轴的任何两个点之间的值会根据特定模式变化。
虽然对数缩放可以是传达数据的有效手段,但必须清楚,它正被用于图形中。当这不清楚时,默认情况下,观看者可能会假设他们正在寻找一个线性刻度,这是更常见的。这可能会导致混淆并低估数据的重要性。
例如,下面的两个图形传达相同的数据。主要区别在于,左侧的图形是在线级的,而右侧的图形是建立在对数尺度上的。
这并不是说对数缩放不应该使用:简单地说,当它被使用时,它必须清楚地说明并传达给观众。
5.颜色选择差
仔细使用颜色可以使查看者更容易理解尝试传达的数据。但是,当使用不当时,可能会造成严重的混淆。了解希望通过数据可视化讲述的故事并明智地选择颜色非常重要。
将颜色融入可视化时出现的一些常见问题包括:
使用太多的颜色,使读者很难快速理解他们在看什么
以令人惊讶的方式使用熟悉的颜色(例如红色和绿色)
使用几乎没有对比度的颜色
不考虑可能色盲的观众
考虑一个旨在显示技术采用率变化的条形图。有些条形表示采用率增加,而另一些条形表示采用率下降。如果使用红色表示增加,而绿色表示减少,则可能会混淆观看者,他们可能习惯于红色表示负数,绿色表示正数。
作为另一个例子,请考虑美国地图图表,该图表显示各州的病毒感染率,颜色表示不同浓度的阳性病例。通常,地图图表利用同一颜色家族中的不同色调。阴影越轻,处于这种状态的病例越少;阴影越暗,情况就越多。如果你违背这个假设,使用较深的颜色来表示更少的情况,它可能会混淆观众。
不良数据可视化的影响
虽然不准确的图表在组织宏伟计划中可能看起来是一个小错误,但它可能会产生深远的影响。
从本质上讲,不准确的数据可视化会导致受众对其中显示的数据有不准确的理解。这种误解可能导致错误的见解和糟糕的商业决策——所有这些都以数据为后盾。
极端地,格式不当的图表或图表可能导致法律或监管问题。例如,财务报告中包含的误导性数据可视化可能导致投资者买卖公司股票。