智能化图表推荐

AVA

推荐规则

logo

  • 对于柱状图条形图大类的图表来说,柱子的数量应该被控制在一个合理的范围内。当只有一根柱子时,其实没有必要使用柱状图,所以得零分。当柱子数量在 2 到 20 之间,我们认为这对于柱状图来说都是合理的,得 1 分。当柱子数量超过 20,柱子数量越多越不利于具体数值的展示,此时这条规则的分数为柱子数量和常量 20 的比值,数量越多分数越小,越趋近于 0。
  • 饼图各扇区之间应该有足够大的差异。否则读者很难看出细微的数据差异,这样一来饼图的就失去了其比较的功能。
  • 当纵向空间更大时,尽可能利用纵向空间来放更多的柱子。横向空间同理。
  • 序列通常是指一个特定的易于区分的数据维度,比如商品类别,通常会用颜色等视觉通道来映射。当一个序列中包含太多值的时候会让读者不能清晰分辨。比如,想象一下一个柱状图上同时包含 20 种颜色。
  • 数据集带有时间或顺序性字段时,通常需要分析其变化趋势,折线图面积图非常符合大部分读者的心理预期。
  • 在考虑柱状图类的图表时,我们需要考虑什么情况下去推荐基础柱状图,什么时候去推荐分组柱状图。推荐分组柱状图的前提是至少有两个维度构成一个层级关系。在层级关系中的上级层级,起码会出现维值上的重复。满足这个条件的更推荐分组型的图表。
  • 类似饼图雷达图的一些图表,其中会有一个维度作为序列,其维值的数量决定了扇形的数量、轴的数量等。这个维值数量不宜过大,否则读者很难清晰地阅读图表。
  • 柱状图条形图的数值轴不应该设置除 0 以外的最小值,否则可能会给读者带来数值对比上的误导。一个标准的修改方案是不设置其最小值或者设置为 0。
  • 对于折线图来说,趋势的展现是十分重要的。如果数值整体绝对值很大,而变化趋势很小,那么折线图会看起来很像是一根直线,难以看出波动。这种情况下可以适当调整 y 轴的值域(可以不从 0 开始)来让趋势变化达到读者可感知的程度。

结果页

DataSette

https://datasette.io/

GitHub - simonw/datasette: An open source multi-tool for exploring and publishing data

调研资料

http://cf.myhexin.com/pages/viewpage.action?pageId=669451224

http://cf.myhexin.com/pages/viewpage.action?pageId=700285897