数据可视化读书笔记

Posted by Zhenyu Lu on Sunday, July 17, 2022

前言

  • 作为数据分析过程的一个环节,作图应当是自动生成的,无需任何人工的后处理即可发送至打印机打印。
  • 交互性作图程序用于作图不是一个好的选择,比如Excel就是交互性作图程序。❓

第1章 引言

  • 数据可视化第一也是最重要的目标就是准确地表达数据所包含的信息,不能误导或扭曲数据。
  • 数据可视化同时也需要符合美学上的要求。好的视觉展现方式能够增强可视化所传达的信息。

第2章 可视化数据:数据到美学的映射

  • 数据可视化的基本原理:将数据数值映射至图形中可量化的特征。
  • 图形元素的构成要件:
    • 位置(Position)
    • 形状(Shape)
    • 尺寸(Size)
    • 颜色(Color)
    • 线型,例如粗细、虚线类型等
    • 字体及字体大小
    • 透明度
  • 数据类型:
    • 定量数据(quantitative)
      • 连续数值
      • 离散数值
    • 定性数据(qualitative)(==factor==以及==level==的概念)
      • 无序类别
      • 有序类别
    • 日期及时间数据
    • 文本数据
  • 为了将数据值向美学元素映射,我们需要指定哪个数据值对应于哪个特定的美学值,这个映射过程称为标度过程(scale)
    • 标度过程是一个一一映射过程,也即数据与美学元素之间的映射是唯一的,否则数据可视化将变成模棱两可

第3章 坐标系与坐标轴

  • 迪卡尔坐标系
    • 迪卡尔坐标系的两个坐标轴可以具有不同的单位,此时x轴和y轴的纵横比可以根据需要做调整
    • 如果迪卡尔坐标系的两个坐标轴具有相同的单位,那么x轴和y轴的网格间距应当相同
    • 迪卡尔坐标系在线性变换的条件下视觉上保持不变
  • 非线性坐标轴
    • 对数标度(logarithmic scale
      • 原始数据标在对数标度的坐标轴上是优选方案,==注意刻度标签的正确性==
      • 若对数转换后的数据在线性标度的坐标轴上,则==注意指明对数转换所用的底数==
      • 对数标度适用于通过乘法或除法获得的数据,比如表示==比值==关系的数据
      • 对数标度也适用于数值相差很大的数据
      • 对数标度中,值1一般都数据展示的中点,而在线性标度上值0是中点
    • 对数标度不适用于值为0的数据,对于值为0的数据,可以采用平方根标度(square-root scale
      • 平方根标度适用于以平方的方式表达的数据
  • 具有曲线坐标轴的坐标系
    • 极坐标系
      • 极坐标系适用于表达具有周期性质的数据
    • 地理空间数据需要采用曲线坐标轴来表达

第4章 颜色色阶(Color Scales)

数据可视化中,颜色有三种基本的用途:数据间相互区分、代表数据值、强调数据

  • 颜色用作数据间相互区分 - ==定性色阶(qualitative color scale)==
    • 适用对象是本身没用排序的离散数据
    • 要求各颜色之间能够显著地区分,但是相互间又是平等的
      • 某种颜色相对于其他颜色不会显著地突出
      • 各颜色间不能造成存在排序的误解
  • 颜色用作代表数据值- ==有序色阶(sequential color scale)==
    • 要求各颜色之间能够清晰地表示数据的大小,以及两个值之间的间距
    • 色阶在整个数据值范围上呈现统一的变化
    • 有序色阶可基于单色相(a single hue)
    • 有序色阶可基于多色相(multiple hues),==通常选择自然界能够看到的颜色变化梯度==
    • 适用的对象:
      • 在地理区域上变化的数据
      • 相对于中点值在正、负两个方向上的数据值偏差 - ==双色色阶(diverging color scale)==
        • 双色色阶在两个方向上需要平衡,也即从中间的浅色到两端的深色,在两个方向上具有相同的序列值
  • 颜色用作数据强调 - ==着重色阶(accent color scale)==
    • 包含一系列比较柔和的颜色,以及对应的比较深、比较强烈以及更饱和的颜色
    • 基准色(baseline color)不能过于鲜艳而争夺数据焦点

第五章 可视化目录

  • 对数量进行可视化

「真诚赞赏,手留余香」

水鸿的博客

真诚赞赏,手留余香

使用微信扫描二维码完成支付