主要观点总结
本文是关于数据可视化中数值型变量可视化的总结,主要讨论了根据变量的个数、数据是否具有序性以及数据点的个数来选择合适的图形表达数据。文章介绍了单变量、双变量和多变量的可视化方法,包括频率分布直方图、密度图、折线图、箱型图、小提琴图、气泡图、堆积面积图、相关图、热力图和树状图等。此外,文章还提到了Crossin的新书《码上行动:用ChatGPT学会Python编程》的上市信息。
关键观点总结
关键观点1: 数值型变量的可视化方法
文章讨论了如何根据变量的个数、数据是否具有序性以及数据点的个数选择合适的图形表达数据,包括频率分布直方图、密度图、折线图等。
关键观点2: 不同类型变量的可视化示例
文章提供了不同类型变量的可视化示例,包括单变量、有序的双变量、无序的双变量、多变量的可视化方法。
关键观点3: 额外建议及推荐书籍
文章最后提到了作者Crossin的新书《码上行动:用ChatGPT学会Python编程》的上市信息,并提供了如何加入读者交流群的方式。
文章预览
最近有群友提问关于数据可视化展示的问题,主要集中在 如何选用最合适的图形表达数据的问题 。 所以今天先写一篇关于数值型变量可视化的总结。 主要从三个维度讨论: 待画图变量的个数 数据是否具有序性 数据点的个数 1 单变量 数据结构如下所示: 对于这类图,考虑使用频率分布直方图或密度图展示: 频率分布直方图 密度图 2 双变量 2.1 有序的双变量 有序的定义如下,变量 Var1 是严格有序的,取值为 1,2,3,4 对于这类数据结构,考虑使用带有散点或不带有散点的折线图表达,如下为带有散点的折线图: 面积图 2.2 无序的双变量 无序双意味着两个变量都不带顺序,结构如下所示: 这里要考虑待展示样本点的个数,一般情况下,如果小于2000个点,可以使用箱型图,散点图,频率分布直方图。 如下,箱型图: 如果待展示点超过2000,考虑使用
………………………………