|
|
|
|
|
 |
|
|
|
点击查看大图 |
 |
图书详情 |
 |
| |
|
 |
内容提要 |
目录 |
CIP |
序言 |
前言 |
作译者 |
书摘 |
书评 |
最佳拍档 |
快速上手:学习门槛低,零基础即可入门,并在短时间内快速掌握
内容全面:囊括所有常见图形的绘制,并介绍交互式和动画图形的绘制
示例丰富:穿插数百个示例,全面展现基于R语言的数据可视化效果
代码实战:所有的示例均给出实现代码,便于读者动手实践和复现
数据可视化是一种非常重要的技能。R语言是一门非常好的数据可视化工具。本书结合大量的实例,全面介绍如何利用R语言绘制各种统计图形,涵盖普通统计图形的绘制、高级统计图形的绘制、交互式图形的绘制及动画图形的绘制等。本书中的所有统计图形都给出了实例源代码,读者可以通过代码进行复现。
本书共13章,涵盖的主要内容有:R语言数据可视化简介;数据处理与探索;数据可视化;单变量图形绘制;两个同类型变量的图形绘制;分类变量和连续变量之间的图形绘制;高维图形绘制;其他图形绘制;图形元素、标题和图例绘制;颜色等参数的调整;合并多幅图形;R语言绘图包;Shiny工具包。
本书通俗易懂,案例丰富,实用性强,特别适合R语言数据可视化的入门与进阶读者阅读,也适合其他数据科学从业者阅读。另外,本书还适合统计学、计算机、机器学习和数学等相关专业的本科生及研究生作为参考读物。 |
|
前言
第1章 R语言数据可视化简介 1
1.1 R语言介绍 1
1.1.1 向量 3
1.1.2 列表 3
1.1.3 矩阵 4
1.1.4 数组 5
1.1.5 因子 5
1.1.6 数据框 6
1.1.7 for循环 7
1.1.8 条件判断 8
1.1.9 函数 9
1.2 Rstudio介绍 12
1.3 R包介绍 13
1.4 R语言数据读取 14
1.4.1 读取Excel数据 15
1.4.2 读取SPSS、SAS和STATA数据 17
1.5 ggplot2介绍 18
1.5.1 使用qplot函数快速绘图 19
1.5.2 使用ggplot函数绘图 20
1.6 统计图形 22
1.6.1 散点图 22
1.6.2 箱线图 24
1.6.3 小提琴图 25
1.6.4 条形图 27
1.6.5 和弦图 28
1.6.6 桑基图 30
1.6.7 棒棒糖图 31
1.6.8 克利夫兰点图 32
1.6.9 艺术图 34
1.7 tidyverse介绍 38
1.8 总结 41
第2章 数据处理与探索 42
2.1 数据转换 42
2.1.1 筛选数据集的行 42
2.1.2 筛选数据集的列 46
2.1.3 数据排序及新变量生成 48
2.1.4 数据分组汇总 49
2.1.5 数据合并 50
2.2 数据重塑 54
2.2.1 数据聚合 55
2.2.2 数据分散 56
2.2.3 数据切割 57
2.2.4 数据合并 58
2.3 总结 59
第3章 数据可视化 60
3.1 ggplot2核心概念 60
3.1.1 散点图 62
3.1.2 折线图 64
3.1.3 条形图 66
3.1.4 直方图 68
3.1.5 密度图 72
3.1.6 箱线图 75
3.2 总结 79
第4章 单变量图形绘制 80
4.1 面积图 80
4.1.1 面积图的绘制方式 82
4.1.2 绘制堆叠的面积图 85
4.1.3 绘制比例堆叠面积图 88
4.2 密度图 90
4.2.1 基础密度图 95
4.2.2 绘制少量分组的密度图 96
4.2.3 绘制大量分组的密度图 101
4.2.4 密度图的其他调整 103
4.3 直方图 105
4.3.1 基础直方图 107
4.3.2 分组直方图的绘制 109
4.3.3 合并直方图与密度图 111
4.4 频率图 113
4.5 总结 114
第5章 两个同类型变量的图形绘制 115
5.1 散点图 115
5.1.1 绘制基础散点图 118
5.1.2 绘制分组散点图 121
5.1.3 添加拟合曲线 127
5.1.4 在散点图中添加地毯图 130
5.1.5 在散点图中添加文本 136
5.2 抖动点图 140
5.3 连续二维分布图 142
5.3.1 绘制二维直方图 143
5.3.2 绘制六角直方图 144
5.3.3 绘制二维密度直方图 145
5.3.4 调整图形配色 147
5.4 线图 148
5.4.1 绘制基础线图 155
5.4.2 绘制连线图 160
第6章 分类变量和连续变量的图形绘制 163
6.1 箱线图 163
6.1.1 绘制基础箱线图 174
6.1.2 调整参数 175
6.1.3 调整箱线图组别的顺序 176
6.1.4 调整颜色 183
6.1.5 构建分组箱线图 191
6.1.6 调整箱线图的宽度 193
6.1.7 构建连续变量的箱线图 194
6.1.8 添加平均值 195
6.1.9 添加抖动点 196
6.2 小提琴图 197
6.2.1 绘制基础的小提琴图 200
6.2.2 绘制水平的小提琴图 201
6.2.3 在小提琴图中添加箱线图 203
6.3 棒棒糖图 204
6.3.1 绘制分组的棒棒糖图 209
6.3.2 绘制基础棒棒糖图 217
6.3.3 棒棒糖图参数的调节 219
6.3.4 添加标注 224
6.4 条形图 226
6.4.1 绘制基础条形图 229
6.4.2 改变条形图宽度 235
6.4.3 添加误差棒 235
6.5 圆形条形图 241
6.5.1 绘制基础圆形条形图 250
6.5.2 添加标签 252
6.5.3 圆形条形图的更多调整 253
6.6 饼图 259
6.6.1 绘制基础饼图 263
6.6.2 调整细节 264
6.6.3 添加标签 265
6.7 甜甜圈图 266
第7章 高维图形绘制 270
7.1 气泡图 270
7.1.1 绘制基础气泡图 274
7.1.2 控制气泡的大小 275
7.1.3 设置颜色 276
7.1.4 调整更多的细节 277
7.1.5 绘制动态图 279
7.2 三维散点图 280
7.3 流型图 282
7.3.1 绘制基础流型图 285
7.3.2 调整流型图的偏移 286
7.3.3 调整流型图的形状与颜色 287
7.4 相关矩阵图 288
7.5 树状图 291
7.5.1 绘制基础树状图 295
7.5.2 绘制圆形树状图 297
7.5.3 绘制聚类结果的树状图 298
7.5.4 更多调整 302
7.6 圆形包装图 308
7.6.1 具有一个层次的圆形包装图 310
7.6.2 调整颜色 311
7.6.3 调整圆形之间的距离 315
7.6.4 绘制多层次的圆形包装图 315
7.6.5 调整细节 317
7.6.6 隐藏第一级 321
7.7 树形图 325
7.7.1 绘制基础树形图 326
7.7.2 绘制带有多个级别的树形图 327
7.7.3 自定义树形图 328
第8章 其他图形绘制 332
8.1 和弦图 332
8.1.1 绘制圆形图 334
8.1.2 绘制基础和弦图 337
8.1.3 调整细节 340
8.2 桑基图 343
8.3 网络图 347
8.3.1 绘制基础网络图 356
8.3.2 调整网络图的参数 358
8.3.3 网络图布局 361
8.3.4 将变量映射到节点和链接特征 362
8.3.5 使用网络图可视化聚类结果 364
8.4 旭日图 366
8.5 雷达图 368
8.5.1 绘制雷达图 374
8.5.2 绘制多组雷达图 375
8.6 词云 376
8.6.1 绘制词云 378
8.6.2 调整颜色和背景颜色 379
8.6.3 调整形状 381
8.6.4 调整单词方向 382
8.7 平行图 383
8.7.1 绘制基础平行图 389
8.7.2 自定义颜色、主题和外观 390
8.8 时间序列图 391
8.8.1 时间序列包dygraphs 396
8.8.2 时间序列热图 397
8.9 交互式图形 399
8.9.1 散点图 400
8.9.2 气泡图 401
8.9.3 面积图 402
8.9.4 条形图 404
8.9.5 饼图 405
8.9.6 桑基图 406
8.9.7 误差棒图 408
8.9.8 箱线图 409
8.9.9 直方图 411
8.9.10 二维直方图 413
8.9.11 二维轮廓直方图 414
8.9.12 小提琴图 415
8.9.13 雷达图 416
8.9.14 热图 418
8.9.15 三维散点图 418
8.9.16 动画图 420
8.9.17 调整图形图例 421
8.9.18 修改交互文本 422
8.10 动画图 423
8.10.1 绘制基础动画图 424
8.10.2 使用分面 425
8.10.3 动态变化图形 426
第9章 图形元素、标题和图例绘制 429
9.1 添加图形元素 429
9.2 主标题、轴标签和图例标题 432
9.2.1 改变标签的外观 434
9.2.2 修改图例 436
9.2.3 修改图例的位置和外貌 436
9.2.4 使用guides函数修改图例 440
第10章 颜色等参数的调整 445
10.1 图形颜色调整 445
10.1.1 使用单个颜色调整图形 446
10.1.2 通过分组调整颜色 448
10.1.3 渐变或连续颜色 455
10.2 点的形状、颜色和大小的调整 457
10.3 线条类型调整 460
10.4 坐标轴范围调整 462
10.5 坐标轴转换 465
10.6 时间数据坐标轴 468
10.7 自定义标签 471
10.8 图形主题和背景颜色 477
10.9 自定义图形的背景 480
10.10 删除面板边框和网格线 481
10.11 ggthemes包 482
10.12 文本注释 483
10.13 ggrepel包 485
10.14 添加直线 488
10.15 图形翻转和反向 490
10.16 分面 491
第11章 合并多幅图形 499
11.1 合并多幅图形到一张图中 499
11.2 gridExtra包 502
11.3 添加边际分布图 505
11.4 在ggplot中插入一个外部图形元素 506
第12章 R语言绘图包 509
12.1 ggstatsplot包 509
12.2 ggfortify包 520
12.2.1 生存分析 520
12.2.2 时间序列图 521
12.2.3 密度图 523
12.2.4 时间序列预测图 524
12.2.5 聚类图 527
12.2.6 热力图 530
12.2.7 主成分分析可视化 532
12.3 quantmod包 535
第13章 Shiny工具包 544
13.1 Shiny工具包简介 544
13.2 Shiny App的基础部分 548
13.3 Shiny示例 550
13.4 Shiny总结 553
13.5 制作一个Shiny程序 554
13.6 Shiny部署 556 |
 |
|
图书在版编目(CIP)数据
R语言数据可视化实战 / 米霖编著.—北京:机械工业出版社,2020.11
ISBN 978-7-111-66791-9
Ⅰ. R… Ⅱ. 米… Ⅲ. 统计分析-应用软件 Ⅳ. C819
中国版本图书馆CIP数据核字(2020)第199849号 |
|
|
数据可视化是一种非常重要的技能,能够帮助人们快速理解信息,分析数据中存在的趋势,识别关系中的模式。当人们有了新的见解后,往往需要将这些见解传达给其他人,在传达的过程中,使用图表、图形或其他对视觉有影响的表现形式非常重要,因为这些表现形式吸引人并可以迅速传达信息。
R是由统计学家设计的专门用于统计计算的语言,它也是一种非常好的数据可视化工具。随着技术的进步,数据公司或研究机构对数据的收集变得越来越复杂,许多人已经采用R语言作为分析数据的首选语言。R语言适用于机器学习、数据分析、数据可视化及科学计算等领域。它有多个主题的软件包,如计量经济学、金融学和时间序列等,也拥有一流的可视化、报告和交互性工具。这些工具对于企业和科学研究都非常重要,被科学家、工程师和商业人士广泛使用。
笔者多年来一直以R语言为工具从事数据可视化、数据分析、统计建模和机器学习等数据科学工作,在工作中积累了大量的经验,对R语言的原理和应用有比较全面和深入的认识,尤其在数据可视化方面更是有独到的见解。R语言提供了强大的数据可视化功能,可以生成高质量的图形,如条形图、直方图、散点图、动态图和数学符号,甚至可以用很少的代码来实现自己设计的全新图形。R语言有很多数据可视化包,如ggplot2、ggivs和plotly等,使用这些包可以非常轻松地绘制出令人印象深刻的数据可视化图表。其中,plotly包提供了一套绘制交互式图形的工具,所绘制的图形非常有表现力。另外,R语言的文档资源很丰富,而且质量很高,这对学习R语言有很大的帮助。
为了帮助广大相关从业人员和数据技术爱好者快速掌握R语言数据可视化技术,笔者编写了本书。本书主要介绍如何使用R语言绘制常见的统计图形,如直方图、散点图和箱线图等,另外也介绍了如何绘制一些不常见但很实用的统计图形,如桑基图、和弦图和时间序列图等。
本书不但介绍了普通的统计图形的绘制,而且介绍了交互式图形及动画图形的绘制,另外还介绍了如何使用Shiny工具包进行数据探索与可视化。相信通过阅读本书,读者可以在较短时间内比较系统地掌握R语言数据可视化技术。
本书特色
1.内容全面,理论结合实践
本书全面介绍如何利用R语言绘制各种统计图形,涵盖普通的统计图形绘制、高级统计图形绘制、交互式图形绘制、动画图形绘制,以及统计图形的细节调整。另外,本书还介绍了如何利用Shiny进行数据探索与可视化,是一部理论与实践紧密结合的数据可视化学习宝典。
2.零基础入门,学习门槛低
阅读本书不需要读者具备太多的预备知识,只要有基本的数学与统计学知识即可,学习门槛很低,零基础即可入门。
3.实例丰富,实用性强
本书在讲解的过程中给出了大量的R语言绘图实例,这些实例涵盖单变量图形绘制、两个同类型变量的图形绘制、分类变量和连续变量的图形绘制、高维图形绘制等。这些例子都非常实用,可以比较容易地迁移到实际工作中。
4.绘图代码详细,效果精美
本书中的绘图实例都给出了详细的实现代码,读者可以按照代码和操作步骤亲自动手实现每一个实例的效果,而且这些绘图实例的效果非常精美,让人赏心悦目。
本书内容
本书共分为13章,各章内容简单介绍如下:
第1章主要介绍R语言的基本概念、Rstudio跨平台集成开发环境及常见的统计图形等。
第2章主要介绍一些数据处理与数据探索的方法,如数据转换和数据重塑等,因为在数据可视化之前需要先对数据进行处理。
第3章主要介绍在不进行更多细节调整的情况下如何快速地进行数据可视化。
第4章主要介绍面积图、密度图、直方图和频率图这几种单变量图形的绘制。这类图形往往只涉及数据集的一个变量。
第5章主要介绍两个同类型变量的图形绘制,包括散点图、抖动点图、连续二维分布图和线图。
第6章主要介绍分类变量和连续变量的图形绘制,包括箱线图、小提琴图、棒棒糖图、条形图、圆形条形图、饼图和甜甜圈图。
第7章主要介绍高维图形的绘制,包括气泡图、三维散点图、流型图、相关矩阵图、树状图、圆形包装图和树形图。
第8章主要介绍其他类型的统计图形绘制,包括和弦图、桑基图、网络图、旭日图、雷达图、词云、平行图、时间序列图、交互式图形及动画图。这些图形并不是很常见,但是非常有用,使用这些高级图形能够让数据可视化的效果更加引人注目。
第9~11章主要介绍图形的细节调整,如添加图形元素、图形的颜色调整、线条类型调整、坐标轴范围调整、删除面板边框和网格线、合并多幅图形等。一幅优秀的统计图形往往需要许多细节上的调整,通过调整细节,可以让图形更具表现力。
第12、13章主要介绍一些扩展内容,包括ggfortify绘图包和Shiny工具包,它们可以实现数据可视化的一些高级功能,如交互式图形绘制和动画图形绘制等。
读者对象
* 数据可视化从业人员;
* 统计学、数学、经济学、计算机和财经等专业的本科生和研究生;
* 互联网从业人员,如产品经理;
* R语言数据可视化初学者与进阶者;
* 对数据可视化感兴趣的人员;
* 相关培训机构的学员。
配套资源
本书的所有实例源代码文件及彩色效果图等相关资源需要读者自行下载。方法是:在华章公司官网www.hzbook.com上搜索到本书,然后单击“资料下载”按钮,即可在本书页面上找到“配书资源”下载链接。
售后支持
本书涉及的内容比较庞杂,R数据可视化技术也是日新月异,加之作者水平和成书时间所限,书中难免有一些疏漏和不当之处,敬请读者指正。阅读过程中若有疑问,请发E-mail至hzbook2017@163.com,以获得帮助。 |
|
米霖 毕业于国内知名的211院校,本科数学专业,研究生统计学专业。有8年以上的R语言项目开发经验,擅长数据挖掘、机器学习和统计模型。曾经在网易云课堂上线了多门R语言的相关课程,包括“Shiny初级教程”“R包开发”“H2O机器学习模型”“信用评分模型开发”“R语言文本挖掘”“金融数据分析”等,学员累计超过5000人。完成了多个数据挖掘项目、信贷中的信用评分项目和电商风控项目等。其中,广告虚假流量识别项目通过对虚假流量数据的挖掘,帮助企业节省了上百万的营销成本。 |
|
|
|
|

|
|
|
|
| | | | |
|
|
 |
|
 |