4.5 本章回顾

本章,我们介绍了使用tidyr包和dplyr包进行数据整形和数据探索性分析。首先是tidyr包,我们使用seperate()和unite()对数据进行拆分与合并;使用gather()和spread()函数进行数据的长宽转变。

然后是dplyr包中的6个核心函数:

  • filter() 用于进行行筛选,返回满足条件的观测值

  • arrange() 对观测值进行排序

  • select() 用于列筛选,但是只保留选择的变量,以及select()和其它函数的配合应用

  • mutate() 新增变量(对已有变量运算后生成)

  • summarise() 汇总数据,相当于EXCEL中的数据透视表功能

  • group_by() 对数据进行分组,以及分组之后的dplyr操作