4.5 本章回顾
本章,我们介绍了使用tidyr包和dplyr包进行数据整形和数据探索性分析。首先是tidyr包,我们使用seperate()和unite()对数据进行拆分与合并;使用gather()和spread()函数进行数据的长宽转变。
然后是dplyr包中的6个核心函数:
filter() 用于进行行筛选,返回满足条件的观测值
arrange() 对观测值进行排序
select() 用于列筛选,但是只保留选择的变量,以及select()和其它函数的配合应用
mutate() 新增变量(对已有变量运算后生成)
summarise() 汇总数据,相当于EXCEL中的数据透视表功能
group_by() 对数据进行分组,以及分组之后的dplyr操作