第 1 章 R语言概述

大数据时代,无论是研究还是未来的职业生涯,都需要掌握强大、实用的数据采集、预处理、分析、 可视化以及数据报告/数据产品制作能力。传统的数据挖掘和数据分析知识和手段难以适应企业的职位需求;新的方法、软件工具层出不穷,缺乏经验,无从选择;又或者学了一些方法和软件工具,但缺乏实际project应用,能力提升慢。

以R和Python为代表的数据分析软件,是一类典型的开源软件平台(Open source platform)具有模块化封装,社会化协作开发的特点。这种开源软件平台具有5大特点,可以很好的适应社会的需求:

  1. 替代器,正在替代传统的专有软件,如SAS等;

  2. 黏贴器,通过数据获取、重塑,把杂乱的数据有机结合起来,形成对人有意义、能辅助决策的知识,乃至智慧;

  3. 赋能器,通过软件的赋能将原有的逻辑更加有效;

  4. 映射器,将物理世界的实体、实物以数字化形式精确映射,表征物理世界的变化和运行规律,我们得以更精确的度量和操控;

  5. 想象器,可以在数字虚拟体之间激发我们无限的想象力,创造出物理世界不存在的事物。