2.2 新一代信息通信技术概述
在 1.2.1 一节我们提到,信息技术有狭义和广义之分,随着技术的不断发展和成熟,传统的计算机存储与处理技术逐渐与通信技术融合,以云计算、物联网、大数据和人工智能等为代表的新一代信息通信技术成为当前ICT行业发展的主要动力。新一代信息技术的发展给传统的电子商务系统硬软件架构带来一系列变化,下面分别介绍云计算、物联网、大数据和人工智能技术的各自内涵、特点与典型应用场景。
2.2.1 云计算技术
按照美国国家标准化研究所(NIST)的界定(Mell and Grance 2011),云计算是一种能够通过网络随时随地以便利的、按需付费的方式获取计算资源(包括网络、服务器、存储、应用和服务等)并提高其可用性的技术,这些计算资源来自一个共享的、可配置的资源池,并能够以最省力和无人干预的方式获取和释放。
云计算技术是分布式计算技术与分布式系统架构进一步发展的产物,它的技术特性可以总结如图 2.7 所示:
上图中可以看到:云计算有2种技术形态,分别是虚拟资源池(一分多)和分布式并行计算(多合一);有3种服务模式(service model),分别是基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS);有4种部署方式(deployment model),分别是私有云、公有云、社区云和混合云;有5种关键特性(key characteristics),分别是按需自服务、宽带网络接入、资源池化、弹性伸缩和业务可度量。
云计算的2种技术形态 如图 2.8 示意:
从上图可以看到,传统的IT企业如IBM、HP等采取的是利用服务器虚拟化技术,将服务器集群在逻辑层面划分为不同的资源池,根据用户对计算资源的需求来动态配置资源池的规模,因此,通常将这样一种技术形态称之为虚拟资源池(一分多)的技术,它比较适用于中小规模(几百到上千台)的服务器集群部署。
大型的互联网企业如谷歌、Facebook等,因其面对的是海量用户的超高并发访问量,因此这些企业建构的服务器集群规模都在数万乃至数十万台服务器数量级别,相应地,文件和数据存储方式、处理方式都需要做较大的改变,而分布式并行计算是这些企业得以生存发展的基础。通常狭义上所说的云计算技术形态即是指分布式并行计算架构。
云计算的3种服务模式(Service model)如图 2.9示意:
(1)基础设施即服务(Infrastructure as a Service,IaaS)
IaaS位于三层服务中的最底层,该层提供虚拟服务器或者虚拟硬件资源(如存储、网络)等。在此服务模式下,用户无需对基础设施进行管理和维护,可直接对其加载和应用。典型的应用案例如亚马逊提供的弹性云服务,国内的阿里云服务等。
(2)平台即服务(Platform as a Service,PaaS)
PaaS提供给终端用户应用服务引擎,包括互联网应用程序接口或者运行平台等,并且支持应用从创建到运行整个生命周期所需的各种软硬件资源和工具。在PaaS层面,服务提供商提供的是经过封装的IT能力,或者说是一些逻辑的资源,比如数据库、文件系统和应用运行环境等。典型应用案例如谷歌所推的APP 引擎开发服务等。
(3)软件即服务(Software as a Service,SaaS)
SaaS是最高层,是最常见的云计算服务,为客户提供各种应用服务软件。其特色是包含一个通过多重租用 (Multitenancy)根据需要作为一项服务提供的完整应用程序。所谓“多重租用”是指单个软件实例运行于提供商的基础设施,并为多个客户机构提供服务。用户通过标准的Web浏览器来使用网络上的软件。服务供应商负责软硬件设施的维护和管理,并以免费(提供商可从网络广告之类的方式中获得收入)或按需租用费方式向最终用户提供服务。典型应用案例如谷歌、百度的搜索服务,国内的360云盘服务等。
云计算的4种部署方式(Deplyment model)简要介绍如下:
(1)私有云(Private cloud)
私有云是指云计算设施在企业内部建设,并为企业内的多部门用户提供服务的一种部署方式,私有云设施可以完全由企业自建、运营和维护,也可以由第三方代建、运营和维护,也可以是以上两种的结合。私有云设施既可以是基于企业已有设施的改造和优化,也可以是全新建设,不过需要指出的是,私有云设施的服务对象是企业自身,通常不对外提供服务。典型的私有云部署案例如中国移动客户服务中心内部部署的客服坐席虚拟桌面服务。
(2)公有云(Public cloud)
公有云是指云计算设施开放给公众用户使用的一种部署方式,公有云设施的建设、运营和维护机构可能是企业、科研和政府机构或组织,也可以是以上三种的结合。公有云服务通常基于公有云服务提供商已有设施而提供。典型的公有云部署案例如阿里云面向创业者或中小企业的虚拟主机和存储租用服务等。
(3)社区云(Community cloud)
社区云是指云计算设施为具有共同利益(共同使命、安全需求、政策与合规性要求)的特定消费者群体提供服务的一种部署方式,社区云设施可以由存在于社群中的一个或多个企业建设、运营和维护,也可以由第三方代建、运营和维护,也可以是以上两种的结合。社区云设施既可以是基于已有设施改造和优化,也可以是全新建设。国内部署社区云的案例如阿里集团面向政府的政府公共服务云,面向不同行业的行业服务云等。
(4)混合云(Hybrid cloud)
混合云是公有云和私有云两种服务部署方式的结合。混合云,是指云计算设施中公有云、私有云和/或者社区云的结合。由于安全和控制原因,并非所有的企业信息都能放置在公有云上,这样大部分已经应用云计算的企业将会使用混合云模式。很多将选择同时使用公有云和私有云,有一些也会同时建立社区云。典型的混合云部署案例如百度的大数据云服务,除了满足百度公司自有的搜索服务外,还可以对外提供大数据分析服务。
云计算的5种关键特性简要介绍如下:
(1)按需自服务(On-demand self-service)
视客户需要,可以从每个服务提供商那里单方面地为客户提供计算能力,譬如服务器使用时长和网络存储,而这些是自动进行无需干涉的。
(2)宽带网络接入(Broad network access)
只要符合标准的设备都可以通过宽带网络接入服务器,这种机制可以使用各种各样的客户端平台(例如,移动电话、笔记本电脑以及PDA等)。
(3)资源池化(Resource pooling)
云服务提供商提供的计算资源被集中起来通过一个多客户共享模型来为多个客户提供服务,并根据客户的需求,动态地分配或再分配不同的物理和虚拟资源。有一个区域独立的观念,就是客户通常不需要控制或者需要知道被提供的资源的确切的位置,但是可能会在更高一层的抽象(例如,国家、州或者数据中心)上指定资源的位置。资源的例子包括存储设备、数据加工、内存、网络带宽和虚拟机等。
(4)弹性伸缩(Rapid elasticity)
“云”的规模可以动态弹性伸缩,在多数情况下,”云”可以迅速形成规模,迅速释放,满足应用和用户规模增长的需要。对于消费者来说计算与存储资源可以无限扩展,随时随地都可以购买到所需要的计算与存储能力。
(5)可度量的服务(Measured service)
云系统通过一种可计量的能力杠杆在某些抽象层上自动地控制并优化资源以达到某种服务类型(例如,存储、处理、带宽以及活动用户帐号)。资源的使用可以被监视和控制,通过向供应商和用户提供这些被使用服务报告以达到透明化。
2.2.2 物联网技术
物联网(The Internet of things, IOT)是通过射频识别(RFID)、红外感应器、全球定位 系统、激光扫描器等信息传感设备,按约定的协议,把任何物品与互联网连接起来,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络,是物物相连的互联网络。
物联网的本质仍然是互联网,可以视作以人与人连接为主要对象的桌面互联网和移动互联网向物与物、物与人连接的延伸和扩展,物联网的终极发展目标是实现万物互联(Internet of Everything, IOE)。
物联网具有全面感知、可靠传递、智能处理的特点。
全面感知:可以利用RFID、传感器、二维码等随时随地获取物体的状态或状态变化信息;
可靠传递:通过数据蜂窝网络或WIFI等网络,将感知的物体信息实时准确地传递出去;
智能处理:利用云计算,人工智能等关联技术,对海量的数据和信息进行分析和处理,对物体实施远程智能化的控制。
典型的物联网系统架构如图 2.10 所示:
2.2.3 大数据技术
信息时代的到来,使得信息的传播速度、处理速度都在以几何级数的方式不断增长。庞大的数据信息已无法用常规的工具进行处理,于是便创造出了“大数据”这个概念,这个概念几乎应用到了所有人类智力与发展的领域中。大数据是指数量大、获取速度快或形态多样的数据,难以用传统关系型数据分析方法进行有效分析,或者需要大规模的水平扩展才能高效处理。 很多文献对大数据进行了诠释,认为其具有4V特性:数据体量大(Volume)、数据类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)。2015年9月,美国国家标准技术研究院(NIST)给出了大数据的内涵界定:大数据由海量的数据集(extended dataset)组成,具有规模性(Volume)、多样性(Variety)、高速性(Velocity)和/或时变性(Variability)特征,需要可扩展架构来有效存储、操作和分析(Allen 2016)。
如果将企业数据从数据类型和数据形态两个维度来切分,企业的海量数据可以归纳成三类:静态海量结构化数据、静态海量非结构化数据、动态海量流(stream)数据。企业所面临的这三种类型海量数据,所要求的存储处理手段不尽相同,对于静态海量结构化数据,除了应用传统的集中式架构外,也开始采用离线批量处理的分布式架构,如Hadoop等;对于静态海量非结构化数据,多采用离线批量处理的分布式架构,如Hadoop、Spark等;对于动态海量流数据,常常采用在线实时处理的分布式架构,如Storm等。
典型的大数据架构如下图所示:
目前,对大数据的研究主要集中在“技术”“资源”和“应用”三个方面:(1)从技术上分析大数据获取、存储、分析、处理、管理和应用等技术手段;(2)从资源上分析国家或企业战略、商业利益、产业发展、产权和法律问题;(3)从应用上分析其在商业、金融、医疗、社交、科研等领域的集约型、智慧型转变和创造新的价值。
值得注意的是,在大数据时代,要从大量杂乱、繁复的数据中,收集、整理和分析“数据足迹”,以支撑对经济社会现象的预测、规划和商业决策,需要转换研究范式,应用新的方法、技术与工具。如 Hey, Tansley, and Tolle (n.d.) 总结发现并指出的,人类科学研究经历了实验、理论和仿真三种范式,目前正在进入“数据密集型科学发现(data-intensive scientific discovery)”的第四研究范式。
2.2.4 人工智能技术
按照美国国家标准技术研究院(NIST)的界定,人工智能(Artificial Intelligence,AI)是指能像人类那样,具有理性思考与行动能力的计算机系统 (Materese 2017)。中国人工智能学会与美国罗兰贝格管理咨询公司联合发布的《2017 中国人工智能系列白皮书-中国人工智能创新应用》认为:人工智能是一门利用计算机模拟人类智能行为科学的统称,它涵盖了训练计算机使其能够完成自主学习、判断、决策等人类行为的范畴(中国人工智能学会 and 罗兰贝格管理咨询公司 2017)。人工智能的概念形成于20世纪50年代,迄今已经历了三次大的浪潮。第一次是50-60年代注重逻辑推理的机器翻译时代;第二次是70-80年代依托知识积累构建模型的专家系统时代;第三次是2006年起开始的重视数据、自主学习的认知智能时代。在数据、算法和计算力条件成熟的条件下,本次浪潮中的人工智能开始面向不同行业应用场景,解决问题,产生经济效益。人工智能的三次发展历程如图 2.12 示意:
资料来源:(中国人工智能学会 and 罗兰贝格管理咨询公司 2017)
回顾人工智能从诞生至今的发展阶段,可以看到:第一个发展阶段具有典型的计算智能特征,主要集中于计算环节,它使得机器能够像人类大脑一样进行计算与存储,诸如神经网络和遗传算法的出现,使得机器能够更高效、快速地处理海量数据。第二个发展阶段是感知智能,它让机器能够听懂人类的语言、看懂世界万物。语音和视觉识别就属于这一范畴,这些技术能够辅助人类高效地完成任务。第三个发展阶段是认知智能,在这一阶段,机器能够主动思考并采取行动(比如无人驾驶汽车),全面辅助甚至替代人类工作。目前,人工智能正处于感知智能阶段,但该阶段从发展到普及还需5-10年。人工智能在经历60余年的发展后,已在智能城市、智能驾驶、智能交通、智能医疗、智能金融、智能制造、智慧教育、自然语言处理等新型应用领域取得了重大进展。
人工智能、机器学习(machine learning)、深度学习(deep learning)是领域研究中经常遇见的三个热词。三者的关系如图 2.13 所示。
资料来源:(中国人工智能学会 and 罗兰贝格管理咨询公司 2017)
简单来说,机器学习是实现人工智能的一种方法,深度学习是实现机器学习的一种技术。机器学习使计算机能够自动解析数据、从中学习,然后对真实世界中的事件做出决策和预测;深度学习是利用一系列“深层次”的神经网络模型来解决更复杂问题的技术。
人工智能从应用范围上可分为专用人工智能(ANI)与通用人工智能(AGI)。专用人工智能,即在某一个特定领域应用的人工智能,比如会下围棋并且也仅仅会下围棋的AlphaGo;通用人工智能是指具备知识技能迁移能力,可以快速学习,充分利用已掌握的技能来解决新问题、达到甚至超过人类智慧的人工智能。专用人工智能与通用人工智能之间的区别如图 2.14 所示:
资料来源:(中国人工智能学会 and 罗兰贝格管理咨询公司 2017)
2.2.5 云、大、物、智(ABCI)技术之间关系
上一节我们对物联网、云计算、大数据和人工智能技术做了初步讲解,可以看到这些技术有以下一些特点:
物联网:将机、物通过传感器按约定协议与互联网连接,实时识别、定位、监控与管理的以物物相连为中心的网络,由感知、传输与应用层构成。
云计算:通过互联网以按需付费方式获取并使用计算资源的方式,具有资源池化,弹性伸缩的特点。
大数据:对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。
人工智能:训练计算机使其能够完成自主学习、判断、决策等人类智能行为,可以进一步分为专用人工智能与通用人工智能。机器学习是实现人工智能的一种方法,深度学习是利用多层神经网络模型实现机器学习的一种技术。
相互关系解析:
物联网、云计算、大数据、人工智能等新一代信息通信技术之间密切关联,目的都是实现数据-信息-知识-智慧的转变,需要将这些技术整合应用,而不能孤立对待;
物联网侧重于机、物状态和状态变化的实时感知与数据传输;云计算侧重于海量数据的存储与处理,大数据侧重于数据到信息和知识的转化与发现;人工智能侧重于对人类思维学习、判断、决策的仿真模拟。
- 信息通信技术的快速发展,以及计算机存储和计算能力的不断提升,在各领域均催生了海量数据。利用大数据采集、预处理、存储及管理、分析及挖掘、展现和应用等技术对海量数据进行分析,开发适用于不同业务情境的应用(如各类APP、可视化系统等),为个人与家庭用户、政企用户提供多样化和场景化的数字化服务,是技术商业价值变现的必然途径。
参考文献
Allen, Thelma A. 2016. “Big Data Information.” NIST. https://www.nist.gov/el/cyber-physical-systems/big-data-pwg.
Hey, Toy, Stewart Tansley, and Kistin Tolle. n.d. “The Fourth Paradigm: Data-Intensive Scientific Discovery,” 287.
Materese, Robin. 2017. “Artificial Intelligence.” NIST. https://www.nist.gov/topics/artificial-intelligence.
Mell, Peter M., and Timothy Grance. 2011. “The NIST Definition of Cloud Computing NIST.” Special Publication (NIST SP) - 800-145, September. https://www.nist.gov/publications/nist-definition-cloud-computing.
中国人工智能学会, and 罗兰贝格管理咨询公司. 2017. “2017 中国人工智能系列白皮书-中国人工智能创新应用.” http://www.caai.cn/index.php?s=/Home/Article/detail/id/433.html.