服务水平协议(Service Level Agreement,SLA)是在一定开销(通常这个开销是驱动提供服务质量的主要因素)下,为了保障服务的性能和可靠性,服务提供商与用户间或者服务提供商之间定义的一种双方认可的协定。
简介
服务水平协议(SLA)是在一定开销(通常这个开销是驱动提供服务质量的主要因素)下,为了保障服务的性能和可靠性,服务提供商与用户间或者服务提供商之间定义的一种双方认可的协定。它规定了服务等级和服务所必须满足的性能等级(包括服务水平测量、服务水平报告和信誉及费用3方面),并使服务提供商有责任完成这些预定的服务等级。一个完整的SLA同时是一个合法的文档,包括所涉及的当事人、协定条款所包含的应用程序和支持的服务、违约的处罚、费用和仲裁机构、政策、修改条款、报告形式和双方的义务等。同样,服务提供商也可对用户在工作负荷和资源使用方面进行规定。
SLA过去主要被服务提供商用于对网络质量的保障,用来描述网络状态的典型矩阵参数,一般包括网络的可用性、丢包率和传输延时。随着电子商务的发展,SLA的功能逐步扩展至应用服务的解决方案领域,并以一种可查阅的形式提供给用户。服务提供商需要在以往工作的基础上,为用户提供端到端的SLA。
实际上,SLA的保障是以一系列服务水平目标(SLO,Service Level Object)的形式定义的。服务水平目标是一个或多个有限定服务组件的测量组合。一个SLO被实现是指那些有限定组件的测量值在限定范围内。在SLO操作时段范围内,SLO必须被实现。但是由于Internet的统计特性,我们不可能总是实现这些保障,所以SLA一般都有实现时间段和实现比例。实现比例被定义为SLA必须实现的时间与实现时段的比值。例如,在工作负荷<100transaction/sec的前提下,上午8点到下午5点服务响应时间<85ms,服务有效率>95%,在一个月内的总体实现比例>97%。
目前学术界对SLA通用的定义为:SLA是协议双方(服务提供商和客户)签订的一个合约或协议,这个合约规范了双方的商务关系、权利和义务。通常来说,SLA是在一定开销下为保障服务的性能和可靠性,服务提供商与客户之间定义的一种双方认可的协定,一个完整的SLA同时也是一个合法的文档,包括了所涉及的当事人、协定条款、违约的处罚、费用和仲裁机构、政策、修改条款、报告形式和双方的义务等,其根本目的是让合作双方在合同执行之前达成一个清晰的共同愿景,同时建立一定的机制限制各方的违规行为,鼓励双方努力达到或超过事先约定的目标。
SLA发展
SLA最早出现在1998年帧中继论坛推出其服务水平定义实施协议(即FRF13)中,该文件为
帧中继业务的几个关键特性定义了可接受的参数,如帧传输延时、帧传送率、数据传送率和业务可用性(或者为正常运转时间)。FRF13除了向帧中继用户描述具体的性能和可获得的参数外,还有一个更加重要的目的,即它使帧中继提供商自信能够满足自己制定的标准,从而向其客户保证有能力提供可信赖的服务。各种各样业务提供商紧随其后,SLA产业开始萌芽。
租用线路和帧中继连接早已经有了SLA,VPN等其它业务也迅速跨入SLA的行列。
AT&T、MCI WorldCom和Sprint这三大运营商是提供SLA的先行者。AT&T目前对帧中继和ATM业务提供99.99%可用性保证,对IP业务提供99.9%的保证。MCI WorldCom对
帧中继业务提供99.99%的可用性,ATM业务为99.9%,对于IP业务的可用性承诺为100%。Sprint对运行在其
SONET骨干网上的帧中继、ATM和IP业务的可用性承诺为100%。
对于专线连接,Concentric Network提供100%可用性的保证(包括骨干网络和本地环路),它还保证平均往返路程时延为80ms,每月的平均丢包率不超过1%。
随着提供因特网连接的公司如雨后春笋般涌现,SLA变得更加复杂。尽管一些提供商有服务保证,但是因特网本身相对来说的不可预测性为这些试图提供特定的性能水平的尝试者们带来了前所未有的挑战。相信随着这一市场的成熟,许多问题将会得到解决,提供商们也会致力于解决这些问题。
AT&T可为因特网连接服务提供保障。例如,AT&T为其AT&T WorldNet企业拨号业务提供99.9%的可用性保证,这包括AT&T管理的任何客户端设备以及从客户端设备到AT&T的POP点的连接。如果AT&T无法达到这一要求,客户根据该服务的一个月的连接费用可以获得一天的赔偿费。
总之,企业依靠SLA来获得特定的功能水平、网络带宽和正常运行时间的保证。来源于IDC公司的数据表明,在调查接受问询的大公司(拥有超过2500名雇员的公司)中约97%在未来的12个月中需要有网络的SLA,SLA是在以商务为核心的计算机环境中确保稳固的QoS、性能和正常运转时间的关键因素。IDC还预测市场对可管理和托管业务SLA的需求将从1999年的2.78亿美元增加到2004年的8.49亿美元。
SLA特点
在具体的SLA条款中,服务提供商和客户是构成SLA的基本角色,其中客户是指基于合同关系接受服务的各种实体,包括涉及使用服务提供商提供服务的公司或组织和个人。在
IT外包服务中,客户是服务的最终购买者,而用户是客户组织中的个体,并不一定是购买服务的主体。服务提供商原意特指提供电信服务的公司或组织,随着IT外包的发展,SLA中的服务提供商不仅仅局限于电信服务商,也适用于IT外包中各类的IT服务商,包括互联网服务商、网络服务商、主机托管服务商、电脑维护商、系统集成商等,还可以是企业内部的IT部门。在整个IT服务提供的价值链中,一个SLA中的客户可能是另一个SLA中的服务提供商,同样的一个SLA中的服务提供商可能是另一个SLA中的客户,其具有传递关系。
SLA生命周期
SLA相对应的产品服务的生命周期包括五个阶段:
客户和服务提供商的整个合作过程贯穿SLA整个生命周期,在不同的阶段需要应用到不同的SLA参数和管理方法,SLA整个管理和执行是一个反复提高的过程,SLA的运用积极地推动了IT外包的发展进程。下一章本文将对SLA的发展历史和现状进行总结和归纳。
SLA优点
对于服务提供商SLA能够提供很多益处,它们包括:
对于用户,SLA同样提供很多益处:
SLA发展趋势
描述不详尽甚至有漏洞的SLA在网络出问题时能够保护服务提供商免受处罚,但会损害用户利益,让用户觉得受到欺骗,甚至会失去好不容易争取到的用户。以详细条款给出的SLA不但能够更好地满足用户的期望,还被认为是对用户利益负责,从而使服务提供商更具有竞争优势。
在与用户制订SLA的交流过程中,服务提供商将能更好地理解用户的要求,就服务水平达到共识,还能帮助服务提供商提供等级服务,并根据服务类别收取相应的费用。有了这些详细的信息,用户也就可以根据服务提供商实际能提供的服务和自己的预算来调整对SLA的期望。
目前,服务提供商可能还未认识到服务报告矩阵的重要性。在现有的基本SLA中,矩阵信息包括网络的可用性、网络时延及网络故障的修复时间等。这些规范在将来定义基本SLA时将被继续沿用。另外,由于网络的连接对商业终端用户越来越重要,SLA矩阵也将会根据这些用户需求进行适当修改或变动。正确的SLA管理平台使服务提供商能利用SLA矩阵的这些新特性更好地为用户服务。一个成功的服务提供商应该能开发和提供更好地反映每个用户使用连接情况的可测量矩阵。
网络开始渗入到用户商业活动的方方面面,网络的崩溃给用户所带来的损失是无法估量的,用户当然希望网络的可用性和稳定性得到保证。正是用户的这种需求促进了服务规范SLA的发展。SLA矩阵特性从原来的简单地对数据包进行计数和时延的测量开始,慢慢向与商业活动相关的SLA转变。服务提供商要对商业用户相关的SLA矩阵进行严密测量,这就需要更先进的SLA平台。提高服务提供商所提供的SLA是一个逐步过程,这个过程将为服务提供商提供一个更好地满足用户需要的机会。
大多数现有的服务水平协议合同对所有的用户都采用同一矩阵,这对特定用户来说,会出现在某一方面提供的信息太多,而在另一方面又不够的情况。因此,未来的SLA必须针对不同的用户群,让每个用户都能获得足够的有用信息。当然,对于服务提供商来说,这是有一定难度的,他们必须在理解这个难度的基础上,不断努力,从而提出让用户满意的SLA。随着SLA的提高和OSS的出现,服务提供商能够在每个SLA层中加入更详细的SLA管理特征,使不同的SLA对用户来说变得更有价值,值得他们付出额外的费用。
对于保证一定服务水平的服务提供商,用户将会要求他们证明自己提供的服务确实达到了所定的标准。因此,在未来的SLA中,服务提供商除了为用户提供一个单纯的策略机制外,还应使用户及时了解整个网络的性能状况。这些额外的信息不但能帮助用户定位故障,迅速找出问题的原因,从而更快地解决问题,而且还有助于用户了解他们是否申请到正确的服务。
现有的SLA条款对于服务质量不能满足预定目标的情况也做出相应的规定。例如,用户有权终止协议而不受任何经济处罚、用户有权向服务提供商索取经济补偿等,用户期望能在广域网上获得与在局域网上相同的管理水平,那些既不能满足协商好的SLA,又不能提供经济赔偿的服务提供商,是无法赢得用户的。但是,随着商业活动对网络服务依赖性的增强,用户越来越关心服务质量下降对商业活动本身造成的影响,不再仅仅满足于服务提供商为此而提供的经济赔偿,他们希望在服务崩溃时能有其它补救方法,挽救对商业活动造成的冲击。
未来的SLA提出了一个真正根据服务质量付款的概念,要求服务提供商必须满足一定的服务水平目标。如果服务提供商提供的服务质量达到预定的基本目标,用户则支付常规费用;如果服务提供商提供的服务质量达到SLA规定的较高目标,用户则为此支付一些额外开支。为了得到额外的利润,服务提供商就必须想法提高所提供服务的质量。这就需要一个可扩展性好、灵活可靠的SLA管理平台,以方便对后台系统信息进行处理。