一份完整的SLA应明确约定:服务范围与定义、可用性指标(如Uptime百分比)、响应与恢复时限、赔偿机制(服务信用或退款)、监控与报告方式、维护窗口和例外条款、以及双方的责任边界。
关于可用性的表述要清楚,是基于月度还是年度统计;计划内维护是否计入停机;以及紧急维护的通知机制和频率限制。
签署前请用书面条款把“术语定义”固化,避免口头或销售材料中的模糊承诺。
常见的SLA承诺有99.9%、99.95%、99.99%等,差异看似小,但年/月累计的允许停机时间差别明显。选择时要根据业务容忍度决定是否需要更高的可用性级别。
赔偿通常以服务费的“服务信用”形式返还,按受影响周期计算。有些SLA设有最高赔偿上限或要求客户先提出索赔并提供证据,且通常排除由第三方或不可抗力导致的故障。
确保SLA中列明索赔流程和证据要求,最好保留自动化监控日志或要求供应商提供第三方监控报告以支持索赔。
优先选择拥有多线BGP接入、与主要骨干网络与云供应商有直连或旁路互联的提供商,这能减少链路延迟和单点故障风险。
关注数据中心的Tier等级、电源与制冷冗余(N+1、2N等)、多可用区部署能力以及异地备份策略。高可用架构应包含链路、设备与机房三级冗余。
索要网络图与故障演练记录,并核实是否有DDoS防护、流量清洗和故障切换演练证明。
SLA应明确支持等级(P0/P1/P2等)、对应的首次响应时间和目标恢复时间(RTO)。注意区分“响应”与“修复完成”的含义,很多条款把两者混用会导致歧义。
查看是否有明确的升级路径、专属工程师(SPOC)和现场响应承诺(如4小时内到场)。远程支持与现场支持的责任与费用也应事先约定。
要求SLA列出沟通渠道、联系人层级和Escalation流程,并在合同中规定超时处罚或服务信用。
合同正文与SLA附件间应明确优先级(通常合同优先但建议SLA为合同附件且同等法律效力)。在签署前进行一致性审校,避免出现相互矛盾的责任或免责条款。
重点谈判赔偿上限、不可抗力定义、数据主权与隐私责任、以及争议解决机制(仲裁或法院及适用法律)。美国服务器托管常涉及跨州或国际法律问题,需提前确认管辖权。
建议在合同中加入可审计条款和定期SLA评估机制,并在重大违约时保留解除合同或索赔的明确权利。