1.
明确业务需求与关键指标(准备阶段)
- 操作步骤:列出业务场景(站点/应用/数据库/备份/容灾)并分别标注对可用性、延迟、带宽、吞吐、RPO/RTO 的最低要求。
- 输出物:一页“需求矩阵”(Excel)字段:服务类型、可用性%、延迟(ms)、RPO、RTO、维护窗口、支持时区与语言。
2.
设计SLA评估模板(标准化比较)
- 操作步骤:建立SLA对比表,列出:可用性(%/月)、响应时间(P1/P2/P3)、修复时间(MTTR)、维护通知期、赔偿机制(credit/penalty)、测量方法与报告频率。
- 输出物:SLA评分表(每项赋权重,例如可用性40%、支持响应30%、赔偿30%)。
3.
向供应商发出RFP并指定验收测试(流程化)
- 操作步骤:在RFP中嵌入SLA矩阵、要求提供最近12个月可用性报表、支持案例、资质和本地数据中心地址、网络互连点。要求写明“验收测试清单”和“故障演练”条款。
- 输出物:标准RFP文件与附件模板。
4.
实测网络质量:如何从办公室/节点验证延迟与丢包
- 操作步骤(具体命令):从公司关键位置执行:ping <目标IP> -c 100,记录平均延迟与丢包;mtr <目标IP> 或 traceroute <目标IP> 定位跳点;使用 curl 或 wget 下载10MB文件测带宽;分时段(工作时间/非工作时间)各做一次。
- 输出物:网络测试报告(表格:时间、平均RTT、丢包%、最大延迟、跳点瓶颈)。
5.
核查SLA可量化条款与赔偿机制(合同层面)
- 操作步骤:检查合同是否明确“计算方法”(例如:月可用性 = 1 - (总故障时间/当月总时间)),是否指定监测方(双方/第三方),赔偿是credit还是现金,赔偿上限与触发阈值。
- 建议条款示例:可用性低于99.95%则按影响小时给予月度服务费x%的credit,连续三个月违约允许终止合同并退还部分费用。
6.
评估售后支持质量(证据导向)
- 操作步骤:要求供应商提供最近6-12个月的Incident Report、修复时间记录、客户满意度调查;索要本地工程师联系方式、是否有24/7值班、是否提供“远程手/On-site”选件及备件策略。
- 验证点:是否有本地电话号码、是否支持英语/当地语言、是否能提供SLA下的演练录像或报告。
7.
制定验收与演练流程(落地执行)
- 操作步骤:合同里写明“3-5天上线验收期+30天性能观察期”;验收清单包括连通性测试、性能基准、备份恢复测试(从备份恢复一次完整库)、切换试验(如果做双活/热备)。
- 输出物:验收报告模板与问题清单(未达标项必须书面整改计划及时间表)。
8.
建立持续监控与报告(运维对接)
- 操作步骤:要求对方提供API或状态页订阅(RSS/Webhook),或允许接入第三方监控(例如Zabbix/Prometheus/Datadog)。设定报警阈值并与支持响应级别对应(P1即时电话、P2 30min内响应等)。
- 输出物:监控接入清单与报警与升级流程图。
9.
量化评分与决策矩阵(最终比选)
- 操作步骤:把所有候选供应商的SLA条款、售后项、价格、测试结果放入评分表,按预先设定权重计算总分。附上风险项(如数据主权、单点故障)并列出缓解措施。
- 判定准则:最低总分门槛通过,若最高分与次高差距小于5%,优先考虑本地支持与历史记录更好的供应商。
10.
谈判要点与合同添加条款(法律与风险控制)
- 操作步骤:在合同中添加:月度可用性报告权、审计权、事故通报时限、保密与数据保护条款、退网/迁移支持(数据导出格式、时限、费用)。在赔偿条款里明确credit计算公式与支付方式。
- 建议咨询:法律顾问对本地法规(菲律宾个人资料保护法)进行合规审查。
11.
Q1:SLA中“可用性99.9%”具体意味着什么?
11.1
A1:
可用性99.9%通常指月度可用性(约等于每月可允许停机时间约43.2分钟)。实际合同要看计算口径(是否含计划维护),是否用UTC时间以及是否由第三方监控来确认。
12.
Q2:售后支持打分时哪些项最关键?
12.1
A2:
优先级建议:响应时间与修复能力(占比高)、本地工程师与备件支持、本地法律合规与数据主权、历史故障记录与客户口碑。
13.
Q3:采购前必须做哪些“最少”测试?
13.1
A3:
至少做三项:网络连通性(ping/mtr/带宽)、备份恢复一次完整恢复演练、一次模拟故障的升级流程演练(检验供应商响应与事件报告流程)。以上均需书面记录并作为合同附件。