1.
验收前准备与对接要点
① 明确交付清单:机柜编号、机位号、PDU端口、IP地址段、BGP/AS号、带宽承诺与SLA条款。
② 通信与权限:确认机房联系人、远程控制权限(IPMI/iKVM)、应急联系电话与工单流程。
③ 文档与凭证:上传合同、网络拓扑图、资产清单(机型、序列号、MAC地址)到对接平台。
④ 测试工具准备:携带笔记本、网线、光模块(SFP+/SFP28)、iperf3、fio、mtr、ping、ssh密钥等。
⑤ 安全与合规:现场人员通行证、静电腕带、保密协议、隐私数据隔离方案准备。
⑥ 例行沟通:与客服/工程师确认验收时间窗、是否允许短时流量注入或攻击模拟。
2.
物理与环境检查(机柜与电力)
① 机柜与标签:核对机位号、机柜门锁、机柜接地线是否可靠,机架负载是否符合规格。
② 电源冗余:检查PDU编号、A/B路供电是否接入不同UPS与柴油发电链路,确认同相位分配。
③ UPS与运行时间:在预计负载下,查验UPS剩余放电时间(例如:实际负载600W时UPS预期运行时间≥30分钟)。
④ 温湿度与散热:检查冷通道温度(建议机架前温度 24±4°C),风扇噪音、出风与回风路径。
⑤ 线缆管理:网线/光纤编号、长度、弯曲半径,检查标签与色标是否与文档一致。
⑥ 现场工具检查:PDU遥测数据、环境监测探头工作正常(温湿度报警、门禁联动)。
3.
网络连接与带宽验证
① 物理链路测试:验证光模块类型(10G/25G/40G/100G)、SFP兼容性,查看链路灯与误码统计(ifconfig/ethtool)。
② IP与路由验证:确认公网IP、网关、子网掩码、BGP邻居和AS号已就绪并可达。
③ 延迟与丢包:使用mtr与ping到主要节点(如上海、广州、台北)记录平均时延与丢包率(目标丢包率≤0.1%)。
④ 吞吐量测试:用iperf3做单向与双向测试,样例结果:10GbE链路实测9.28 Gbps。
⑤ MTU与Jumbo帧:如需高吞吐确认MTU=9000可用,测试大包传输稳定性。
⑥ QoS与SLA核对:核对带宽保底与突发策略,记录排队机制与丢包阈值。
4.
存储与IO性能验证
① 硬件配置核对:确认型号、CPU、内存、磁盘类型与RAID拓扑(示例见下表)。
② SMART与硬盘状态:检查nvme/smartctl输出,确认无重映射(Reallocated_Sector_Ct为0)。
③ 连续IO性能:使用fio做seq read/write测试,如单NVMe顺序读约3200 MB/s,双NVMe RAID1实测读约3100 MB/s,写约1500 MB/s。
④ 随机IO与延迟:fio随机4K测试,目标读延迟<1ms,IOPS满足应用需求(例如数据库目标≥120k IOPS)。
⑤ RAID与热拔插验证:查看RAID重建时间估算、热插拔是否触发报警、备盘状态。
⑥ 文件系统与挂载:确认ext4/xfs/ceph配置、挂载选项(noatime、discard等)与LVM策略。
5.
域名、DNS 与 CDN 配置测试
① 域名解析验证:检查A/AAAA/NS/MX记录,使用dig/host确认权威DNS返回正确IP并且TTL符合预期。
② DNS生效与容错:模拟某个DNS节点失效,确认多NS的切换与解析稳定性。
③ CDN接入测试:验证CDN回源、缓存命中率、证书同步、HTTP/2与TLS1.3支持。
④ 缓存刷新与回源压测:在低峰窗口做缓存清空并监测回源压力,确保回源带宽不被耗尽。
⑤ 页面加载与全球节点延迟:使用WebPageTest或自建节点测量香港节点到中国各地的TTFB与首包时延。
⑥ HTTPS与证书链:检查证书颁发机构、OCSP、证书自动续签脚本是否生效。
6.
DDoS 防御与安全测试
① 防护容量与策略:确认机房提供商的清洗带宽(如可提供最高100 Gbps清洗服务),与突发黑洞阈值。
② 黑洞与流量策略:明确触发黑洞或流量重定向的阈值(例如触发点为净流量达到500 Mbps并持续5分钟)。
③ 模拟流量测试:在合规与机房允许下,用流量发生器做低强度模拟(SYN/UDP)测试,确认清洗生效且误杀率低。
④ 应急联动流程:确认CS/网络工程介入时延(目标<15分钟)、联系人、通知渠道与故障单格式。
⑤ 日志和溯源:检查防火墙/清洗设备日志是否可导出,并与WAF/IDS联动做攻击溯源。
⑥ 安全补丁与基线:确认操作系统与关键中间件补丁级别,启用登录审计与root帐号保护。
7.
真实案例与服务器配置示例
① 真实案例:XYZ科技在香港机房托管2台独服,用于面向大中华区的API服务,运维当天完成全部验收并通过。
② 配置示例:该项目使用配置如下表所示(以供参考):
| 项目 | 配置/数值 |
| 机型 | Dell R640 |
| CPU | 2x Intel Xeon Silver 4214 (12C/24T each) |
| 内存 | 128 GB DDR4 ECC |
| 磁盘 | 2x 1.92TB NVMe (RAID1),顺读约3100 MB/s |
| 网络 | 2x10GbE bond,公网 /29 (5 可用IP),实测iperf3 9.28 Gbps |
| 带宽与SLA | 承诺500 Mbps 保底,突发可至10 Gbps,SLA 99.95% |
③ 测试结果:对外到上海平均延迟28 ms,丢包0%,磁盘fio随机4K读IOPS 85k,CPU基准负载符合预期。
④ 验收结论:物理、网络、IO、DNS与安全测试均满足SLA,记录并归档全部测试日志与截图。
⑤ 后续建议:启用监控告警(Prometheus/Grafana)、定期做演练(防D演练与故障恢复),并与机房签订长期SLA复核。
⑥ 交付文档:将所有测试数据、拓扑图、远程访问凭证、安全策略与运维SOP一并移交并在运维平台备案。
来源:对接运维团队实施香港机房服务器托管现场验收与测试要点