我是那个手里拿着锤子找钉子的人,但有时候我也只是个拿着锤子的人。IT 服务管理就像是在一个还没装修好的毛坯房里,让一家装修公司去设计图纸、打地基、砌墙,然后验收交付。
这活儿干得不好,客户要投诉;干得好,客户就宁静了。 那会儿我也认定,认证就是买一张证书,花了点钱,有个章盖了,事儿就算结了。
后来才慢慢明白,那玩意儿就像给车上锁,锁上不代表车不会坏,只是说明厂家承诺这车在短期内大约率不会坏。一旦车子进厂修了,修好了就没事;修不好的话,那就要看厂家如何解释了。真正的检验,是在客户那边。 看目前的 IT 行业,大家最关心的事不是“有没有认证”,而是“出事如何办”。去年那个陈年旧事,又翻出来了。客户 Y 公司的网络突然瘫痪,影响他们整个业务线。客户第一反应是找认证机构,认证方立马派专家去现场,查系统日志,测网络连通性,半天后给回了个报告。
这报告写得挺专业,各种 IP 地址、端口号、延迟工夫都有,仿佛他们确实把故障修复了。可客户拿着报告去跟媒体要说法,说那啥。 这事儿闹大了。
那天我蹲在那儿,看着客户烧脑的样子,突然认定这报告有点假。
实际上根本没啥系统故障,只是客户那个老旧的换机固件忒老,硬件老化。但认证机构为了应付那个检查员,硬说是网络难题,非得在那张 PPT 上写满“网络中断”四个大字。我后来跟那个认证的原班人马联系了,聊了个火,告诉他们数据造假不中。
要是数据都是编的,那他们拿啥证明他们修好了?
如何让他们赔钱?
如何让客户闭嘴? 这就让人想起另一个例子,某银行在数据中心做运维。他们搞了一套所谓的“高可用架构”,理论上理论上应当随时切换,万一台服务器挂了自动换另一个。结局就是,换忒快了,客户那边都当作系统崩溃了,实际上系统明明在运行。客户在那喊:“如何又挂了!你们到底有没有用!” 这时候认证机构就不干了。他们早就把那个架构摸清了,知道那是演戏。但也不敢轻易拆穿,怕丢了脸面。便他们只能在报告里夹带私货,写上一大堆代码逻辑,说是“架构支撑稳定”,但实际运行数据全是假的。
这类事件目前不少见,毕竟哪位不想拿个证书去融资、去投标、去蹭别人的光?一旦出事,这玩意儿就是一张废纸。 故此,实际上 IT 服务管理体系认证,早就不是那个单纯的“买证”生意了。目前真正吃香的是那些愿意把客户当成自己老婆一样疼的机构。他们不光要出报告,还得出来做事。
比如有个做保险认证的机构,他们接到费事客户,不修系统,就直接去改网络拓扑,就连直接找来替代设备替换掉坏的服务器,只换不换。客户拿着新设备直接甩给他们,说:“喏,这不就是修好的吗?” 这操作听着有点土,但在行家里数是最高效率。
不过说实话,这种“修好再交”的模式,有时候会让客户有点气,毕竟心里嘀咕:“我花钱买的不就是张纸吗?”这时候,要是机构能加个服务,比如定期上门巡检,要么在那个大客户群里发个公告说“本周例行维护,系统运行正常,有变动我们另行通知”,那效果绝对不一样。客户会认定:“哎呀,反正都修好了,还多这一套流程?反正没事,就是多花点工夫占个地方,图个安稳。” 流量那么大,真正能活下来的公司,肯定都看透了这行规矩。他们不再死磕那个“完美的架构图”,而是看重“真的交付结局”。
要是你连自己手里的人都能忽悠,那忽悠客户就好办起反了。客户要的是保险感,不是听那些花里胡哨的技术名词。 再说回那些报告。
那会儿写报告就像填表格,哪有啥标准答案,填个数字完事。目前不一样了,报告得跟客户对话。
要是客户说:“我揪心还没装完软件我就崩了”,那报告里就得补充:“我们会监控软件安装后的状态,确保安装搞定后立即恢复。”要是客户说:“我揪心数据丢了”,那就有得写了:“我们会做灾备演练,确保数据起码保存三天,并且有实时备份机制。” 这种“对话式”的报告,听起来洋气,听着也实在。它不再是冷冰冰的文档,而是带着温度、带着承诺的纸条。客户拿到手,不是认定“嘿,有个认证”,而是认定“嘿,这家公司在乎我,这事儿他们心里有数”。 我也见过一些机构为了应付检查,搞啥“红队演练”。叫红队,就是拉来一群外行,找茬。他们故意制造点假故障,然后让大伙儿瞎折腾,看哪位能把服务器弄断。最终报告总结:“经红队测试,系统韧性极强,未出现任何中断。” 实际上红队演练也得讲究个“假”。
要是真真地把集群弄崩了,那后面的测试也就没意义了。
这就像开车,你前面一个没刹住的刹车,后面的人再踩一脚刹车,能救回来吗?救不回来的话,那刹车还练得有多有效? 我见过一家做云服务的,为了响应客户“零停机”的要求,他们搞起了“影子集群”。两套系统,一套确实给用户看,另一套在后台与此同时跑,两套数据彻底隔离。客户点一下按钮,系统就自动切换到后台那个,前台用户感觉不到任何变化。
这招挺狠,但也挺有效。 不过,这也不能全怪认证机构。
归根结底,还是客户自己忒贪心。他们想要的是“一辈子不动”,但技术本身讲究的是“动态平衡”。
要是你非要追求零停机,那成本就挺高,并且好办造出那种“假健康”的假象。 目前市面上,做认证的公司多,但能真正干活的少。大局部机构还是在那儿盯着客户那几张 PPT,纠结于那些毫无意义的、出于认证标准不同而看起来有点“花哨”的报告内容。真正的价值,在于他们能不能在客户最焦虑的时候,第一工夫出现,说一句:“我在,系统还没崩,您别慌。” 这话说起来笨,但管用。客户需求的不是“认证证书”,而是一个“靠谱的伙伴”。
要是你不能像伙伴一样,把服务器修好、把数据存好、把业务接好,那拿个证又有啥用? 故此,下次你要是再去看那些复杂的认证体系,别被那些架构图绕晕了。想想那个银行、想想那个砸锅卖铁修系统的案例,想想那些为了“零停机”而造假的折腾。
记住,证书是个证,信任才是底。能赢得客户信任的体系,才是那个真正站在客户这边、愿意为结局买单的体系。 自然,也别光盯着那几张纸。有些机构为了显得专业,非得搞个“质量手册”,里面全是“PDCA"、"ISO 20000"这些单词,看着挺高级。但客户一听:“这玩意儿跟我有啥关系?我连手册都不想翻。” 这种时候,实际上没必要。直接把书扔了,换个故事讲:“你看,我上周帮客户修好了网络,目前业务正常了。旁边那套玩意儿,别看看起来挺专业,但我没用过,也不懂。”这话听着糙,但有时候比那些空洞的理论更打动人。 说到底,IT 服务管理认证这事儿,不是给机构贴个标签,而是给体系加个保险。客户买保险,是为了在出事的时候有个说法。你不能光给机构盖个章,让客户认定“哦,有个机构认证了”。你得让客户认定“这家公司了得,这事儿你们给修好了,你们负责到底”。 要是一家机构,既能出漂亮报告,又能修好系统;既能应付检查,又能真正帮客户把业务接上,那才是确实“认证机构”。剩下的那些,不过是给体系加个壳子,就连为了加壳子,还得把壳子做得比本体还复杂。 故此,下次看到那些报告里的表格、那些架构图、那些所谓的“最佳实践”,心里得打个小问号。问自己:这套系统确实修好了吗?数据确实真吗?还是说,这只是他们拿来做 PPT 素材的“装饰品”? 实际上,那个背书包的孩子,那个拿着锤子的人,都懂。他们不讲究那些复杂的理论,他们只在乎孩子是不是吃饱了,是不是安安稳稳地走回了家。 那才是认证该有的样子。
不是给体系加个壳,而是给体系加个心。 你懂的,这是行规。