双11的水下战场:追着飞机换引擎的人( 三 )


因此他几乎天天给聚望“泼冷水” , 想方设法地提出可能出现失败的情况 。 “预案充分吗?新系统的性能承压行不行?为什么一定要在双 11 上 , 不能双 12 吗?”
压力来到聚望带领的巴拿马团队身上 。 这一次 , 巴拿马项目不再打算采用将钉钉集成到淘宝当中的方案 , 而是用钉钉的技术能力和创新能力搭建一套全新的技术系统 IM PaaS 平台 。
对做了多年旺旺消息技术的聚望来讲 , 前一套方案是旺旺的升级版 , 但也仅仅只是升级版 , 要做就做大的 。
聚望说:“我们希望为所有的业务提供一套高可用、高稳定性的消息平台 , 未来业务团队只考虑业务场景的创新 , 而不用担心底层的技术 。 ”
此时的他 , 心中也有一个没有说出来的想法 。 从事 IM 平台技术多年 , 聚望知道单从技术上看 , IM 系统的门槛不高 , 但一个独立团队想做到优秀 , 需要投入的人力、资源和时间 , 不亚于重做一套钉钉 。 如果这套消息平台做到足够成熟 , 未尝不可能有一天从阿里走出去 , 成为业界的的一个通用 IM 平台 。
为阿里打造的消息技术中台 , 钉钉拿出了全部本领 , 在高可用、高稳定、高扩展的基础上 , 钉钉 IM PaaS 平台和存储团队合作开发 , 对存储模型进行优化 , 支持读写扩散、异地容灾、智能流量管理、同步平台升级、消息队列升级、SmartOps 平台等技术创新 。
对消费者而言 , 他们并不知道淘宝、千牛、旺旺甚至淘特底层采用同一套消息平台 。 但不管是登录哪一个应用 , 钉钉的 IM PaaS 平台都可以保障多端消息同步 。 “即便重新安装 , 所有的数据都在 。 ”聚望说 。
2019 年 6 月 , 巴拿马项目各项功能开发完成 , 他们特意举办了一场 showcase 表演 , 南星导演 , 达野摄影 , 聚望策划 , 整个项目组的人在会议室里都显得十分兴奋 。
南星说:“那一天就像是一座大桥的左右两边合龙 , 对钉钉和淘宝而言 , 都是一个重要的里程碑 。 ”
大桥合龙后 , 还要经过无数次测试和真正的通行才能宣告成功 。 2019 年双 11 , 尽管阳凯从 9 月开始就不断的向他们发起挑战 , 但钉钉 IM PaaS 非常坚决 , 他们一定要在这一年承接 5% 的核心交易消息流量 。
这一天终于来了 。 双 11 当天 , 光明顶灯火通明 , 即便是经验最丰富的阳凯也因为 IM PaaS 的上线感到无比紧张 。 消息链路某种程度比支付和交易更需要稳定 , 因为钉钉还担负着故障应急和内部协调的责任 , 承接 5% 的核心交易消息听起来并不多 , 但放在双 11 这一天却会影响上千万人 。
假如双 11 当天 , 消息系统出问题会怎么样?聚望非常严肃地回答:“如果消息出问题 , 最坏的情况下 , 交易会下跌 20% 。 ”
2019 年双 11 的 GMV 是 2684 亿 , 20% 是多大的体量 , 无需赘言 。
因此钉钉 IM PaaS 团队必须谨慎再谨慎 , 他们从 5 万用户规模、100 万用户规模、1000 万用户的规模 , 2000 万用户规模 , 做了多次容灾演练 , 保障即便双 11 真的出现问题 , 也能从容的从新系统切回老系统 。
万事俱备 , 但这一夜并不顺利 。 零点之前 , 按照预案 , 聚望团队为了提高双 11 系统的整体性能 , 撤掉了一些过度占用资源的防御性系统 , 但之后不久 , 意料之外的攻击出现了 , 消息系统遭到了大量运营类垃圾消息的冲击 , “系统很快就要撑不住了 , 我们的神经更是如此 。 ”
聚望立即组织团队现场写脚本进行攻防 , 将违规账号从系统出提出进行限制 。 直到熬过零点后的半小时 , 这激烈的消息系统保卫战才结束 。 战斗结束后 , 虽然作战室内没有人立即说话 , 但所有人都不约而同的松了口气 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。