2015年5月27日星期三

支付宝大面积瘫痪 回应称光纤被挖断 网友质疑其容灾技术


  5月27日下午5点左右,支付宝出现全国范围的系统瘫痪。

  位于广东东莞的淘宝皇冠卖家“小乐家”店铺微博表示,支付宝完全瘫痪,没法收钱。下面许多用户留言表示,淘宝购物付款时无法支付。

  在包括高铁在线等外部网站购物时,支付宝功能也无法正常使用。

  支付宝官方回复表示,“由于杭州市萧山区某地光纤被挖断,造成目前少部分用户无法使用支付宝,运营商蜀黍正在抢修,支付宝攻城狮正在紧急将用户请求引流至其他机房,受影响的用户正在逐步恢复。您的资金安全并不会因此受到任何影响。如果出现交易信息不同步的情况,在修复后会恢复同步。请大家放心。”

  记者在北京打开支付宝钱包app,弹出提示“网络繁忙,请稍后再试”。记者几位位于上海、四川等地的朋友也纷纷尝试,被问到的用户均表示无法使用。从记者身边的情况而言,支付宝故障比其官方描述的“少部分用户无法使用”更严重。

  截止发稿时间,支付宝功能仍未恢复。

  “一般事故的排查复盘没这么快。”支付宝方面对财新记者表示。



异地多活,其实只是吹吹牛而已。实际可行性没那么强。应用服务器还好,涉及到数据存储,基本上出了这种事情没人敢切到异地,因为担心异地数据不一致,只有等网络恢复。

那些分布式容灾架构只是演戏的时候用的

妈的上当了,白看了那么多阿里巴巴异地容灾、跨机房同步的技术文章,全他妈是忽悠人的

听说支付宝挂了?所以我一直说什么异地容灾都是尼玛扯淡,还三天两头演习呢,跟 PLA 一样。

确实,这是最基本的容灾,不应该靠人工干预,系统能自动引流到有效的机房

整天做容灾,一铲子全完,这才叫秒杀

数据一致性,永远的难点。

整天“忽悠”大数据的马帮主,你们数据容灾热备这么基本的可靠性需求都做不好,这让人情何以堪?如果要做大数据基础设施建设,就要有高级别的数据容灾热备方案,紧紧杭州萧山一条光缆就让支付宝挂了?这也太脆弱了!

连支付宝都做不到异地容灾?阿里平时吹嘘的云平台、云技术都哪里去了?

以前在汤森路透工作,号称世界最大金融网络,处理全球实时金融数据,要求不能宕机,那怕自然灾害或战争。他们机房这样建的:两条不同电信公司的光缆和不同电力公司的电缆分别从机房的两个方向进入,同一个机房的所有系统实时双备份,并建设两个不同城市(巴黎、日内瓦)机房同时实时处理相同的数据。

阿里这事挺有趣,不少人讨论异地容灾的困难性,还有拿国内银行举例(不敢切因为不敢确保热备数据一致)个人觉得这个根本不是也不需要涉及异地容灾,而是网络层面的基本工作没做好,链路断了马上切换到备份链路不行么?到重要资源的访问如果单光纤断掉就完蛋应该好好反省一下。网易不刚刚发生类似的事?

支付宝10天前声称“具备异地多活容灾能力”,今天杭州断网,其服务全面崩溃,所谓异地多活容灾纯属吹牛B。你们感受一下。

支付宝在系统架构上应该会有容灾,这次事件奇怪在于为什么机房的一条光缆被挖断就断了,物理层面至少要有两条.

以前某些银行系统出问题无法提供服务时,不少人问为啥不赶紧切灾备?下午支付宝事件后,大家还会问这个问题吗?

一天交易能上百亿的公司,居然连异地容灾都没做,我真心呵呵了。。。马云你这是把所有心思都放到开发安卓的流氓app上去了吧。

说好的异地双活呢?说好的多DC容灾呢?说好的anycast呢?

用于这么大用户群的金融机构,竟然没有热备双路由!没有异地容灾!只能呵呵

传说中的各地备份果然只是备份了数据~~~没有服务容灾。。。

传说中的异地双活运行状态如何? 两年前微信上海机房被同时挖断主备两条光缆,也是影响了“少量用户”,然后开始了多园区与异地容灾各种项目。。

从支付宝事件看出来异地容灾基本是说着玩玩。真有问题,尤其是数据存储问题没几个敢切过去的!

真是一根光纤的原因的话那支付宝也太脆弱了!!高可靠,异地容灾都干嘛了???