鸽鸽经验网

 找回密码
 立即注册
搜索
热搜: 经验 技巧 心得
开启左侧

携程解释瘫痪原因:员工错误操作 删除服务器执

[复制链接]
msmkmm2012VIP会员 发表于 2019-7-13 09:42 | 显示全部楼层 |阅读模式

携程解释瘫痪原因员工错误操作 删除服务器执行代码  按应用层次划分通常也称为“按服务器档次划分”或 “按网络规模”分,是服务器最为普遍的一种划分方法,它主要根据服务器在网络中应用的层次(或服务器的档次来)来划分的。据双线服务器租用介绍要注意的是这里所指的服务器档次并不是按服务器CPU主频高低来划分,而是依据整个服务器的综合性能,特别是所采用的一些服务器专用技术来衡量的。按这种划分方法,服务器可分为:入门级服务器、工作组级服务器、部门级服务器、企业级服务器。

        携程在声明中说,携程后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个W S组成,而每个应用子系统和每个W S之间都存在着相互调用的依赖关系。发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个W S的功能正常,同时确保应用子系统与W S间的调用关系得以正常执行。因此才花费了十二个多小时才恢复正常。

       

        携程称,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损。

        对于该员工后续如何处理,携程方面暂未表态。

        以下为携程的简要原因说明

        1事件发生原因

        经携程技术排查,确认此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。

        2为什么恢复时间那么长

        一般来说,类似携程这样的大型网站承载着繁多业务,其后台是一个由SOA(面向服务)架构组成的庞大服务器集群,看似简单的一个页面背后由上千个应用子系统以及上千个W S组成,而每个应用子系统和每个W S之间都存在着相互调用的依赖关系。

        发生事件后,携程的技术人员除了需要恢复生产服务器上的执行代码以外,还需要做的是恢复并确保每个应用子系统以及每个W S的功能正常,同时确保应用子系统与W S间的调用关系得以正常执行。

        这种验证性的操作需要携程的工程师及运维人员通力合作,尽快恢复生产代码并通过反复地持续性地调试以确保应用子系统与W S功能的正常运行。

        携程再次保证,数据和数据库并未受到此次事件的影响,用户订单数据也完整无损,请用户放心并继续使用携程网站及A。

        3如何杜绝此类事件的再次发生?

        携程在系统上做了改进,规范并杜绝技术人员错误删除生产服务器上代码的操作。

        小编很想知道这位员工后来怎么样了在此提醒各位运维工程师操作服务器时一定要小心谨慎。
回复

使用道具 举报

免责声明|联系我们|鸽鸽经验网 ( 豫ICP备17031277号 )

GMT+8, 2019-7-24 16:50

Powered by Discuz! 7.0

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表