凌晨1:30分,經(jīng)攜程技術排查確認此次事件是由于員工錯誤操作導致。
對于恢復時間較長,攜程回應稱,因涉及的業(yè)務、應用及服務繁多,驗證應用與服務之間的功能是否正常運行,花了較長時間。攜程官方網(wǎng)站及APP已于28日23:29全面恢復正常。
以下為攜程對相關問題的說明:
1、事件發(fā)生原因
經(jīng)攜程技術排查,確認此次事件是由于員工錯誤操作,刪除了生產(chǎn)服務器上的執(zhí)行代碼導致。
2、為什么恢復時間那么長
一般來說,類似攜程這樣的大型網(wǎng)站承載著繁多業(yè)務,其后臺是一個由SOA(面向服務)架構組成的龐大服務器集群,看似簡單的一個頁面背后由上千個應用子系統(tǒng)以及上千個Web Service組成,而每個應用子系統(tǒng)和每個Web Service之間都存在著相互調(diào)用的依賴關系。
發(fā)生事件后,攜程的技術人員除了需要恢復生產(chǎn)服務器上的執(zhí)行代碼以外,還需要做的是恢復并確保每個應用子系統(tǒng)以及每個Web Service的功能正常,同時確保應用子系統(tǒng)與Web Service間的調(diào)用關系得以正常執(zhí)行。
這種驗證性的操作需要攜程的工程師及運維人員通力合作,盡快恢復生產(chǎn)代碼并通過反復地、持續(xù)性地調(diào)試以確保應用子系統(tǒng)與Web Service功能的正常運行。
攜程再次保證,數(shù)據(jù)和數(shù)據(jù)庫并未受到此次事件的影響,用戶訂單數(shù)據(jù)也完整無損,請用戶放心并繼續(xù)使用攜程網(wǎng)站及App。
3、如何杜絕此類事件的再次發(fā)生?
攜程在系統(tǒng)上做了改進,規(guī)范并杜絕技術人員錯誤刪除生產(chǎn)服務器上代碼的操作。