一年一度的剁手節(jié)日如期而至……每逢雙十一想必那些電商網(wǎng)站服務(wù)器的壓力都很大
當然·...運維工程師們的壓力更大,各種突發(fā)故障都可能讓業(yè)務(wù)成交失敗,而查找系統(tǒng)運行的日志又特別費時費力。挖故障如同大海撈針,這不僅讓運維人員急得團團轉(zhuǎn),客戶體驗也將大大降低,比如這樣:
更有這樣:(⊙o⊙)…
今天的內(nèi)容主要集中在秒殺及搶購背后的 IT 架構(gòu)及實現(xiàn)
電商秒殺活動的業(yè)務(wù)特點
1、活動波峰波谷狀態(tài)明顯
電商通過秒殺活動為其經(jīng)營產(chǎn)品造勢,秒殺活動一般時間較為固定,活動通常需要經(jīng)歷產(chǎn)品發(fā)布、秒殺倒計時、到點秒殺、優(yōu)惠券抵扣、用戶付款等一系列流程,在秒殺點前后服務(wù)器負載成峰值狀態(tài),服務(wù)器負載隨著活動退卻而減少。
2、秒殺通常涉及不止一個業(yè)務(wù)
電商秒殺活動,用戶在等待秒殺的過程中也為電商網(wǎng)站帶來了流量,尤其是今年,雙十一前半個月就已經(jīng)開始了各種秒殺環(huán)節(jié),秒殺活動進行過程中,用戶領(lǐng)取優(yōu)惠券、身份認證、支付業(yè)務(wù)也會同時發(fā)生。
3、時間短、瞬時并發(fā)量高
秒殺活動是一個特別考驗后臺數(shù)據(jù)庫、緩存服務(wù)的業(yè)務(wù),對于數(shù)據(jù)庫、緩存的性能要求特別嚴格。一旦后臺數(shù)據(jù)服務(wù)沒有跟上,秒殺活動將成為空談。
秒殺背后的技術(shù)挑戰(zhàn)
1、突增的服務(wù)器及網(wǎng)絡(luò)需求
雙 11 這個萬眾狂歡的節(jié)日,對于電商員工來說,每個環(huán)節(jié)都面臨前所未有的考驗。 對 IT 運維部門來講,需要備足充分的服務(wù)器和網(wǎng)絡(luò)帶寬資源來應(yīng)付這一挑戰(zhàn)。通常情況下,雙 11 的服務(wù)器使用是平時的 3-5 倍,網(wǎng)絡(luò)帶寬是平時 2-4 倍,如何在短時間應(yīng)付這些問題,如何讓 IT 投資利用最大化,是擺在電商 IT 們面前一大難題。
2、業(yè)務(wù)高并發(fā),服務(wù)負載重
我們通常衡量一個 Web 系統(tǒng)的吞吐率的指標是 QPS(Query Per Second,每秒處理請求數(shù)),解決每秒數(shù)萬次的高并發(fā)場景,這個指標非常關(guān)鍵。
假設(shè)處理一個業(yè)務(wù)請求平均響應(yīng)時間為 100 ms,同時,系統(tǒng)內(nèi)有 20 臺 Web 服務(wù)器,配置最大連接數(shù)為 500 個,Web 系統(tǒng)的理論峰值 QPS 為(理想化的計算方式):100000 (10萬QPS)意味著 1 秒鐘可以處理完 10 萬的請求,而“秒殺”的那 5w/s 的秒殺似乎是“紙老虎”。
實際情況,在高并發(fā)的實際場景下,服務(wù)器處于高負載的狀態(tài),網(wǎng)絡(luò)帶寬被擠滿,在這個時候平均響應(yīng)時間會被大大增加。隨著用戶數(shù)量的增加,數(shù)據(jù)庫連接進程增加,需要處理的上下文切換也越多,服務(wù)器造成負載壓力越來越重。
3、業(yè)務(wù)耦合度高,引起系統(tǒng)“雪崩”
更可怕的問題是,當系統(tǒng)上某個應(yīng)用因為延遲而變得不可用,用戶的點擊越頻繁,惡性循環(huán)最終導(dǎo)致“雪崩”,因為其中一臺服務(wù)器掛了,導(dǎo)致流量分散到其他正常工作的機器上,再導(dǎo)致正常的機器也掛,然后惡性循環(huán),將整個系統(tǒng)拖垮。
電商秒殺活動應(yīng)對策略
平臺的選擇至關(guān)重要
選擇一個好的服務(wù)商對于企業(yè)至關(guān)重要,神州光大是中國最大的利用共享經(jīng)濟模式,通過互聯(lián)網(wǎng)平臺聚合工程師資源,為客戶提供有質(zhì)量保證的按需使用工程師資源的IT服務(wù)的互聯(lián)網(wǎng)平臺公司。
神行云獸平臺始終致力于服務(wù)交付及服務(wù)質(zhì)量管控,神行工程師平臺會對工程師在提供服務(wù)的全過程實施嚴格的質(zhì)量管控,該平臺標準化的服務(wù)流程可進行服務(wù)過程的跟蹤記錄。真正實現(xiàn)了“高質(zhì)量、高效率、低成本”的服務(wù)目標。幫你度過每一次運維困境。