了解最新公司動態(tài)及行業(yè)資訊
一個擁有4萬臺服務(wù)器的公司,整個運維團隊至少有50人
如果是自建IDC,50人中有10人會專門做機房、網(wǎng)絡(luò)、服務(wù)器、存儲等底層架構(gòu),也就是IaaS層
如果你使用公共云服務(wù),你可以拯救這 10 個人
物理架構(gòu)的 IaaS 層有 PaaS服務(wù)器運維技術(shù),這 50 人中可能有 10 人專門從事自動化平臺、發(fā)布、監(jiān)控、DB 管理、容器化、虛擬化等。
上到業(yè)務(wù)層負責(zé)業(yè)務(wù)運維。可能每2、3個人負責(zé)一個比較大的垂直業(yè)務(wù),比如微信支付、淘寶訂單管理等。
那么在這2、 3個業(yè)務(wù)操作中,我通常在簡歷中這樣描述自己
xxx業(yè)務(wù)核心運維負責(zé)人,最高并發(fā)QPS xx萬,獨立維護4萬多臺機器服務(wù)器運維技術(shù),年可用率99%以上

那么問題來了:“這里所謂的人真的是人嗎?”
借用騰訊藍鯨的架構(gòu)圖說一下這個問題


從下到上,它們是 IaaS、PaaS 和 SaaS 層。一般來說,大公司的每次運維只負責(zé)其中的一小部分。有的專門做虛擬化和容器化,有的專門做監(jiān)控告警,有的專門做后續(xù)業(yè)務(wù)運維業(yè)務(wù)生命周期服務(wù)
負責(zé)采購、上架、調(diào)試、拉光纖和網(wǎng)線的這群人,這里不算。
就像蓋一座摩天大樓,大家只看到臺前的建筑師,卻看不到臺后的施工主管
在《SRE》一書中,每個IDC都需要有專門的團隊負責(zé)硬件設(shè)施和基礎(chǔ)設(shè)施
像谷歌這樣強大,擁有百萬級的服務(wù)器規(guī)模,以及大量的技術(shù)專家,也需要有人做一些體力活。
現(xiàn)在有各種公有云,導(dǎo)致很多技術(shù)人員做業(yè)務(wù)應(yīng)用(包括開發(fā)、運維),不需要自己做一些硬件設(shè)備相關(guān)的工作,但那是站出來的結(jié)果巨人的肩膀。太浮了

我的專業(yè)經(jīng)驗有限,沒有親自接觸過幾萬臺規(guī)模的項目,但也接觸過上千臺的熱門游戲項目。
當(dāng)時我是游戲業(yè)務(wù)的運維,服務(wù)器不需要我安裝和配置linux系統(tǒng)。專門的IDC運維團隊拿到服務(wù)器root權(quán)限后,我負責(zé)業(yè)務(wù)應(yīng)用的部署和維護,同時也利用其他同事進行開發(fā)。各種CMDB、監(jiān)控、發(fā)布系統(tǒng)等
但是,我有自知之明,不敢聲稱獨立維護數(shù)千臺服務(wù)器的大規(guī)模集群