了解最新公司動態及行業資訊
根據百度百科的定義:運維工程師負責維護和保證整個服務的高可用,同時不斷優化系統架構以提高部署效率和資源利用率,從而提高整體投資回報率。無論運維做什么,運維工程師最基本的職責就是對服務的穩定性負責,保證服務能夠7*24H持續改進為用戶提供的服務。
定義:IT 團隊向內部和外部用戶提供的所有流程和服務的超集,并由他們自己用于開展業務。
IT 運營團隊的重要角色包括技術管理和質量保證以及基礎設施管理,并確保 IT 產品(或服務)滿足客戶的所有需求和期望。運營團隊以所需的質量和成本提供有效的服務。
我們主要想討論三個話題:
1、什么是運維
2、初學者如何系統學習運維知識
3、云時代的運維
1、什么是運維
首先我們來看看目前主流招聘平臺對運維工程師職位的工作內容要求和專業技能要求:
工作職責:
1、企業數據中心建設和管理相關工作,包括基礎網絡、信息安全、服務器、存儲、備份、操作系統、數據庫、中間件等基礎軟硬件建設、管理和優化。
2、信息系統運行保障相關工作,包括生產系統生產支持、日常運維、變更和應急處理。
3、開發測試支持相關工作,包括測試環境搭建、日常運維以及相應的技術支持。
4、內控管理相關工作,包括堡壘機等技術和產品的管理,以及流程體系的制定和實施。
工作要求:
1.熟悉虛擬化和主流linux系統和HA軟件。
2.熟悉mysql等主流關系型數據庫。
3.熟悉nginx、redis等軟件。
4.熟練使用shell或編寫日常管理腳本。
5.熟悉X86服務器、SAN存儲等常用硬件設備。
6.熟悉網絡知識服務器運維技術,能對常見的交換機、路由器、防火墻、IPS、WAF等設備進行簡單的配置和管理。
7.熟悉常見的監控、管理和控制系統,如堡壘機等。
8.熟悉網絡和應用安全相關知識和技能,能夠處理基本的網絡和安全問題。
可以得出結論,運維工程師的工作內容非常廣泛服務器運維技術,需要及時、適當地參與到軟件產品的整個生命周期中。作業需求涉及的技術棧深度較大,包括:
1、腳本語言、shell、perl 或
2、網絡知識
3、分布式計算
4、應用服務器
5、數據庫等中間件
6、監控系統
7、安全
那么,究竟什么是運維?我們看下圖,一個軟件產品(或信息系統)的交付過程,在1-5階段,運維團隊負責基礎設施資源供給(計算、存儲、中間件部署、安全),在第6階段,產品和研發團隊完成主要工作后,系統進入上線后運維階段。運維團隊對系統運行質量、穩定性、可靠性、安全性等指標全面負責。
在實際的運維項目中,運維團隊應該關注的知識領域包括:需求變化、輸入/輸出、資源、策略、前瞻性、控制、計劃和成本。也就是說,需要在這些要素的約束下制定。運維工作標準及相應流程。
運維部門的職能層次(發展前景)一般有以下幾個層次:
a、初學者、操作系統、中間件安裝部署、通用配置
b、中級工程師、應用部署與配置、系統運行監控
c、高級/專家級,運維架構設計/優化,具備綜合考慮成本、效率和水平的能力
d、有團隊,超前規劃
2、初學者如何系統學習運維知識
一、學習和掌握Linux系統:
1、Linux基礎知識、基礎命令(cp、ls、file、rm、cat、ps等操作命令)
2、Linux 用戶和權限基礎知識
3、Linux系統進程管理
4、文本編輯命令(vim、grep、sed、find等)
5、shell 腳本
學習完以上Linux知識后,進一步了解相關知識,
1、TCP/IP 網絡基礎
2、Linux企業常用服務(如dns、http、ftp、mail、nfs等)
3、企業級安全原則和防范技能(系統性能監控、安全威脅模型和解決方案)
4、 加解密原理及數據安全、系統服務訪問控制
5、安全策略構建
6、高級shell腳本(主要是結合一些應用,寫一些案例)
7、應用php、mysql搭建CMS或個人網站系統
如:
至此,你基本可以成為入門級的運維工程師了。
3、云時代的運維
隨著云計算時代的到來,業內流傳著一個廣為流傳的“觀點”:云計算將淘汰傳統運維。
那么我們來討論第二個話題,什么是云計算運維,運維工程師如何在云計算時代保持自己的專業競爭力。
云時代,運維工作發生了深刻變化。傳統運維需要處理服務器、網絡、存儲等硬件設備。在云時代,不需要去碰硬件設備,而是去處理虛擬資源(其實虛擬化就是云平臺的核心支撐技術,軟件定義計算,軟件定義存儲,軟件定義網絡)。云平臺廠商提供的負載均衡、動態伸縮、數據遷移等服務降低了運維的復雜度,在一定程度上降低了運維的門檻。
云計算時代的運維,通過人工智能、大數據等技術,將節省更多的人力物力成本,減輕運維人員的壓力。
但是,云時代的運維也將出現新的挑戰:
1、工程師不再直接操作物理資源,而是面對一堆API(云平臺提供),更難發現問題。有編程經驗的同學都知道,世界上沒有完美的系統。
2、大型系統所涉及的資源(包括可橫向擴展的彈性計算服務、PaaS平臺提供的第三方服務、負載均衡、數據同步等)大大擴展,資源的增長帶來關于管理復雜性的急劇增加
3、云產品本身的版本升級增加了系統運行的不穩定性
4、云平臺和云產品的按需特性帶來了控制成本的需求,即如果可能,運維團隊應該考慮是否可以減少云資源的使用來控制成本,以及這種“縮水”無疑會給運維工作帶來一定的風險。