近日,Yelp的SRE工程師Dmitriy Samovskiy發(fā)表了一篇標題為《新時代的運維》的文章,文章中他簡要介紹了在云計算大環(huán)境下,運維工作重心和角色的變化。
其實在6年前,Dmitriy就寫過一篇關(guān)于DevOps趨勢的文章,在那篇文章中,他認為系統(tǒng)管理人員需要具有簡單腳本之外的開發(fā)能力,并且多關(guān)注服務(wù)器穩(wěn)定性和上線時間等。但這六年中,隨著云計算等技術(shù)的發(fā)展,運維相關(guān)的工作也早已被革新,所以Dmitriy又重新反思了當下運維相關(guān)的技術(shù)工作。下面是文章的核心觀點。
為什么運維會發(fā)生變化?這種變化會繼續(xù)下去嗎?
主要有以下兩點原因:
IaaS云服務(wù)的興起深刻改變了運維?;A(chǔ)設(shè)施即代碼,運維面對的不再是傳統(tǒng)的服務(wù)器。云廠商可以將所有事情標準化,然后以服務(wù)的形式打包提供給客戶。
運維人員自身也掌握了更多的軟件開發(fā)技能。運維人員不再局限于腳本,轉(zhuǎn)而變成更好的開發(fā)者,承擔起更多的職責。
研發(fā)生產(chǎn)和運維會變得越來越難以分割。不會再有專門的運維團隊,每個項目研發(fā)團隊都可以自行進行產(chǎn)品的運維。這種角色的變化,并不意味著運維工作的消失;相反,依然需要運維技能、知識和經(jīng)驗。
可擴展性已經(jīng)成為了運維工作的重心
在以前的服務(wù)器時代,運維團隊的主要工作是創(chuàng)建環(huán)境并維護生產(chǎn)的穩(wěn)定性。而現(xiàn)如今,運維團隊的工作重心已經(jīng)轉(zhuǎn)向了如何提高產(chǎn)品的可擴展性。如果擴展性做得不好,流量負載過多就帶來各種相關(guān)問題(會話沖突、用戶擁堵和數(shù)據(jù)集合大小不符)。如果擴展性做得好,產(chǎn)品就會運行得既安全又高效。這對于一些金融類的高風險業(yè)務(wù)尤為重要。
隨著服務(wù)規(guī)模的不斷擴展,人工進行系統(tǒng)管理已經(jīng)成為不可能完成的任務(wù),自動化運維將是不可回避的選擇。業(yè)界的一種觀點是,DevOps是自動化運維的唯一方法;Dmitriy認為DevOps是一種文化,會在企業(yè)發(fā)展成長中自然而然地形成。
運維能力已經(jīng)成為企業(yè)的技術(shù)基礎(chǔ)
在以前,研發(fā)工程師團隊只負責開發(fā)產(chǎn)品,而不負責提高開發(fā)效率的相關(guān)工作,如:代碼重用性、實現(xiàn)模式、用戶庫、核心API等?,F(xiàn)在,一些DevOps文化的公司已經(jīng)將這些工作融合在一起。
一些大型網(wǎng)站如Facebook、Google等都有專職的SRE(Site Reliability Engineer)網(wǎng)站可靠性工程師,國內(nèi)又稱應(yīng)用運維師。其對應(yīng)的工作職責包含:容量規(guī)劃與實施、集群部署、數(shù)據(jù)中心容錯、負載均衡和監(jiān)控等。
公司在不同的發(fā)展階段對運維的需求不同
初創(chuàng)階段
公司在初創(chuàng)時期最需要關(guān)心的就是如何研發(fā)出滿足市場需求的功能,而不是舍本逐末地去抓運維。因為這個時期企業(yè)一方面還沒有大量用戶,而另一方面運維會耗費過多的技術(shù)資源;所以應(yīng)該將更多的精力放在快速迭代、新功能研發(fā)上。這個時期,推薦企業(yè)采用NoOps。
快速擴張時期
在互聯(lián)網(wǎng)時代,傳統(tǒng)企業(yè)開始直接向客戶提供服務(wù),但是舊式運維并不能勝任大量的流量負載。這個時候,運維工作需互聯(lián)網(wǎng)規(guī)?;?WebScale)。WebScale IT是相對于傳統(tǒng)IT構(gòu)架的新概念,意味著系統(tǒng)可處理大量計算、承受高負載、具有強容錯性和持續(xù)部署及交付能力、可高效運維等。
(審核編輯: 滄海一土)
分享