更新時間:2013年08月02日 10165瀏覽
一、 什么是IDC機房運維?
IDC機房運維涉及到方方面面的問題,它不同于其他運維,處理的問題都是比較低沉的問題。在很多公司可能都是將服務器托管的到專門的IDC機房讓專業(yè)的人士進行維護,還有些大公司建有自己的IDC機房,但管理層面上可能只是網(wǎng)絡信息部門的一個子部門,但我們仍要面對很多機房管理的問題。IDC機房運維可以簡單的從五個方面來概括:主機監(jiān)控、信息統(tǒng)計、硬件維護、系統(tǒng)維護、網(wǎng)絡維護。處理這些問題就是IDC機房的運維。
二、 分層運維
我認為我們所熟知的計算機能有今天的成就很大一個成功是在于它的模塊化設計,以及分層體系,現(xiàn)在我們用的PC的硬件是由CPU、內存、硬盤、主板、輸入輸出設備等組成。正是這些模塊化的構造讓人們對計算機的維護更加的方便,快捷。
現(xiàn)在我們正在步入云計算時代,云計算的實施卻是阻礙重重。但是云計算是必然的趨勢,因為這是人們對信息自由的渴望、是對資源合理利用的迫切需要。所以說云計算的發(fā)展也少不了用模塊化,分層次的進行設計和優(yōu)化。
我們來看看云計算的分類 云計算可以認為包括以下幾個層次的服務:基礎設施即服務(IaaS),平臺即服務(PaaS)和軟件即服務(SaaS)。
我覺得我們現(xiàn)在的系統(tǒng)分層多且繁雜,無法體現(xiàn)我們在IDC機房的運維,我認為IDC機房的運維應該根據(jù)服務提供的角度去對IDC機房進行維護,從終端角度來看,所有提供網(wǎng)絡服務的資源都是一朵朵的網(wǎng)云。我們在IDC機房中的運維都是為了面向終端進行服務。所以說我們應該根據(jù)服務來對我們的IDC機房進行運維。
我根據(jù)云計算服務的分類認為我們在運維分層的問題上應該和云服務的分類相呼應來進行維護,所以我認為,IDC機房的運維應該分成:基礎設施維護,耦合層維護,應用服務維護三個層面。
基礎設施維護
基礎設施維護顧名思義,指的是對設施設備的維護,包括設備的環(huán)境維護,設備的統(tǒng)計等等。在這個層面我們需要保證每一臺機器是可以正常連接的,是可以正常使用對外提供服務的,并且我們得保障機器的正常運行并且是可管理的??偟膩碚f基礎設施層的維護是為了對耦合層的交付使用而服務的。
耦合層維護
在這個層面我們對設備有了統(tǒng)一的管理,在這個層面有系統(tǒng)性的架構統(tǒng)一的管理系統(tǒng),指令系統(tǒng),和監(jiān)控系統(tǒng),在這個層面我們可以發(fā)現(xiàn)底層的問題,并交由底層處理,并在這個層面保證應用服務的正常運行。在這個層面將會涉及負載均衡和備份等技術。
應用服務維護
在這個層面主要是客戶對自己應用的維護,在這個層面里客戶對自己運行的運營軟件進行維護。
當然這個分層的維護只是個萌生概念,如果有一天這個理論可以被建立,相信會被更加的完善。并且為我們更好的理解運維體系服務。
三、 運維工程師
在我之前有很多人都對運維工程師進行過很多定義,大家都說運維工程師是神仙,不是人干的活。因為運維工程師所承擔的東西太多了,這讓很多做運維工作的朋友們都表示傷不起啊。我們可以來看看以前別人是怎么來定義運維工程師的。
運維工作師需要什么樣的技能及素質
做為一名運維工程師需要什么樣的技能及素質呢,首先說說技能吧,如大家上面所看到,運維是一個集多IT工種技能與一身的崗位,對系統(tǒng)->網(wǎng)絡->存儲->協(xié)議->需求->開發(fā)->測試->安全等各環(huán)節(jié)都需要了解一些,但對于某些環(huán)節(jié)需熟悉甚至精通,如系統(tǒng)(基本操作系統(tǒng)的熟悉使用,*nix,windows..)、協(xié)議、系統(tǒng)開發(fā)(日常很重要的工作是自動運維化相關開發(fā)、大規(guī)模集群工具開發(fā)、管理)、通用應用(如lvs、ha、web server、db、中間件、存儲等)、網(wǎng)絡,IDC拓樸架構等等,但是我們知道每個人不肯能樣樣都很精通,每個人的知識層面不可能像水桶一樣,我不否認這種人的處在,但是人的精力是有限的,一個人挖10口1米的井估計很難挖出水來,但是一個人挖一口10米的井我想挖出水的可能性還是很高的。所以說如果運維工程師通過分層運維將運維的知識面分開來進行突破,我想運維水平的提高指日可待,運維工程師的工作負擔也會相應的減輕。
那么運維工程師在技能和個人素質方面需要什么要求呢?
我覺得在技能方面不需要過分去強求,只要懂得計算機的基本原理等計算機知識就可以,其他的個方面知識都可以通過后天的培養(yǎng)獲得。
在個人素質方面應該具備以下幾點:
個人素質方面:
1、 溝通能力、團隊協(xié)作:運維工作跨部門、跨工種工作很多,需善于溝通、并且團隊協(xié)作能力要強;這應該是現(xiàn)代企業(yè)的基本素質要求了,不多說。
2、工作中需膽大心細:膽大才能創(chuàng)新、不走尋常路,特別對于運維這種新的工種,更需創(chuàng)新才能促進發(fā)展;心細,運維工程師是網(wǎng)站admin,最高線上權限者,一不小心就會遺憾終生或打入十八層地獄。
3、主動性、執(zhí)行力、精力旺盛、抗壓能力強:由于IT行業(yè)的特性,變化快;往往計劃趕不上變化,運維工作就更突出了,比如國內各大公司服務器往往是全國各地,哪里便宜性價比高,就那往搬,進行大規(guī)模服務遷移(牽扯的服務器成百上千臺),這是一個非常頭痛的問題;往往時間非常緊迫,如限1周內完成,這種情況下,運維工程師的主動性及執(zhí)行力就有很高的要求了:計劃、方案、服務無縫遷移、機器搬遷上架、環(huán)境準備、安全評估、性能評估、基建、各關聯(lián)部門扯皮,7X24小緊急事故響應等。
4、其它就是一些基本素質了:頭腦要靈光、邏輯思維能力強、為人謙虛穩(wěn)重、親和力、樂于助人、有大局觀。
5、最后一點,做網(wǎng)站運維需要有探索創(chuàng)新精神,通過創(chuàng)新型思維解決現(xiàn)實中的問題,因為這是一個處于幼年的職業(yè)(國外也一樣,但比國內起步早點),沒有成熟體系或方法論可以借鑒,只能靠大家自已摸索努力。
四、 機房運維技術體系
在機房中我們要面對各種各樣的事情,如服務器上架,服務器下架,處理問題服務器等等。在機房運維中我覺得也應該建立起我們的技術體系,從這幾方面入手使得我們的機房運營的更加平穩(wěn)健康。
1、 監(jiān)控體系,一個健壯的身體里不開每天的觀察,我們需要時時刻刻觀察我們的機房,看看機房發(fā)生的細小問題,所以說強大而有健全的監(jiān)控體系有利于我們更好的維護我們的機房。
2、 統(tǒng)計體系,在IDC機房我們管理著數(shù)以百計的服務器,統(tǒng)計工作可馬虎不得,每一臺機器的配置,存放位置等等,都關系著數(shù)千元的設備的物理安全,其他的還有帶寬安全等等。數(shù)量少還好,數(shù)量一多就有可能出錯,如何快速高效的統(tǒng)計,并不出錯也是門技術。所以單獨為一個體系也是有必要的。
3、 故障管理體系,在機房中我們要處理每一臺服務器發(fā)生的故障,有些問題很棘手,有些問題很簡單,但大多數(shù)問題都有相似性,可以參考其他問題的處理過程處理,良好的故障管理體系肯定是有助于我們快速的響應和處理問題的。
4、 自動化體系,太多的手動執(zhí)行大大影響了我們處理問題的工作效率,機房運維引入自動化的理念開發(fā)自動化管理工具可以大幅度的提高我們機房的管理效率。
5、 評估優(yōu)化體系,正所謂人無完人,在好的東西也有不好的地方,如IPONG待機時間短,建立評估優(yōu)化體系使得我們可以在定期的時間內發(fā)現(xiàn)我們不足的地方,更好的優(yōu)化我們的不足之處
五、 如何成為一個合格的運維工程師
我認為做好IDC機房的運維就是要保障最底層的運維維護安全。如何高效的維護好底層的設備是每一個IDC運維工程師應當具備的職責。我們可以做好以下幾個方面。
第一、 統(tǒng)計記錄好機房機器運行的信息。如上下架記錄,故障處理記錄,監(jiān)控記錄等等,做到高效快速的統(tǒng)計好所有機房信息。
第二、 監(jiān)控。熟悉和掌握監(jiān)控軟件的使用,做到可以更具監(jiān)控工具的組合應用定位故障點,初步反應故障原因等。
第三、 通過創(chuàng)新思維以及熟練操作提高并解決運維效率問題;目前各公司大部份運維主要工作還是依賴人工操作干預,需要盡可能的解放雙手。以及熟悉每一個運維環(huán)節(jié)的操作。
第四、 運維知識的積累與沉淀、文檔的完備性。運維是一個經(jīng)驗性非常強的崗位,好的經(jīng)驗與陷阱都需積累下來,避免重復性范錯。并且可以在相似問題發(fā)生的情況下快速反應。
第五、 有計劃的做事;工作有計劃,計劃后想方設法達到目標,不找借口。機房運維工作大多都比較少,通常都是處理問題,但有很多事情是需要定期去做的,比如統(tǒng)計、評估、優(yōu)化等等。
六、 運維職業(yè)的迷惘、現(xiàn)狀與發(fā)展前景
運維崗位不像其它崗位,如研發(fā)工程師、測試工程師等,有非常明確的職責定位及職業(yè)規(guī)劃,比較有職業(yè)認同感與成就感;而運維工作可能給人的感覺是哪方面都了解一些,但又都比上專職工程師更精通、感覺平時被關注度比較低(除非線上出現(xiàn)故障),慢慢的大家就會迷惘,對職業(yè)發(fā)展產(chǎn)生困惑,為什么會有這種現(xiàn)象呢? 除了職業(yè)本身特點外,主要還是因為對運維了解不深入、做得不深入導致;其實這個問題其它崗位也會出現(xiàn),但我發(fā)現(xiàn)運維更典型,更容易出現(xiàn)這個問題;針對這個問題我談一下機房運維的現(xiàn)狀及發(fā)展前景(也在思考中,可能不太深入全面,也請大家斧正補充)
運維現(xiàn)狀:
1、處于剛起步的初級階段,各大公司有此專職,但重視或重要承度不高,可替代性強;小公司更多是由其它崗位來兼顧做這一塊工作,沒有專職,也不可能做得深入
2、技術層次比較低;主要處于技術探索、積累階段,沒有型成體系化的理念、技術。
3、體力勞動偏大;這個問題主要與第二點有關系,很多事情還是依靠人力進行,沒有完成好的提練。
發(fā)展前景:
2、從個人角度,運維工程師技術含量及要求會越來越高,同時也是對公司應用、架構最了解最熟悉的人、越來越得到重視。
3、運維將成為一個融合多學科(網(wǎng)絡、系統(tǒng)、開發(fā)、安全、應用架構、存儲等)的綜合性技術崗位,給大家提供一個很好的個人能力與技術廣度的發(fā)展空間。
4、運維工作的相關經(jīng)驗將會變得非常重要,而且也將成為個人的核心競爭力,具備很好的各層面問題的解決能力及方案提供、全局思考能力等。
5、特長發(fā)控和興趣的培養(yǎng);由于運維崗位所接觸的知識面非常廣闊,更容易培養(yǎng)或發(fā)揮出個人某些方面的特長或愛好,如內核、網(wǎng)絡、開發(fā)、數(shù)據(jù)庫等方面,可以做得非常深入精通、成為這方面的專家。
6、如果真要以后不想做運維了,轉到其它崗位也比較容易,不會有太大的局限性。當然了,你得真正用心去做。
7、技術發(fā)展方向、網(wǎng)站/系統(tǒng)架構師。
微信掃碼關注
Tel :400-0311-765
Add:石家莊市高新區(qū)物聯(lián)網(wǎng)大廈一層