Disaster-Recovery

當一切都爆炸時,你的清單是什麼?

  • March 13, 2015

使用者無法訪問他們的電子郵件,CEO 無法訪問公司首頁,而您的尋呼機剛剛發出“911”程式碼。當一切都爆發時,你會怎麼做?

第一個答案是保持冷靜!我了解到,恐慌往往只會讓事情變得更糟。一旦實現了這一點,接下來的事情就是實際確定問題所在。來自使用者和管理者的抱怨會從各個角度向你傾訴,告訴你他們不能做什麼,而不是問題是什麼。

一旦你知道了問題,你就可以開始計劃解決它並開始給你憤怒的使用者一個時間表!

保持冷靜

不要驚慌失措。呼吸!(從橫膈膜開始,它會有所幫助。)如果你研究過冥想,那也會有所幫助。

當面臨極端壓力時,你的身體會進入逃跑或戰鬥模式,因為你的身體認為它處於生死攸關的境地。此時,您的身體實際上會減少向大腦某些部位輸送的血液,從而減少推理等功能。這有效地降低了你的智商,因為本能而不是理性開始主宰你的大腦功能。如果您曾經參與或目睹過激烈的爭論,您可能會在人們情緒爆發和理性休假時認出這些症狀。後來,當人們有機會冷靜下來時,他們會更容易接受自己犯了錯誤或犯了錯誤,並且更有能力看到對方,但在當下的熱度中,就不太可能了。

保持鎮定並保持對自己的機智將使您的大腦充分發揮作用,並確保您根據證據和理性而不是情緒和恐懼做出理性的決定。

分診

有效地應用有限的資源以最低的成本獲得最大的收益在這裡是非常重要的。儘早決定哪些事情必須立即修復,哪些可以等待一段時間(幾小時,幾天),哪些可以無限期地等待。還要學會意識到什麼時候無法挽救並且不值得保存(例如一半的路由器融化了,即使它是您唯一的一個,您也無法保存它,買一個新的並在現場匆忙得到它或找到可以暫時填補空白)。

保持態勢感知

不要讓你的注意力被一些有趣的問題或你還不太了解的東西所困。繼續關注大局,讓最重要的事情發揮作用。

使用科學方法

形成一個假設。確定你將如何檢驗這個假設。收集數據以檢驗假設。尋找不證實的數據。完善您的假設並根據需要重複該循環多次,直到您對自己的假設有足夠的信心採取行動。

務實

現在不是教條的時候。從災難中恢復時,可以在這里和那裡走一些捷徑。這實質上是在積累技術債務。在許多公司,災難性的失敗意味著災難性的收入損失。讓事情運轉起來,即使是在搖搖欲墜的基礎上,也比磨磨蹭蹭和冒著公司生計的風險要好。與往常一樣,判斷在這里至關重要。有時支撐一個指向伺服器機架的箱式風扇是有意義的,有時則不然。

照顧自己

你為這個緊急情況工作了多久?你最後一次喝水是什麼時候?你最後一次吃東西是什麼時候?你醒了多久?不要僅僅因為有緊急情況而讓自己筋疲力盡,花時間保持水分、進食和休息(以防它是一個漫長的、多天的工作)。

招聘幫助

幾乎可以肯定,您的公司中有很多才華橫溢的人,他們既有積極性又有能力提供幫助。不過要小心不要讓太多人到處亂跑,給彼此造成麻煩。還要通過“消防演習”來提防煩人的人。找到已經想提供幫助的人,讓他們從事有針對性的任務,並確保人們相互交流。

交流

溝通至關重要。沒有什麼比未知更可怕。當人們只知道某件東西壞了,一個空洞的聲明說它會在 X 小時內恢復,這只是稍微讓人放心(在 X 小時過去並且事情仍然壞了之後更讓人不放心)。發揮作用的壓力可能會引導你給出過於樂觀的 WAG 時間估計,但這是錯誤的做法。不要只是說你正在努力,不要只是說事情會在 X 時間之前修復。保持開放,展示你的過程,詳細說明你的進步和挫折。提供對問題的洞察力、追踪問題的過程以及解決問題的計劃(儘管不要讓人們陷入細枝末節)。表明問題不是棘手的,表明事情最終會得到解決,表明有能力解決這個問題,

引用自:https://serverfault.com/questions/30