Cluster
您的配置方法是什麼?(在紙板之外 -> 裸機 -> 功能齊全的伺服器)?
試圖縮短我們的部署時間,並尋找您或您的團隊用來返回終端和離開數據中心的建議和捷徑。查看從訂購齒輪到使用壽命結束的整個過程。
- 如果您足夠大,可以擔心大型部署,那麼您就可以使用某種數據庫來獲取機器資訊。它應該包含有關 IP 地址、MAC 地址、機器名稱和角色的資訊以及正常的型號和供應商資訊。使用它來填充配置和安裝工具。
- 如果只是幾台機器,系統管理員可能是機架和堆棧的最佳選擇。如果部署超過 5-10 台機器,請聘請承包商進行拆包、架設和佈線。他們這樣做的頻率足夠高,以至於他們可以比 1-2 名系統管理員和一些志願者(閱讀實習生)更快地完成任務並且花費更少的錢。
- 進行自動安裝設置。對於 Linux,這意味著類似FAI(Debian 和 Ubuntu)或kickstart(RHEL 和 CentOS)。Solaris 使用jumpstart而 Windows 使用WDS。x86/x86_64 硬體幾乎總是支持 dhcp 和 PXE。您可能需要對其他伺服器使用 bootp。使用上面提到的數據庫來提供配置。測試安裝配置腳本是否符合您的預期。然後將您的機器作為硬體安裝的最後一步打開。
- 擁有一個配置管理系統,其中包含您使用的機器和服務類型的定義。 Puppet和cfengine很受歡迎,但還有很多其他的。讓伺服器角色來自上述數據庫。這對於您的成長至關重要。配置管理工具將確保所有伺服器都擁有正確版本的軟體以及它們提供的服務所需的所有配置。安裝後在初始啟動時呼叫它。使用全新安裝執行幾次迭代,以確保一切正常。
- 如果可能的話,一旦所有東西都安裝好了,在你開始向它拋出使用者流量之前,讓所有東西都磨合幾天。將您的監控設置為在出現問題時向您發送電子郵件,但不要在老化期間呼叫任何人。如果無法進行老化,請為比正常情況更多的問題做好準備,直到您解決任何早期問題。
- 每次部署後都有回顧。確定什麼進展順利,什麼不順利。確定需要改進的地方並進行改進。這可以是您想要的正式或非正式。回顧與其他步驟一樣重要。這是您改進流程的方式。
我不能強調您需要在任何部署之前和期間測試該過程。測試應該盡可能自動化。隨著您對部署的陷阱越來越熟悉,您應該改進您的測試。
這就是一個小團隊(2 人)如何在不到 12 個工時內添加 50 台或更多機器的方法,不包括拆包、上架、佈線等所花費的時間。