Storage

用於數據探勘概念驗證設置的雲或 VPS?

  • October 21, 2009

我們需要為一個 I/O 繁重的數據探勘應用程序線上託管一個概念驗證系統。我們通常每個系統需要 100-200GB,但我們對 CPU 和頻寬的要求很低。理想情況下,我們希望有一個定制的 Linux 虛擬機,我們可以複製、載入數據、線上執行幾週/幾個月(只要客戶想要使用它)然後將其刪除。我們可以接受託管 VM 模板的費用,但理想情況下,我們希望為數據庫使用的磁碟空間和客戶的實際 CPU 使用支付計量成本。

我查看了各種“雲”和 VPS 主機,似乎這些產品中的大多數都面向 CPU 或流量密集的應用程序:我寧願我們不為我們不使用的 RAM 或頻寬付費。亞馬遜的雲似乎是最合適的,但我很困惑(如果?)我們如何託管一個正常的 Linux 應用程序,該應用程序讀取對必須持久的正常基於文件的數據庫的訪問。我對 AWS 的理解是,只要實例處於非休眠狀態,無論客戶是否使用它,他們都會對實例收費,對嗎?

我正在尋找類似情況的指針/建議或經驗(好/壞)……

我認為 AWS 可能會成為您更好的選擇之一。是的,只要 VM 正在執行,您就會為此付費,但如果您對 CPU 和 RAM 的要求不高,並且不會花費太多,您可以執行一個小型實例。

至於儲存持久性數據庫,是的,您可以使用 EBS(彈性塊儲存)來執行此操作,如果您實際上沒有執行任何 IO 操作,您只需支付儲存成本(並不多)它。

為了提高性能,您需要在 EBS 卷上進行軟體 RAID,最好是 RAID10,並調整您的 MySQL。

沒有云可以讓您對 CPU 和 RAM 進行精細控制,您只能購買具有特定數量的 RAM 和 CPU 分配的實例。但是,您可以擴大這些規模,但在執行切換時可能需要一些停機時間。

如果您正在尋找控制權,您不妨在辦公室裡擁有自己的伺服器並讓它們玩轉,因為這可能會給您更好的控制權並降低您的成本。

還可以選擇租用專用伺服器並將您的客戶安置在那裡。使用 VPS 很可能不起作用,這取決於您對“I/O 繁重”的理解,因為在雲和虛擬化環境中,您總是與其他人共享磁碟 i/o,並且在每次請求時可能會有高峰和低谷第二。

引用自:https://serverfault.com/questions/76656