Backup
將 Subversion 數據備份到 S3 的最經濟高效的方法?
我正在考慮使用 S3 作為我的 Subversion 數據庫的異地備份儲存庫。當我轉儲我的 SVN 數據庫時,它大約有 10 GB。我想避免重複上傳該數據的費用。
這個大文件的結構使得對 Subversion 的新更改會修改文件的尾部,而其他一切都保持不變。因為 Amazon S3 不允許您“修補”帶有更改的文件,所以每次在對 Subversion 進行簡單送出後實例化備份時,我都必須上傳 10 個演出。
以下是我看到的選項:
選項 1 我正在研究重複性,
--volsize
它將數據拆分為多個兆。是否可以使用此方法拆分 Subversion 轉儲,以便進一步增量備份以兆字節為單位?選項 2 我可以只備份熱顛覆儲存庫嗎?如果它正在編寫送出,這似乎是一個壞主意。但是,我可以選擇在午夜和凌晨 4 點之間將回購離線。我的 Berkeley DB 中的每個修訂版都使用一個文件作為其記錄。
為什麼不將您的儲存庫轉換為使用FSFS 格式而不是 BDB?
這樣每個修訂都將儲存為一個單獨的文件,因此增量備份將僅發送自上次備份以來已送出的修訂。
您可以建立一個小型 Amazon EC2 實例並通過 rsync 或您喜歡的任何工具備份到 Elastic Block Store (EBS) 卷。備份完成後,拍攝快照,該快照將持久保存到 S3。
在某些方面,它是一個更複雜的解決方案,但彌補了 S3 的一些限制/複雜性。