對于備份哪些內容和不備份哪些內容,目前有許多種方法,但是精髓應該是備份那些在崩潰后進行恢復時所需要的內容。
如果只告訴備份產品需要備份哪些文件和數據庫,那么這種簡單的方法可能會對用戶數據的可恢復性產生重大影響。正確的備份選擇實際上是在確保應該備份的數據被確實備份了和不備份無價值的數據之間達成一種平衡。
所有備份產品都需要在物理服務器上進行初始安裝和配置。要讓本文中提到的策略能夠發揮作用,用戶必須首先在數據中心的每個物理服務器上安裝適當的軟件和授權。在備份系統正常工作之前,用戶必須進行初始連接和身份驗證。
最常見的方法是在對指定的系統進行備份配置時,在備份系統中手動選擇需要備份的文件、對象或數據庫。以下為三個操作示例:
這種方法之所以最常用,主要是其符合人們的思維方式。如果用戶想要執行備份,那么他們會詳細地列出自己想要備份的內容。這種方法的另一大優勢是,它們可以最大程度地減少對無價值數據的備份,因為很少有人會選擇測試VM或數據庫,或是選擇UNIX上的/tmp之類的文件系統。
手動選擇要備份內容的問題在于,隨著時間的發展用戶不知道會出現什么事情。例如,如果僅備份用戶手動選擇的系統,那么更改配置后會發生什么情況?將新的VM添加到特定的VMware服務器時會發生什么情況?如果將特定的VM從VMware遷移到Hyper-V上,甚至是云端上,又會發生什么情況呢?如果用戶在VMware中手動選擇自己想要備份的內容,那么當改用其他配置后,它是不會自動開始備份的。通常備份專家并不推薦這種方法,因為數據丟失的風險非常高。
另一種常見的方法是簡單地指定所有需要備份的VM、數據庫或文件系統,將特定的VM或數據庫服務器添加到備份配置。這是最安全的方法,因為其可以確保所有的新數據源都會被備份。它們解決了手動備份方法存在的問題,因為VM(或從一種配置轉移到另一種配置的VM)的備份是自動進行的,無需通知任何人。
盡管這種方法實際上也備份了許多無價值的數據,但是它們可以確保用戶的重要數據能夠被自動備份。手動備份的最壞情況是,真實需要備份的重要文件系統、數據庫或VM被遺漏了。而自動備份的最壞情況是備份了許多無價值的垃圾數據。
這一技術通常與自動備份系統結合在一起共同使用。用戶將備份系統配置為備份所有的VM、數據庫或文件系統,然后通過排除列表明確指出哪些內容不需要備份。這種方法可以說是一種魚與熊掌兩者兼得的方法,用戶既可以通過自動備份方式確保備份了所有的重要數據,也可以自動排除那些已知的無用數據。
用戶可以在UI(用戶界面)中完成相關操作。在UI中,用戶只需單擊并手動選擇沒有任何價值的驅動器或數據庫即可。如果管理員想節省空間,那么他們可以將測試數據庫、BM或/tmp之類的文件系統添加到排除列表中,以確保空間不會被浪費。
設置選擇性排除的另一種方法是使用通配符或正則表達式將不應備份的內容標識出來。例如,用戶可以用* .tmp、*.bak,*.cache來指定需要排除的內容,那么帶所有這些擴展名的文件都不會被備份。熟練掌握正則表達式的用戶則可以更為方便地排除不需要備份的特定類型文件,無論這些文件在何處。
通過標簽識別需要備份的數據是一種非常現代的方法。打標簽的方式在VM領域中非常普遍。這樣,用戶不僅可以通過特定標簽識別出哪些VM需要備份,還可以為它們指定備份方式。例如,用戶可以識別出帶有#database標簽的VM需要備份,還可以為其指定具體的備份策略。帶有#fileserver、#test等標簽的VM的情況也是如此。用戶可以創建幾種特定行為的備份策略,然后通過#標簽將這些策略應用于不同的VM。
這種方法實際上也是自動備份的一種表現形式,因為所有新的VM都會依據#標簽被自動添加到適當的備份策略中。此時,用戶仍然可以繼續使用自動排除系統,以確保不會備份垃圾數據。
只要使用自動備份或基于標簽的備份,用戶都需要一種包容性比較強的機制。例如,盡管帶有某類標簽或機制的VM或數據庫未被設置為自動備份,但是用戶又希望它們仍然被備份。用戶使用智能系統(如基于標簽的備份方法)越頻繁,那么默認備份系統就變得越重要。
如果備份系統支持默認備份,那么通常它們的工作方式如下:該策略會備份所有未被自動策略或基于標簽的策略選中的VM或數據庫。雖然該策略不會針對特定系統的需求專門進行調整,但是至少會對其進行備份。用戶可以監視該策略,查看默認備份是否備份了所有的系統。如果是,用戶應該檢查一下其中的原因,并通過適當的備份配置來解決這一問題。
用戶需要牢記,備份系統設計的基本原則是“用戶無法恢復未備份的內容”。沒有人會因為備份太多數據而被解雇,許多人被解雇的原因恰恰是因為沒有備份足夠的數據。用戶只需要盡自己最大的努力消除浪費的備份空間,寧可失之過于謹慎也不能冒風險。與備份無價值的數據相比,用戶更應關注未備份的數據。