Data Deduplication NetApp vs Microsoft
VS
Den Begriff Deduplication verbindet man heute in der IT meistens mit Storage Produkten von NetApp. In der neuen Server Version von Microsofts Windows Server 2012 wurde nun endlich auch eine Deduplication Funktion eingebaut. Es gab zwar schon früher eine SIS (Single Instance Storage) Funktion in Windows Servern, aber diese hat immer nur vollständige Dateien verglichen und war damit nicht so effektiv wie das Block-basierte verfahren von NetApp. Nun ist die neue Deduplication Funktion in Windows Server 2012 mit NetApp vergleichbar und ich habe beide Funktionen gegeneinander antreten lassen.
Voraussetzung
Damit das Ergebnis vergleichbar wird, habe ich folgende ISO Dateien aus dem Microsoft Volume Licensing Service Center (VLSC) heruntergeladen und als Vergleichsdaten auf den beiden Systemen gespeichert.
SW_DVD5_Exchange_Svr_2013_MultiLang_Std_Ent_MLF_X18-54275.ISO
SW_DVD5_NTRL_Win_7SP1_64BIT_MultiLang_no_ZHTW_Lang_Pk_X17-19009.ISO
SW_DVD5_Office_Professional_Plus_2013_W32_German_MLF_X18-55146.ISO
SW_DVD5_WIN_PRO_7_64BIT_GERMAN_FULL_MLF_X15-71077.iso
SW_DVD5_Win_Pro_7w_SP1_32BIT_English_MLF_X17-28595.ISO
SW_DVD5_Win_Pro_7w_SP1_64BIT_English_MLF_X17-28603.ISO
SW_DVD5_Win_Pro_8_32BIT_German_MLF_X18-16113.ISO
SW_DVD5_Win_Pro_8_64BIT_Eng_Intl_MLF_X18-16135.ISO
SW_DVD5_Win_Pro_8_64BIT_German_MLF_X18-16149.ISO
SW_DVD5_Win_Svr_Std_and_DataCtr_2012_64Bit_English_Core_MLF_X18-27588.ISO
SW_DVD9_SQL_Svr_Standard_Edtn_2012_English_MLF_X17-97001.ISO
Zum Vergleich wurde eine NetApp FAS 3210 und ein virtualisierter Windows Server 2012 verwendet, auf denen jeweils ein leeres 50GB Volume angelegt und freigegeben wurde.
Windows Server 2012
Auf dem Windows Server 2012 muss das Feature Deduplication installiert werden, dass via PowerShell so aussieht:
PS C:\> Import-Module ServerManager
PS C:\> Add-WindowsFeature -name FS-Data-Deduplication
PS C:\> Import-Module Deduplication
Danach wird die Funktion auf dem Ziel-Volume aktiviert:
PS C:\> Enable-DedupVolume Q:
PS C:\> Set-Dedupvolume Q: -MinimumFileAgeDays 0
Wenn die Testdaten fertig auf das Ziel-Volume kopiert sind kann der Dedup Job angestoßen werden:
PS C:\> Start-DedupJob –Volume Q: –Type Optimization
NetApp
Auf der NetApp habe ich die Testdaten auf das Ziel-Volume kopiert und die Deduplication angeschaltet:
sis on /vol/vol_dedup_test
Nun auch hier den Dedup Job anstoßen:
sis start /vol/vol_dedup_test
Ergebnisse
Bevor ich zu den Zahlen und Faken kommen, möchte ich darauf hinweisen, dass das nur ein Test ist und das Ergebnis nicht zwangsläufig generalisiert werden kann.
Windows Server 2012
Auf dem Windows Server 2012 sieht das Ergebnis der Deduplication wie folgt aus:
PS C:\> Get-DedupVolume
Enabled SavedSpace SavingsRate Volume
------- ---------- ----------- ------
True 14.72 GB 45 % Q:
Daraus ist zu entnehmen, dass 45% der Daten, also 14,72GB heraus gerechnet werden konnten.
NetApp
Das Ergebnis auf der NetApp kann auf der Commandline wie folgt ermittelt werden:
NetApp> df -hs /vol/vol_dedup_test
Filesystem used saved %saved
/vol/vol_dedup_test/ 29GB 2010MB 6%
Bei der NetApp sieht das Ergebnis erstaunlicherweise ganz anders aus, da konnten nur 6%, also 2,01GB heraus gerechnet werden.
Fazit
Zusammenfassend lässt sich sagen, dass in diesem Beispiel die Deduplication unter Windows Server 2012 ein besseres Ergebnis erzieht hat, als unter NetApp. Was aber nicht unbedingt heißen muss, dass NetApp schlechter ist, da unter NetApp in einem Volume auch blockbasierte Daten abgelegt werden können.
Viel eher kann man sagen, dass ein Windows Server 2012 für kleinere Unternehmen, die keine NetApp haben, eine gute Alternative sein kann. Für Unternehmen, die eine NetApp haben und darauf virtualisieren, kann darüber nachgedacht werden, ob in besonderen Fällen in den virtualisierten Windows Server 2012 zusätzlich Deduplication betrieben wird, um die NetApp etwas zu entlasten.