Thomas Wildgruber
2012-09-13 09:03:22 UTC
Hi Group,
wir müssen eine "Archivreform" bei uns durchführen, unser derzeitiges ist
zu zeitintensiv und für die menge der Daten nicht mehr zeitgemäß. Derzeit
lagern wir Produktionsdaten nach Abschluß auf DVDs aus, haben aber noch
Altbestände zurück bis in PD und MO Zeiten. Das ist eine tickende
Zeitbombe.
Was wir jetzt suchen würden, wäre ein System wo jeder Benutzer in der Lage
ist seine Daten einfach (zB durch Drag & Drop auf ein dediziertes
auszulagern und bei Bedarf auch wieder zurückzuholen. Die einzige
Vorraussetzung die ich jetzt sehe wäre, dass die Daten nach dem auslagern
zwar noch gelesen aber nicht mehr verändert werden können (read-only). Das
ist bei konventionellen Systemen erstmal gar nicht so einfach, denn wenn er
auf ein Volume Daten schreiben kann, darf er sie auch wieder zB löschen.
Ein naiver Gedanke zur Lösung des Problems wäre zB ein Skript welches
regelmäßig die Daten auf read-only setzt aber wirklich ausgereift scheint
mir das nicht zu sein.
Hinzu kommt noch, dass hier letztlich neben einen Nearline-Bereich (die
Daten liegen noch auf einem Server im Filesystem) langfristig auch ein
Offline-bereich eingeführt werden müsste (Die Daten zB auf Bänder
auszulagern). An dieser Stelle wird das zurückholen der Daten für den User
schon schwieriger, denn er müsste entweder aktiv ein Band einlegen oder
zumindest die Software des Loaders bedienen können. Fazit: Der User
bräuchte aktiven Zugang zum System und das kann langfristig auch nicht das
Gelbe vom Ei sein.
Schön wäre demnach ein System, welches den Content selbst verwaltet, egal
ob die Daten jetzt noch im Nearline-Bereich oder schon im Offline-Bereich
sind. Ein Zugang über zB ein simples und plattformunabhängiges Webinterface
wäre da sicher eine ideale Lösung. BTW: Die Hauptplattform von der die
Daten kommen wäre Mac OSX, es muss aber auch mit Windows (7) gerechnet
werden.
Zuletzt stellt sich noch die Frage wie man das Archiv dann sichert und
gegen Totalverlust der Daten schützt. Ins konventionelle Backup
(Retrospect) kann ich das Archiv nicht auch noch integrieren, dass würde
den finanziellen und vermutlich auch sinnvollen Rahmen sprengen. Das
Backupsystem als Archivsystem kann ich auch schon deshalb nicht nutzen,
weil die Benutzer Zugang zum System haben müssten, welcher ihnen zuviele
Möglichkeiten bietet Fehler zu machen.
Das Datenvolumen des bestehenden Archivs beträgt derzeit ca. 8 bis 10 TB,
gleiches Volumen wird schätzungsweise in den nächsten fünf Jahren wieder
anfallen. Demnach sollte das Sizing des Gesamtsystems bei ca. 30 TB liegen,
was aber angesichts des Datenvolumens von zB LTO 5 Bändern nicht so wild
wäre, wie es sich anhört. Die Kompressionsrate im Backup der betroffenen
Daten liegt auch relativ hoch (~70%). Die Geschwindigkeit des System spielt
bei erster Betrachtung erstmal eine untergeordnete Rolle, da täglich nur
überschaubar Daten aus- bzw. wieder eingelagert werden müssen.
Habt ihr da brauchbare Systeme produktiv am Laufen? Wenn Ja, welche und
welche Probleme habt ihr damit. Beim Budget dachte ich an ca. 10K Euro,
habe sie aber noch nicht beantragt.
Thx & Bye Tom
wir müssen eine "Archivreform" bei uns durchführen, unser derzeitiges ist
zu zeitintensiv und für die menge der Daten nicht mehr zeitgemäß. Derzeit
lagern wir Produktionsdaten nach Abschluß auf DVDs aus, haben aber noch
Altbestände zurück bis in PD und MO Zeiten. Das ist eine tickende
Zeitbombe.
Was wir jetzt suchen würden, wäre ein System wo jeder Benutzer in der Lage
ist seine Daten einfach (zB durch Drag & Drop auf ein dediziertes
auszulagern und bei Bedarf auch wieder zurückzuholen. Die einzige
Vorraussetzung die ich jetzt sehe wäre, dass die Daten nach dem auslagern
zwar noch gelesen aber nicht mehr verändert werden können (read-only). Das
ist bei konventionellen Systemen erstmal gar nicht so einfach, denn wenn er
auf ein Volume Daten schreiben kann, darf er sie auch wieder zB löschen.
Ein naiver Gedanke zur Lösung des Problems wäre zB ein Skript welches
regelmäßig die Daten auf read-only setzt aber wirklich ausgereift scheint
mir das nicht zu sein.
Hinzu kommt noch, dass hier letztlich neben einen Nearline-Bereich (die
Daten liegen noch auf einem Server im Filesystem) langfristig auch ein
Offline-bereich eingeführt werden müsste (Die Daten zB auf Bänder
auszulagern). An dieser Stelle wird das zurückholen der Daten für den User
schon schwieriger, denn er müsste entweder aktiv ein Band einlegen oder
zumindest die Software des Loaders bedienen können. Fazit: Der User
bräuchte aktiven Zugang zum System und das kann langfristig auch nicht das
Gelbe vom Ei sein.
Schön wäre demnach ein System, welches den Content selbst verwaltet, egal
ob die Daten jetzt noch im Nearline-Bereich oder schon im Offline-Bereich
sind. Ein Zugang über zB ein simples und plattformunabhängiges Webinterface
wäre da sicher eine ideale Lösung. BTW: Die Hauptplattform von der die
Daten kommen wäre Mac OSX, es muss aber auch mit Windows (7) gerechnet
werden.
Zuletzt stellt sich noch die Frage wie man das Archiv dann sichert und
gegen Totalverlust der Daten schützt. Ins konventionelle Backup
(Retrospect) kann ich das Archiv nicht auch noch integrieren, dass würde
den finanziellen und vermutlich auch sinnvollen Rahmen sprengen. Das
Backupsystem als Archivsystem kann ich auch schon deshalb nicht nutzen,
weil die Benutzer Zugang zum System haben müssten, welcher ihnen zuviele
Möglichkeiten bietet Fehler zu machen.
Das Datenvolumen des bestehenden Archivs beträgt derzeit ca. 8 bis 10 TB,
gleiches Volumen wird schätzungsweise in den nächsten fünf Jahren wieder
anfallen. Demnach sollte das Sizing des Gesamtsystems bei ca. 30 TB liegen,
was aber angesichts des Datenvolumens von zB LTO 5 Bändern nicht so wild
wäre, wie es sich anhört. Die Kompressionsrate im Backup der betroffenen
Daten liegt auch relativ hoch (~70%). Die Geschwindigkeit des System spielt
bei erster Betrachtung erstmal eine untergeordnete Rolle, da täglich nur
überschaubar Daten aus- bzw. wieder eingelagert werden müssen.
Habt ihr da brauchbare Systeme produktiv am Laufen? Wenn Ja, welche und
welche Probleme habt ihr damit. Beim Budget dachte ich an ca. 10K Euro,
habe sie aber noch nicht beantragt.
Thx & Bye Tom
--
"Der Retter der Welt ist ein Pinguin und Linus Torvalds ist sein Prophet "
"Der Retter der Welt ist ein Pinguin und Linus Torvalds ist sein Prophet "