Discussion:
Raid1 für Macintosh-Umgebung
(zu alt für eine Antwort)
Heiner Veelken
2011-06-29 15:28:12 UTC
Permalink
Ich melde mich mal wieder mit einer kleinen Frage:
Wir sind 7 Mitarbeiter, die alle mit aktuellen Macs auf einer an einem
Mac freigegebenen Firewire-Platte "arbeiten". Diese Platte wird
stündlich auf ein weiteres Laufwerk getimemachined, täglich auf weitere
Platte geklont und noch 3-täglich und wöchentlich auf weitere Laufwerke
getimemachined.
Um Ausfallzeiten zu minimieren, denke ich darüber nach, zusätzlich die
freigegebene Festplatte als Raid1-System auszuführen.
Ich hätte gerne von Euch gewußt, was Ihr da nehmen würdet. Es sollte
etwas sein, was ich selbst administrieren kann. Würde das Apple-eigene
Raid ausreichen?
Insbesondere der Tausch einer Platte sollte narrensicher sein.
Wer kann da was zu beitragen?
--
Gruss Heiner
Marcus Jodorf
2011-06-29 22:39:16 UTC
Permalink
Würde das Apple-eigene Raid ausreichen?
Prinzipiell funktioniert das schon.
Was man allerdings unbedingt beachten sollte:
Apple hat das mal wieder nur etwas halbherzig umgesetzt. Es gibt keine
systemeigene Überwachungsfunktion, rein gar nichts in der Richtung.
Mir ist vor ein paar Tagen erst eine defekte Platte im Mini Server
aus dem Raid gekippt und ich hab es glatt erst einen Tag später
gemerkt und das eher zufällig. Wie leider fast üblich, sind auch
Logging und Fehlermeldungen natürlich reichlich bescheiden und wenig
aufschlußreich.

Also entweder entsprechende Überwachungssoftware nachkaufen oder halt
selber schnell was stricken und ein passendes kleines Script periodisch
den Raid-Status checken lassen.
Raid nützt nichts, wenn Platten sich unbemerkt verabschieden können.
Insbesondere der Tausch einer Platte sollte narrensicher sein. Wer
kann da was zu beitragen?
Es gibt diverse NAS-Fertiglösungen, die man da durchaus ins Auge fassen
könnte. Persönlich stelle ich da lieber gleich Linuxschüsseln mit Raid
und netatalk als Fileserver hin.
Habt ihr mehrere FW Anschlüsse und relativ geringe Ansprüche (wenn
bisher schon eine einfach FW ausreicht), könnte man es vielleicht auch
durchaus einfach mal mit zwei FW Platten versuchen.


Gruß,

Marcus
Thomas Kaiser
2011-06-30 06:38:41 UTC
Permalink
Post by Marcus Jodorf
Würde das Apple-eigene Raid ausreichen?
Prinzipiell funktioniert das schon.
Apple hat das mal wieder nur etwas halbherzig umgesetzt. Es gibt keine
systemeigene Überwachungsfunktion, rein gar nichts in der Richtung.
Äh, langsam...

Ich kenne von den xServes durchaus Formen von Hardware-Monitoring (bei
den PPC noch prinzipbedingt deutlich anders als bei den Intelschen
xServes mit ILOM/IPMI). Aber zumindest bei den xServes war auf
Systemebene der hwmond (<http://www.manpagez.com/man/8/hwmond/>) dafür
zuständig, ein Auge auf die Hardware zu werfen. Entsprechendes drüber
liegendes Monitoring (inkl. Mail-Benachrichtigungen) konnte man mittels
"Server Monitor" konfigurieren.

Mit dem Aussortieren der xServes und Übernahme des Stabs durch die
"würdigen Nachfolger" Mini und MacPro "Server" hätte ich eigentlich
erwartet, daß Apple den hwmond an deren Hardware anpaßt (denn früher
konnte der nur mit xServes und sonst gar nix). Würdest Du mal bitte ein

sudo /usr/sbin/hwmond -t

absetzen und die Ausgabe posten (entweder nix oder "hwmond will NOT run
on this platform.").
Post by Marcus Jodorf
Mir ist vor ein paar Tagen erst eine defekte Platte im Mini Server
aus dem Raid gekippt und ich hab es glatt erst einen Tag später
gemerkt und das eher zufällig. Wie leider fast üblich, sind auch
Logging und Fehlermeldungen natürlich reichlich bescheiden und wenig
aufschlußreich.
Dem hwmond kann man ihm unbekannte Platten bzw. deren interessante
S.M.A.R.T.-Parameter in /etc/hwmond.SMART beibiegen. Loggen tut er nach
/var/log/hwmond.log und Monitoring beherrscht er zusammen mit dem
"Server Monitor"-Programm. Aber eben nur auf unterstützer Hardware.
Post by Marcus Jodorf
Also entweder entsprechende Überwachungssoftware nachkaufen
Suchbegriff diesbzgl.:

monitoring site:afp548.com
Post by Marcus Jodorf
oder halt selber schnell was stricken und ein passendes kleines Script
periodisch den Raid-Status checken lassen.
Suchbegriff diesbzgl.:

diskutil checkraid

(dito, um herauszubekommen, wie hakelig es sein könnte, ein degraded
RAID wieder aufzubauen)
Post by Marcus Jodorf
Raid nützt nichts, wenn Platten sich unbemerkt verabschieden können.
RAID nützt im Home- und SOHO-Umfeld fast nie was, wenn man nicht
konsequent an alle Single Points of Failure -- SPoF -- denkt.
Post by Marcus Jodorf
Insbesondere der Tausch einer Platte sollte narrensicher sein. Wer
kann da was zu beitragen?
Es gibt diverse NAS-Fertiglösungen, die man da durchaus ins Auge
fassen könnte.
Die dann wiederum für sich ein SPoF ist :-)

Gruss,

Thomas
Ingo Lembcke
2011-06-30 11:28:02 UTC
Permalink
Hallo,
Post by Thomas Kaiser
sudo /usr/sbin/hwmond -t
absetzen und die Ausgabe posten (entweder nix oder "hwmond will NOT run
on this platform.").
Ergibt bei meinem Macmini Server vorige Version mit Snow Leopard Server letzteres, also:
hwmond will NOT run on this platform.
Oh Mann, Apple.

Mfg,
Ingo Lembcke
--
Und eine deutsche Fehlermeldung
("Pfeife zerbrochen" oder ähnliches)
ist so richtig, richtig kontraproduktiv :-( aus de.comp.sys.mac.misc von Christian Kirsch
Hermann Schaefer
2011-07-03 22:42:06 UTC
Permalink
Post by Ingo Lembcke
Hallo,
Post by Thomas Kaiser
sudo /usr/sbin/hwmond -t
absetzen und die Ausgabe posten (entweder nix oder "hwmond will NOT run
on this platform.").
hwmond will NOT run on this platform.
Oh Mann, Apple.
bash-3.2# /usr/sbin/hwmond -t
hwmond will NOT run on this platform.

Mac Pro "Server" ebenfalls. Apple halt. Willkommen in der iCloud.
Thomas Kaiser
2011-07-04 06:31:14 UTC
Permalink
Post by Hermann Schaefer
[Thomas Kaiser wrote:]
Post by Thomas Kaiser
sudo /usr/sbin/hwmond -t
absetzen und die Ausgabe posten (entweder nix oder "hwmond will NOT run
on this platform.").
Ergibt bei meinem Macmini Server vorige Version mit Snow Leopard
Server letzteres, also: hwmond will NOT run on this platform.
Oh Mann, Apple.
bash-3.2# /usr/sbin/hwmond -t
hwmond will NOT run on this platform.
Mac Pro "Server" ebenfalls. Apple halt. Willkommen in der iCloud.
Wobei, ist ja eh wurscht, siehe die Meldungen bzgl. "hwmond" hier:

<http://groups.google.com/group/de.comp.sys.mac.misc/msg/7aa0b89ee50a42fc>

Man zieht eine Platte aus einem xServe und das erste, was crasht, ist
der hwmond, der für Monitoring und Meldung solcher Probleme zuständig
wäre. Sensationell! :-)

Gruss,

Thomas
Marcus Jodorf
2011-06-30 13:21:25 UTC
Permalink
Aber zumindest bei den xServes war auf Systemebene der hwmond
(<http://www.manpagez.com/man/8/hwmond/>) dafür zuständig, ein
Auge auf die Hardware zu werfen. Entsprechendes drüber liegendes
Monitoring (inkl. Mail-Benachrichtigungen) konnte man mittels
"Server Monitor" konfigurieren.
Ja, bei den Hardwareraids ist das so vorgesehen.
Dafür bekommt man bei OS X Server ja auch extra das Raid Admin Programm
mitgeliefert, womit man den ganzen Kram managen und vor allem u.a. auch
Überwachungsfunktionen konfigurieren kann.
Ignoriert Apple Softwareraid allerdings komplett.
sudo /usr/sbin/hwmond -t
absetzen und die Ausgabe posten (entweder nix oder "hwmond will NOT
run on this platform.").
Ergebnis:
hwmond will NOT run on this platform.
Dem hwmond kann man ihm unbekannte Platten bzw. deren interessante
S.M.A.R.T.-Parameter in /etc/hwmond.SMART beibiegen. Loggen tut er
nach /var/log/hwmond.log und Monitoring beherrscht er zusammen mit dem
"Server Monitor"-Programm. Aber eben nur auf unterstützer Hardware.
Mini Server gehört offensichtlich nicht dazu. Und sonstige normale Macs,
wo man mal Softwareraid evtl. betreiben will, sicherlich auch nicht.
diskutil checkraid
Jepp. Da reicht im einfachsten Fall ein kleines Script als cronjob
bzw. launchd-job, daß da kurz durchgrept und eine Mail schickt, fall
„degraded“ auftaucht.

Kein großes Ding - aber ich fand es doch reichlich erbärmlich, daß Apple
selber von Haus aus nicht mal in OS X Server einen Mechanismus hat, der
Laut gibt, wenn eine Platte abschmiert und das Softwarraid auseinander
fällt.
Damit hatte ich gar nicht gerechnet, entsprechend keine Vorkehrung
getroffen und dementsprechend nat. auch etwas verblüfft geschaut, daß
eine Platte kommentarlos schon seit Stunden verabschiedet war.

Da das auch nur meine private Spielekiste ist, war ich da auch nicht
so penibel, beim Setup alles zu checken und den Fehlerfall vorher
mal durchzuspielen.
Das Raid1 hab ich da eigentlich nur gebastelt, weil ich da nach dem Auspacken
mal kurz den Impuls hatte, das on-the-fly ohne Neuinstallation zu Raid1 zu
migrieren, nachdem ich Postings von tausend Hirnis in diversen Loserforen
gesehen hatte, die alle von Neuinstallation geschwafelt hatten, was ich mir
nicht vorstellen konnte. Also Spieltrieb.

Ich kann mir da jetzt aber durchaus vorstellen, daß so ein sterbendes
Raid an irgendwelchen SOHO Nebenbei-Admins (darauf ziehlt ja der Mini
Server u.a.) komplett vorbeigeht und denen das womöglich erst nach
Wochen auffällt, wenn sich auch die letzte Platte verabschiedet und das
System platt ist.

Denn im Grunde bekommt man das sonst nur mit, wenn man diskutil startet
und dort auf den Status des Raid schaut.
Post by Marcus Jodorf
Raid nützt nichts, wenn Platten sich unbemerkt verabschieden können.
RAID nützt im Home- und SOHO-Umfeld fast nie was, wenn man nicht
konsequent an alle Single Points of Failure -- SPoF -- denkt.
Klar. Aber schaden tut es selten und es kann wirklich nützlich sein.
Ich kann hier z.B. jetzt das hier tippen, obwohl eine der zwei Platten
in der Kiste fratze ist.
Die verbliebene wird hoffentlich durchhalten, bis die Nachfolger
nächste Woche endlich lieferbar sind. Spart mir also hoffentlich das
Backup-Gehampel, auf das ich ehrlich gesagt ganz gut verzichten kann.
Die dann wiederum für sich ein SPoF ist :-)
Klar. Aber angesichts des immerhin getriebenen und beschriebenen
Backup-Aufwandes halte ich das hier für verschmerzbar. Irgendwie muß man
ja auch immer Kosten/Nutzen abwägen und die Kirche im Dorf lassen.
Ein klein wenig Extraabsicherung mit verhältnismäßig kleinem Aufwand ist
IMHO völlig in Ordnung. Das wichtige ist ohnehin eine ordentliche
Backuplösung.

Persönlich würde ich in dem Falle hier eine noch relativ einfache
Softwareraidgeschichte vorziehen. Das bekommt man noch ganz gut
wieder schnell in Gang, ohne speziellere Ersatzhardware (Ersatz-NAS,
Raid-Controller) vorhalten zu müssen.


Gruß,

Marcus
Thomas Kaiser
2011-06-30 21:13:00 UTC
Permalink
Post by Marcus Jodorf
Aber zumindest bei den xServes war auf Systemebene der hwmond
(<http://www.manpagez.com/man/8/hwmond/>) dafür zuständig, ein Auge
auf die Hardware zu werfen. Entsprechendes drüber liegendes
Monitoring (inkl. Mail-Benachrichtigungen) konnte man mittels "Server
Monitor" konfigurieren.
Ja, bei den Hardwareraids ist das so vorgesehen.
Was für Hardware-RAIDs? Die Kasperl-Dinger im Käsereibe-Design, die sich
designverliebte Ahnungslose an ihre xServes gestöpselt haben?
Post by Marcus Jodorf
Ignoriert Apple Softwareraid allerdings komplett.
IIRC nein. Meine Kontakte mit xServes sind ja nun auch nicht allzu
ausgeprägt gewesen (bedingt dadurch, daß ich deren Existenzberechtigung
eigentlich nur darin sehe, _als Server_ Mac-Herden bzw. deren User
leichter administrieren zu können. Für *alles* andere gab's schon immer
sinnigere Alternativen abseits von Apple). Aber IIRC ging genau das da
eben schon auch und derlei Kram schlug sich in /var/log/hwmond.log
nieder. Tja, aber eben nur bei xServes, weil andere Hardware scheint der
hwmond nicht zu bedienen.
Post by Marcus Jodorf
Kein großes Ding - aber ich fand es doch reichlich erbärmlich, daß
Apple selber von Haus aus nicht mal in OS X Server einen Mechanismus
hat, der Laut gibt, wenn eine Platte abschmiert und das Softwarraid
auseinander fällt.
Verwirrt die Zielgruppe nur...
Post by Marcus Jodorf
RAID nützt im Home- und SOHO-Umfeld fast nie was, wenn man nicht
konsequent an alle Single Points of Failure -- SPoF -- denkt.
Klar. Aber schaden tut es selten und es kann wirklich nützlich sein.
Ach, das gilt nur dann, wenn man wirklich *echte* Erfahrung mit der
*konkreten* RAID-Implementierung hat. Ansonsten ist es nix weiter als
"gutes Gefühl" oder im "professionellen" Umfeld Absicherung nach oben
("macht man halt so"). Was ich schon für Gschiß mit RAIDs hatte, obwohl
Hardware-Schraddel seit locker einer Dekade gar nicht mehr meins ist...
unglaublich.

Da mach ich doch lieber fleißig Backup (was eh unumgänglich ist, weil
RAID exakt gar nix mit Datensicherheit zu tun hat) und klon mir die
Platte regelmäßig. Und wenn's dann rummst, dann startet man vom Klon und
spielt das Backup-Delta ein und gut ist (ein sinniges Partitionsschema
vorausgesetzt)

Gruss,

Thomas
Marcus Jodorf
2011-06-30 22:45:57 UTC
Permalink
Post by Thomas Kaiser
Was für Hardware-RAIDs? Die Kasperl-Dinger im Käsereibe-Design, die
sich designverliebte Ahnungslose an ihre xServes gestöpselt haben?
Sieht zumindest anhand der Grafiken in Raid Admin so aus - da ist auch
nur von xServes die Rede.
Post by Thomas Kaiser
Tja, aber eben nur bei xServes, weil andere Hardware scheint
der hwmond nicht zu bedienen.
Sieht ganz danach aus.
Post by Thomas Kaiser
Verwirrt die Zielgruppe nur...
Das ist jetzt recht zynisch. Ich möchte gar nicht wissen, wieviele kleine
Klitschen da Mac Minis o.ä. laufen haben und sich dann irgendwann wundern,
daß ihr tolles Raid tot ist und sie das hoffentlich vorhandene Backup
rauskramen müssen.
Post by Thomas Kaiser
Post by Marcus Jodorf
Klar. Aber schaden tut es selten und es kann wirklich nützlich sein.
Ach, das gilt nur dann, wenn man wirklich *echte* Erfahrung mit der
*konkreten* RAID-Implementierung hat.
Wenn's wichtiger ist, stell ich natürlich eine Linuxschüssel hin. Da
ist Softwareraid seit langen Jahren ziemlich bewährt und zuverlässig,
Überwachungs- und Testfunktionen sind kein Problem und in Sachen
Fehlermeldungen ist das auch kein Schwarzes Loch.

Und vor allem: Man kann ein vernünftiges Filesystem drauf packen.

Wichtigere Daten und HFS+ paßt einfach nicht zusammen.
Post by Thomas Kaiser
Ansonsten ist es nix weiter als "gutes Gefühl" oder im "professionellen"
Umfeld Absicherung nach oben ("macht man halt so"). Was ich schon für
Gschiß mit RAIDs hatte, obwohl Hardware-Schraddel seit locker einer
Dekade gar nicht mehr meins ist... unglaublich.
Ich kann mich da auch an etwas unschöne Episoden mit einigen Raid
Controllern vor langer Zeit erinnern. Aber mit (Linux-)Softwareraid
bin ich da bisher in überschaubaren Installationen zumindest ganz gut
gefahren.
Post by Thomas Kaiser
Da mach ich doch lieber fleißig Backup (was eh unumgänglich ist, weil
RAID exakt gar nix mit Datensicherheit zu tun hat) und klon mir die
Platte regelmäßig. Und wenn's dann rummst, dann startet man vom Klon und
spielt das Backup-Delta ein und gut ist (ein sinniges Partitionsschema
vorausgesetzt)
Ich seh es einfach als Zusatzschicht mit potentiellem Zugewinn. Wenn es
im Fehlerfall wie geplant funktioniert (und das tut es realistisch
betrachtet meistens): Prima.
Sonst halt Backup an den Start bringen und Pech gehabt und Zeit
verloren.
Beim Mini o.ä. mit den läppischen 500er Platten spielt das auch ohnehin
alles keine Rolle. Da sind alle Daten schnell wieder drauf.

Gruß,

Marcus
Thomas Kaiser
2011-07-01 06:39:36 UTC
Permalink
Post by Marcus Jodorf
Post by Thomas Kaiser
Verwirrt die Zielgruppe nur...
Das ist jetzt recht zynisch. Ich möchte gar nicht wissen, wieviele
kleine Klitschen da Mac Minis o.ä. laufen haben und sich dann
irgendwann wundern, daß ihr tolles Raid tot ist und sie das
hoffentlich vorhandene Backup rauskramen müssen.
Dann lernen sie halt auf die harte Tour, daß RAID nix mit
Datensicherheit zu tun hat und daß man gewisse Aufgaben von Fachleuten
erledigen läßt. In dem Kontext nämlich ganz wichtig: Nicht nur das
nötige Wissen ist essentiell sondern auch _Erfahrung_. Und die kriegst
Du als "Normaluser" nur, indem andauernd was schiefgeht. Viel Spaß.
Post by Marcus Jodorf
Post by Thomas Kaiser
Ach, das gilt nur dann, wenn man wirklich *echte* Erfahrung mit der
*konkreten* RAID-Implementierung hat.
Wenn's wichtiger ist, stell ich natürlich eine Linuxschüssel hin.
Du vielleicht, weil Du Dich damit auskennst und das schon zigmal gemacht
hast. Ich würde auch auf Software-RAID setzen (halt in jedem Fall
irgendwas, wo ich nicht wieder von einem Controller oder sonst einem
Unikat abhängig bin, das mir die Idee hinter RAID -- Datenverfügbarkeit
-- vernichtet, wenn's dann kaputt geht und ich zwar intakte Platten aber
keine Chance mehr habe, auf den Inhalt derselben zuzugreifen).

Nach all den Dramen, die ich in den letzten 2 Dekaden damit schon selbst
(bzw. irgendwie verantwortlich in Festanstellung) oder bei anderen (als
Dienstleister, der davon gehört hat oder teils auch den Karren aus dem
Dreck ziehen durfte) hatte, ist das für mich ein Thema, das man entweder
gleich meidet (weil's eh nix bringt) oder in die Hände von Fachleuten
legt.

Oder man steht halt auf so Erkenntnisse, daß alle Theorie grau ist und
die Praxis dann im eigenen Fall ganz anders aussieht. Bei einem
Software-RAID alles nicht so wild, _solange_ das klaglos funktioniert.
Aber herauszufinden, ob's wirklich klaglos funktioniert, ist nochmal die
andere Sache. V.a. ohne Erfahrung mit der Thematik.

Gruss,

Thomas, hatte sich eigentlich fest vorgenommen, nie wieder an RAID-
Diskussionen teilzunehmen, weil eh sinnlos...
Hermann Schaefer
2011-07-03 22:45:06 UTC
Permalink
Post by Thomas Kaiser
Nach all den Dramen, die ich in den letzten 2 Dekaden damit schon selbst
(bzw. irgendwie verantwortlich in Festanstellung) oder bei anderen (als
Dienstleister, der davon gehört hat oder teils auch den Karren aus dem
Dreck ziehen durfte) hatte, ist das für mich ein Thema, das man entweder
gleich meidet (weil's eh nix bringt) oder in die Hände von Fachleuten
legt.
Du meinst so Sachen wie Firmwareupdate auf xraid, *fopp* , Daten weg, 5-stellig
für Datenrettung löhnen.. ^^
Thomas Kaiser
2011-07-04 05:44:22 UTC
Permalink
Post by Hermann Schaefer
Post by Thomas Kaiser
Nach all den Dramen, die ich in den letzten 2 Dekaden damit schon
selbst (bzw. irgendwie verantwortlich in Festanstellung) oder bei
anderen (als Dienstleister, der davon gehört hat oder teils auch den
Karren aus dem Dreck ziehen durfte) hatte, ist das für mich ein
Thema, das man entweder gleich meidet (weil's eh nix bringt) oder in
die Hände von Fachleuten legt.
Du meinst so Sachen wie Firmwareupdate auf xraid, *fopp* , Daten weg,
5-stellig für Datenrettung löhnen.. ^^
Zum Beispiel (kenn ich aber nicht, da diese komischen xServe RAIDs nur
bei einem Design-verliebten Kunden je aufgetaucht sind).

Aber einfach so Sachen wie daß ein RAID nicht mehr starten will, weil
die "Hot Spare" angeblich defekt sei (das RAID also seine Existenz-
Berechtigung "Datenverfügbarkeit" ad absurdum führt: Alle Platten sind
OK, alle Daten sind da: Nur der RAID-Controller fiept und blinkt und
erlaubt keinen Zugriff mehr)

Oder daß nach einem Controller-Wechsel (schleichend defekt gegangen, was
Datenkorrumption über mehrere Monate mit sich zog) das RAID neu
initialisiert werden muß, weil die neuere Controller-Revision mit den
Metadaten auf den Platten nix mehr anfangen wollte. Etc. pp. -- hatten
wor hier alles schon in epischer Breite, wozu also nochmal schreiben?

<http://groups.google.com/group/de.comp.sys.mac.misc/msg/80bec196a41a7f6b>

Apples Software-RAID-Implementierung v.a. in Geschmacksrichtung "Mirror"
weist erfreulicherweise viele dieser Design-Fehler bzw. -Fallen _nicht_
auf, einfach weil eine einzelne Platte, die man aus 'nem Mirror
rausnimmt, praktischerweise ohne irgendwelche Modifikationen läuft und
man auch jederzeit mittels "diskutil addToRAID" wieder einen neuen
Mirror draus machen kann. Aber auch das birgt Unwägbarkeiten, die
wiederum _im Detail_ lauern (bspw. weil man ein MacOS X Upgrade gemacht
hat und die Funktionalität des GUIs besch***en, die von diskutil zwar
ausreichend aber (noch) falsch dokumentiert ist. Alles schon gehabt,
siehe Thread rund um

<http://groups.google.com/group/de.comp.sys.mac.misc/msg/afc63ce0b6d02ad3>

Vom fehlenden Monitoring abseits xServes, das *essentiell* ist, mal ganz
abgesehen (wer RAID ohne stete pro-aktive Überwachung spielt, hat halt
leider auch nur ganz massiv einen an der Klatsche).

Gruss,

Thomas
Hermann Schaefer
2011-07-04 06:53:22 UTC
Permalink
Post by Thomas Kaiser
Post by Hermann Schaefer
Du meinst so Sachen wie Firmwareupdate auf xraid, *fopp* , Daten weg,
5-stellig für Datenrettung löhnen.. ^^
Zum Beispiel (kenn ich aber nicht, da diese komischen xServe RAIDs nur
bei einem Design-verliebten Kunden je aufgetaucht sind).
Miterlebt, zum Glück nicht verantwortlich.. :D
Apples Statement: Spielen sie bitte Ihr Backup zurück.
Klar, Apple hat schon irgendwie Recht, wer ein Update fährt, sollte vorher ein
Backup machen. Aber welchem Endkunden mit Adminallüren ist das schon klar? Das
Update "klang" nach nichts besonderem, so Ecke 1.x aud 1.x.1 oder sowas, weiß
nicht mehr.
Post by Thomas Kaiser
Vom fehlenden Monitoring abseits xServes, das *essentiell* ist, mal ganz
abgesehen (wer RAID ohne stete pro-aktive Überwachung spielt, hat halt
leider auch nur ganz massiv einen an der Klatsche).
Da mag ich dann die Beeper, die man auch außerhalb des Serverraums wahrnimmt.. ;)

Auch grade erst erlebt: RAID5, Platte geht kaputt, Spare springt ein, braucht
aber lange und zwischenzeitlich kippt die nächste Platte weg.. Ich versuche auch
seit Jahren den Leuten klarzumachen, daß ein RAID nichts mit Datensicherheit,
sondern nur mit möglicher Uptime zu tun hat. Aber da redet man oft gegen Wände.
Dicke Wände.
Goetz Hoffart
2011-07-04 07:22:20 UTC
Permalink
Post by Hermann Schaefer
Klar, Apple hat schon irgendwie Recht, wer ein Update fährt, sollte vorher
ein Backup machen. Aber welchem Endkunden mit Adminallüren ist das schon
klar? Das Update "klang" nach nichts besonderem, so Ecke 1.x aud 1.x.1
oder sowas, weiß nicht mehr.
Das Problem ist ja weniger ein Backup _haben_, als wie lange das
Rückeinspielen von 0 an dauert. Nicht jeder hat großzügige
Wartungsfenster in der Nacht oder am WoE.

Grüße
Götz
--
http://www.knubbelmac.de/
Hermann Schaefer
2011-07-04 07:43:06 UTC
Permalink
Post by Goetz Hoffart
Post by Hermann Schaefer
Klar, Apple hat schon irgendwie Recht, wer ein Update fährt, sollte vorher
ein Backup machen. Aber welchem Endkunden mit Adminallüren ist das schon
klar? Das Update "klang" nach nichts besonderem, so Ecke 1.x aud 1.x.1
oder sowas, weiß nicht mehr.
Das Problem ist ja weniger ein Backup _haben_, als wie lange das
Rückeinspielen von 0 an dauert. Nicht jeder hat großzügige
Wartungsfenster in der Nacht oder am WoE.
Selbst schuld - kann man da nur sagen, außer des geht um Fileserver im
Petabyte-Bereich. Der Einwand klingt sehr nach SANs mit zig VMs/ESX drauf. Nicht
jede günstige Lösung ist halt auch die beste.. Wer Ausfallzeiten nicht
verkraften kann, der sollte den VM-Kram nur einsetzen, wenn er entsprechend
geplant ist und Failoversysteme bereitstehen. Betrieben mit 24/7 muss das
klargemacht werden, sonst fallen die im worst case auf die Nase. Ich seh
inzwischen viele VM-Lösungen rumstehen, bei denen zwar eine der Kisten
kaputtgehen darf, aber seltsamerweise die SAN-Teile wohl als unkaputtbare
Zauberkisten angesehen werden. Dann fällt halt nicht nur eine Kiste aus, sondern
gleiche x VMs und der Laden steht.
Goetz Hoffart
2011-07-04 09:43:03 UTC
Permalink
Post by Hermann Schaefer
Der Einwand klingt sehr nach SANs mit zig VMs/ESX drauf. Nicht
jede günstige Lösung ist halt auch die beste..
Nein. Der Einwand klingt eher danach, dass man Wochenends oder Nachts
noch was anderes zu tun hat, als tar, dump oder dd oder Bakbone beim
kopieren von Band auf Platte zuzusehen.

Grüße
Götz
--
http://www.knubbelmac.de/
Başar Alabay
2011-07-04 10:13:56 UTC
Permalink
Post by Goetz Hoffart
Der Einwand klingt eher danach, dass man Wochenends oder Nachts
noch was anderes zu tun hat, als tar, dump oder dd oder Bakbone beim
kopieren von Band auf Platte zuzusehen.
… als Nerd?! 8-)

B. Alabay
Başar Alabay
2011-07-04 08:33:53 UTC
Permalink
Das Problem ist ja weniger ein Backup_haben_, als wie lange das
Rückeinspielen von 0 an dauert.
Oh jaaa … ;-)

B. Alabay
Thomas Kaiser
2011-07-04 07:48:01 UTC
Permalink
Post by Hermann Schaefer
Post by Thomas Kaiser
Post by Hermann Schaefer
Du meinst so Sachen wie Firmwareupdate auf xraid, *fopp* , Daten
weg, 5-stellig für Datenrettung löhnen.. ^^
Zum Beispiel (kenn ich aber nicht, da diese komischen xServe RAIDs
nur bei einem Design-verliebten Kunden je aufgetaucht sind).
Miterlebt, zum Glück nicht verantwortlich.. :D
Apples Statement: Spielen sie bitte Ihr Backup zurück.
Klar, Apple hat schon irgendwie Recht, wer ein Update fährt, sollte
vorher ein Backup machen.
Naja, aber irgendwie zeigt das doch, daß man _solche_ RAID-
Implementierungen einfach nicht will, weil sie den tieferen Sinn des
Ganzen irgendwie karikieren. Ich mein, was soll das? RAID ist zur
Sicherstellung von Datenverfügbarkeit gedacht. Dann spiel ich ein
Firmware-Update ein und muß entweder vorher die Daten einmal komplett
irgendwohin klonen/syncen (aber wohin, wenn es ein fettes RAID ist und
man nicht eben mal was Zweites "auf Halde" hat, das normal ungenutzt
rumsteht --> klarer Fall für Systemhaus, das bei solchen Aktionen ein
für 'nen anderen Kunden geshopptes RAID einbringen kann. Und das sogar
sinnvoll als Test respektive "Einfahren") oder anschließend zeitraubend
ein Backup einspielen. Das kann's doch nicht sein?

Überhaupt dieses Rumgezicke mit Firmwares, sobald's proprietäres
Hardware-RAID ist. Kann mich noch gut an die Wutausbrüche eines Spezls
erinnern, der bei 'nem Kunden in 'nem RAID 48 750er gegen 1,5TByte-
Platten ersetzt hat. Nur um dann festzustellen, daß die Firmware des
Controllers die der neuen Platten nicht so wirklich mochte. Abhängig von
Mondstand oder sonstwas, das keiner je nachvollziehen konnte.

Praktischerweise hat der Controller nie nur eine Platte rausgeschmissen
sondern immer gleich im Rudel. Und ab der dritten Platte war's das dann
immer gewesen... trotz RAID-6 bzw. double Parity.

Und die "Lösung" laut RAID-Hersteller: Firmware-Upgrade... der Platten.
Also PC gekauft (reine Unix-/Mac-Infrastruktur gewesen), nacheinander 50
Platten reingesteckt und von DOS-Floppy aus Firmware geflasht. Hurra!
Post by Hermann Schaefer
Post by Thomas Kaiser
Vom fehlenden Monitoring abseits xServes, das *essentiell* ist, mal
ganz abgesehen (wer RAID ohne stete pro-aktive Überwachung spielt,
hat halt leider auch nur ganz massiv einen an der Klatsche).
Da mag ich dann die Beeper, die man auch außerhalb des Serverraums wahrnimmt.. ;)
Bringt auch nicht immer was. In meiner vorletzten Festanstellung standen
die RAIDs sogar mitten in einem Rack in der Produktion. Und die Beeper
waren gesundheitsschädlich laut. Aber: Sommer, Wochenende, Klimaanlage
fällt aus --> Temperatur steigt, Beeper piepsen um ihr Leben, entnervte
Nachbarn stopfen Bettwäsche in die Fenster, die auf Kipp standen. Montag
früh: Beeper fiepen immer noch. Nur wozu? In der Saunalandschaft gab's
weit und breit keine Daten mehr, um derentwillen man noch angstvoll
fiepen hätte könnte, weil über die Hälfte der Platten bereits den
Hitzetod gestorben war.
Post by Hermann Schaefer
Auch grade erst erlebt: RAID5, Platte geht kaputt, Spare springt ein,
braucht aber lange und zwischenzeitlich kippt die nächste Platte weg..
Ich versuche auch seit Jahren den Leuten klarzumachen, daß ein RAID
nichts mit Datensicherheit, sondern nur mit möglicher Uptime zu tun
hat. Aber da redet man oft gegen Wände. Dicke Wände.
Analog zu kleine Kinder und Herdplatte. Kannste Dir den Mund fusselig
reden, wie Du willst. Der Lerneffekt tritt erst kurz nach Berühren der
Platte ein. Als verantwortungsvoller Elter kontrolliert man halt die
Situation, damit das Verhältnis Lerneffekt zu Schaden ideal ausfällt.
Könnte man sich als ITler evtl. auch überlegen, mit "kontrolliertem
Datenverlust" zu arbeiten, damit das Thema _rechtzeitig_ und _sinnvoll_
angegangen wird und nicht erst, wenn der Laden fast hopps geht, weil
fast alles an Unternehmensdaten futsch ist.

Gruss.

Thomas
Hermann Schaefer
2011-07-04 12:51:00 UTC
Permalink
Post by Thomas Kaiser
Naja, aber irgendwie zeigt das doch, daß man _solche_ RAID-
Implementierungen einfach nicht will, weil sie den tieferen Sinn des
Ganzen irgendwie karikieren. Ich mein, was soll das? RAID ist zur
Sicherstellung von Datenverfügbarkeit gedacht. Dann spiel ich ein
Firmware-Update ein und muß entweder vorher die Daten einmal komplett
irgendwohin klonen/syncen (aber wohin, wenn es ein fettes RAID ist und
man nicht eben mal was Zweites "auf Halde" hat, das normal ungenutzt
rumsteht --> klarer Fall für Systemhaus, das bei solchen Aktionen ein
für 'nen anderen Kunden geshopptes RAID einbringen kann. Und das sogar
sinnvoll als Test respektive "Einfahren") oder anschließend zeitraubend
ein Backup einspielen. Das kann's doch nicht sein?
Jein. Wenn es um Geschwindigkeit geht - und um schiere Masse an Daten - bleibt
kaum eine vernünftige Alernative zu Hardware-RAIDs. Aber - und das sollte dem
Kunden auch gesagt werden: Ob eine spätere Aufrüstung ohne Ausfallzeiten und
viel Arbeit machbar ist, muss als unsicher bis unwahrscheinlich klar und
deutlich angesagt werden. Außerdem nur Platten verbauen, die vom Hersteller
getestet und zugelassen sind und die Teile brauchen eh einen adäquaten
Vor-Ort-Service mit Austausch über die gesammte Nutzungszeit.
Ist der Vertrag ausgelaufen, steigt halt das Risiko eines Komplettausfalls mit
entsprechender Ausfallzeit radikal an. Und das ganze am besten schriftlich
fixieren. Und immer wieder daran erinnern.
Post by Thomas Kaiser
Und die "Lösung" laut RAID-Hersteller: Firmware-Upgrade... der Platten.
Also PC gekauft (reine Unix-/Mac-Infrastruktur gewesen), nacheinander 50
Platten reingesteckt und von DOS-Floppy aus Firmware geflasht. Hurra!
Kenn ich gut.. ^^
Aber mal von RAIDs abgesehen - auch Festplattenhersteller bringen immer mal
wieder Updates raus - aber wer spielt die schon ein? Vor allem, wenn nur auf
Diskette und die Server nicht mal mehr ein CD-Laufwerk haben? Da kann man dann
wieder USB-Gefrickel anwerfen in der Hoffnung, im BIOS die passenden
Einstellungen zu finden. Und Macs? Da geht eh nix, ausbauen.
Post by Thomas Kaiser
Post by Hermann Schaefer
Da mag ich dann die Beeper, die man auch außerhalb des Serverraums wahrnimmt.. ;)
Bringt auch nicht immer was. In meiner vorletzten Festanstellung standen
die RAIDs sogar mitten in einem Rack in der Produktion. Und die Beeper
waren gesundheitsschädlich laut. Aber: Sommer, Wochenende, Klimaanlage
fällt aus --> Temperatur steigt, Beeper piepsen um ihr Leben, entnervte
Nachbarn stopfen Bettwäsche in die Fenster, die auf Kipp standen. Montag
früh: Beeper fiepen immer noch. Nur wozu? In der Saunalandschaft gab's
weit und breit keine Daten mehr, um derentwillen man noch angstvoll
fiepen hätte könnte, weil über die Hälfte der Platten bereits den
Hitzetod gestorben war.
Och, es gibt auch Firmen, in denen der Serveraum immer zu ist und den Leuten
tagelang nicht auffällt, daß da drin alle Lüfter amok laufen weil >45°C.. Da
wurden immerhin rund 10 FSC-Kisten, 2 Suns, mehrere Dell und noch ein paar
weitere Kisten überhört. Dagegen klingt eine wilde Horde Putzfrauen mit
Industriesaugern wie ein leises Lüftchen im Wald..
Aber Schränke mit Temperaturüberwachung kosten halt Geld..
Post by Thomas Kaiser
Könnte man sich als ITler evtl. auch überlegen, mit "kontrolliertem
Datenverlust" zu arbeiten, damit das Thema _rechtzeitig_ und _sinnvoll_
angegangen wird und nicht erst, wenn der Laden fast hopps geht, weil
fast alles an Unternehmensdaten futsch ist.
Früher dachte ich immer, daß die Chefs nach Ausfällen einen Lerneffekt zeigten.
Tun sie nicht. Sowas wird ins Kurzzeitgedächtnis abgekippt und ist nach wenigen
Monaten wieder vergessen. Ich hab's aufgegeben, da hilft nur nerven, nerven,
nerven und für die Kunden mitdenken. Leider. Merkt man immer wieder bei
Stromausfällen und fehlenden USV. Jedes Jahr einmal? Kein Problem, wird komplett
ignoriert. Daß große Dateisysteme u.U. laaaaange brauchen, bis die wieder mal
gemountet werden und in der Zeit keine Sau arbeiten kann - jaja, wird halt
hingenommen. Bisher immer gutgegangen, ohne nennenswerte Datenverluste.
Eigentlich ein Wunder, gerade bei Exchange, SQL & Co. Einige Angebote für USV
hab ich seit >10 Jahren auf Wiedervorlage..
Patrick Kormann
2011-07-04 13:14:38 UTC
Permalink
Post by Hermann Schaefer
Früher dachte ich immer, daß die Chefs nach Ausfällen einen Lerneffekt
zeigten. Tun sie nicht. Sowas wird ins Kurzzeitgedächtnis abgekippt und
ist nach wenigen Monaten wieder vergessen. Ich hab's aufgegeben, da
hilft nur nerven, nerven, nerven und für die Kunden mitdenken. Leider.
Merkt man immer wieder bei Stromausfällen und fehlenden USV. Jedes Jahr
einmal? Kein Problem, wird komplett ignoriert. Daß große Dateisysteme
u.U. laaaaange brauchen, bis die wieder mal gemountet werden und in der
Zeit keine Sau arbeiten kann - jaja, wird halt hingenommen. Bisher immer
gutgegangen, ohne nennenswerte Datenverluste. Eigentlich ein Wunder,
gerade bei Exchange, SQL & Co. Einige Angebote für USV hab ich seit >10
Jahren auf Wiedervorlage..
Kann ich irgendwie schon verstehen. Hier in Spanien sind USVs ein Muss,
aber damals in der Schweiz? Da hatte ich mehr Ausfälle durch
kaputte/durch abstürztende USVs als echte Stromausfälle.

Joern Bredereck
2011-07-03 15:37:36 UTC
Permalink
Post by Thomas Kaiser
Ach, das gilt nur dann, wenn man wirklich *echte* Erfahrung mit der
*konkreten* RAID-Implementierung hat. Ansonsten ist es nix weiter als
"gutes Gefühl" oder im "professionellen" Umfeld Absicherung nach oben
("macht man halt so"). Was ich schon für Gschiß mit RAIDs hatte, obwohl
Hardware-Schraddel seit locker einer Dekade gar nicht mehr meins ist...
unglaublich.
YMMV, aber ich finde es etwas gefährlich, diese Erfahrungen als
gemeingültigen Fakt darzustellen. Ich bin momentan für etwa 150 Server
zuständig. Jeder davon hat entweder ein Software- oder ein
Hardware-Raid. Statistische geht alle 2 Wochen in einem der Server eine
Platte kaputt. Und jedes mal kann der Kunden anschließend erstmal
ungestört weiterarbeiten und ich habe genug Zeit die defekte Platte (im
Idealfall ohne Downtime) zu wechseln.

Ohne RAID dürfte ich statistisch alle 2 Wochen einem Kunden erklären,
warum seine Angestellten nicht mehr arbeite konnten und warum er jetzt
das Daten-Delta zwischen dem letzten Backup und dem Zeitpunkt des
Crashes verloren hat.
Post by Thomas Kaiser
Da mach ich doch lieber fleißig Backup (was eh unumgänglich ist, weil
RAID exakt gar nix mit Datensicherheit zu tun hat) und klon mir die
Platte regelmäßig. Und wenn's dann rummst, dann startet man vom Klon und
spielt das Backup-Delta ein und gut ist (ein sinniges Partitionsschema
vorausgesetzt)
Selbst wenn du deine Backups im Stunden-Rhythmus machst, hast du
anschliessend erstmal alle Daten verloren, die zwischem dem Backup und
dem Crash angefallen sind. Je nachdem wieviele Daten in dem Zeitraum
anfallen, kann das ganz schön schmerzlich sein.

VG,

Jörn
Loading...