RAID

Aus VDR Wiki
Wechseln zu: Navigation, Suche

Redundand Array of (Inexpensive|Independend) Disks

Inhaltsverzeichnis

Grundsätzliches

Dient dazu, um mehrere Physikalische Festplatten (ggf. auch einzelne Partitionen) zu einem logischen Laufwerk zusammenzufassen.

RAID kann als Hardware oder als Software realisiert werden.

Es sind verschiedene RAID-Level definiert:

JBOD

Just a bunch of disks

Exportiert die angeschlossenen Platten als Einzelplatten ohne RAID-Funktionalität. D.h. man kann auch einzelne Platten dem Betriebssystem gegenüber "anmelden". Dies können die meisten, nicht aber alle richtigen RAID-Controller.

linear RAID

  • Mindestzahl HDD: 2, auch ungleiche Größen
  • Redundanz: Nein
  • Geschwindigkeit: unverändert
  • Besonderheiten: Deutlich höhere Ausfallwahrscheinlichkeit

Die Daten werden sequentiell (=hintereinander) auf die beteiligten Festplatten geschrieben. Zuerst wird Platte 1 gefüllt, dann Platte 2 usw. Logisch erscheinen diese als ein Laufwerk.

Nachteil ist, daß kein Geschwindigkeitsvorteil auftritt. Bei Ausfall einer der Festplatten kann man mit etwas Geschick die Daten, die auf den anderen Festplatten gespeichert sind, noch retten.

RAID 0

  • Mindestzahl HDD: 2, gleiche Größe
  • Redundanz: Nein
  • Geschwindigkeit: Lesen: ca. 2x schneller Schreiben: ca. 2x schneller
  • Besonderheiten: Deutlich höhere Ausfallwahrscheinlichkeit

Die Daten werden blockweise auf die beteiligten Festplatten verteilt. Dadurch muß der Computer nicht darauf warten, bis die Festplatte einen Block geschrieben hat, sondern kann gleich den nächsten Block auf die nächste Platte schreiben. Beim Lesen umgekehrt.

Nachteil ist jedoch, daß bei Ausfall einer der beteiligten Platten das komplette RAID komplett zerstört ist, da von einer darauf gespeicherten Datei jeder 2. (bzw. 3. usw.) Block fehlt. Eine Datenrettung ist unmöglich.

RAID 1

  • Mindestzahl HDD: 2, gleiche Größe
  • Redundanz: Ja
  • Geschwindigkeit: Lesen: ca. 2x schneller Schreiben: unverändert
  • Besonderheiten: Redundanz, verbunden mit guter Lesegeschwindigkeit, dafür Platzverbrauch

Die Daten werden auf den beteiligten Festplatten identisch abgespeichert. Ein Block wird beim Schreiben also verdoppelt (verdreifacht...) und auf alle beteiligten Platten geschrieben. Beim Lesen kann nun so verfahren werden wie bei RAID 0.

Nachteil ist, daß sehr viel Festplattenplatz "verschenkt" wird. Man hat je nach Anzahl der Platten nur 50% (33%...) des gesamten Speicherplatzes zur Verfügung.

Vorteil ist die Redundanz des Systems. Bei Ausfall einer Festplatte liegen die Daten immer noch auf den anderen. Man kann weiterarbeiten und eine neue Festplatte einsetzen, die sich dann wieder neu synchronisiert.

RAID 2

  • Wird nicht verwendet

RAID 3

  • Wird nicht verwendet

RAID 4

  • Wird nicht verwendet

RAID 5

  • Mindestanzahl HDD: 3, gleiche Größe (Sollte nicht, aber kann aber auch mit unterschiedlich großen Platten erstellt werden)
  • Redundanz: Ja (eine Platte kann ausfallen)
  • Geschwindigkeit: Lesen: ca. 2x schneller, Schreiben: je nach System, im allgemeinen schneller als eine einzelne Platte
  • Besonderheiten: Redundanz, verbunden mit guter Lesegeschwindigkeit, weniger Platzverbrauch

Die Blöcke werden mit einer logischen Operation (üblicherweise XOR) verknüpft, der Ergebnisblock wird zusätzlich auf dem Array gespeichert. Beim Lesen kann nun so verfahren werden wie bei RAID 0.

Nachteil ist, dass der Schreibzugriff deutlich langsamer ist, da zuerst der Paritätsblock berechnet und gespeichert werden muss. Mit steigender Anzahl der Festplatten steigt die Speicherplatzeffiziens. Man verschenkt immer genau eine Platte.

Vorteil ist die Redundanz des Systems. Bei Ausfall einer Festplatte liegen die Daten immer noch auf den anderen. Man kann weiterarbeiten und eine neue Festplatte einsetzen, die sich dann wieder neu synchronisiert.

Dort, wo es nicht unbedingt auf schnellste Schreibzugriffe ankommt, ist RAID5 eine sehr gute Wahl.

RAID 6

  • Mindestzahl HDD: 4, gleiche Größe
  • Redundanz: Ja (2 Platten können ausfallen)
  • Geschwindigkeit: Lesen: schneller Schreiben: schneller, je nach System
  • Besonderheiten: Redundanz, verbunden mit guter Lesegeschwindigkeit, weniger Platzverbrauch, sehr aufwendige Berechnung fast nur mit Hardware möglich.

Der Vorteil bei RAID 6 ist, daß ZWEI Platten ausfallen dürfen. Da die Platten nach dem Austausch einer Platte während des Resyncs stark belastet sind, kann es sein daß eine weitere Platte ausfällt. Dies führt dann nicht zur Zerstörung des Arrays.

RAID 10 und andere Kombinationen

Man kann die einzelnen RAID-Level auch kombinieren, um so weitere Steigerungen der Geschwindigkeit und/oder Ausfalltollernaz zu erreichen. Hier ein Beispiel für RAID 10, durchaus üblich sind auch die Varianten RAID50 oder RAID01.

  • Mindestzahl HDD: 4, jeweils zwei gleiche Größe
  • Redundanz: Ja (2 Platten können ausfallen)
  • Geschwindigkeit: Lesen: deutlich schneller Schreiben: deutlich schneller
  • Besonderheiten: Zwei RAID1 Systeme werden zu einem RAID0 zusammengeschaltet. Fällt eine Platte aus, kann eine zweite ausfallen, sofern diese nicht im gleichen RAID1 ist.

Software RAID unter Linux

Kernel-Voraussetzungen

Der Kernel muß die Unterstützung für MD und RAID sowie für die verwendete RAID-Level beinhalten.

mdtools

Die unter Linux realiserte Software-RAID Lösung nennt sich mdtools (md=MultipleDisks). Zuerst muß eine Konfigurationsdatei /etc/raidtab erstellt werden. Diese Datei wird ausschließlich beim Erstellen des Raid-Devices benötigt. Wenn man den "persistent-superblock" verwendet, ist der Inalt dieser Datei später uninteressant- sie muß aber dennoch existieren! Selbstverständlich ist es dennoch zu empfehlen, diese Datei stets mit dem Raid abzugleichen, um im Fehlerfall besser reagieren zu können.

Beispiel:

# Beispiel für RAID0 mit drei Festplatten
raiddev /dev/md0
       raid-level              0
       nr-raid-disks           3
       persistent-superblock   1
       chunk-size              32
       device                  /dev/sda5
       raid-disk               0
       device                  /dev/sdb
       raid-disk               1
       device                  /dev/sdc5
       raid-disk               2
# Beispiel für RAID1 mit drei Festplatten
raiddev /dev/md1
       raid-level              1
       nr-raid-disks           3
       persistent-superblock   1
       chunk-size              32
       device                  /dev/hda5
       raid-disk               0
       device                  /dev/hdb5
       raid-disk               1
       device                  /dev/hdc5
       raid-disk               2


# Beispiel für RAID5 mit drei Festplatten
raiddev /dev/md1
       raid-level              5
       nr-raid-disks           3
       persistent-superblock   1
       chunk-size              32
       device                  /dev/sdd5
       raid-disk               0
       device                  /dev/sde5
       raid-disk               1
       device                  /dev/sdf5
       raid-disk               2


Anschließend können die Arrays mit mkraid /dev/md0 angelegt werden. Danach kann man das Array formatieren (z.B. mkreiserfs /dev/md0) und verwenden (mount /dev/md0 /video0).

Eine nachträgliche Vergrößerung bzw. Verkleinerung ist nicht vorgesehen. Es gibt zwar die Möglichkeit mittels dem Programm mdadm, ist aber mit Risiko verbunden. Hier bietet sich dann eher ein LVM an.

Hardware RAID unter Linux

Alternativ ist es möglich, einen speziellen Hardware-RAID-Controller einzusetzen. Beispiele für unter aktuellen Kernel-Versionen (>=2.6.10) gut unterstützte Controller sind die Modelle der Serie 8xxx von 3ware sowie die MegaRAID-Serie (150-4|6) von LSI Logic (früher Symbios bzw. NCR). Solche Adapter, die preislich meist zwischen 200 und 500 EUR angesiedelt sind, sollten keinesfalls mit den sogenannten FakeRAID-Controllern verwechselt werden, wie sie heute auf vielen Motherboards bereits vorhanden sind. Sie unterscheiden sich von diesen durch eine eigene CPU sowie durch auf dem Controller befindlichen Arbeits- bzw. Cache-Speicher. Gegenüber dem Kernel präsentieren sich solche Controller als einfacher SCSI-Controller, der dann je angelegtem RAID-Volume eine virtuelle SCSI-Festplatte emuliert. Da der Kernel nichts vom RAID wissen muss, sind solcher Controller ohne besondere Maßnahmen bootfähig.

Vorteile gegenüber einem Linux-Software-Raid

  • Checksummenberechnung (RAID5) läuft ohne Belastung der CPU ab
  • keine inkonsistenten Daten nach einem Betriebssystem-Crash
  • keine inkonsistenten Daten nach einem Stromausfall, sofern eine meist optional erhältliche Battery Backup Unit (BBU) verwendet wurde (kleine Aufsatzsteckkarte für den RAID-Controller)
  • meist deutlich bessere Performance, speziell bei Verwendung eines entsprechenden Server-Mainboards mit hinreichender PCI-Bandbreite
  • in der SATA-Version hotplug-fähig -> Plattentausch ohne Reboot/Herunterfahren des Systems
  • keinerlei manueller Verwaltungsaufwand, Adminsitration der Volumes meist menugeführt per Controller-BIOS oder spezieller Linux-Software


Links