Storage einmal anders betrachtet

Der steigende Bedarf, immer größere Mengen unstrukturierter Daten bewältigen zu können, hat neuartige Speicherkonzepte hervorgebracht, die sich deutlich von derzeit bekannten Storage Systemen unterscheiden. Ursprünglich für Video-, Audio- und Bilddateien entwickelte Storage­architekturen ermöglichen heute Lösungen, die sich durch hohe Skalierbarkeit und einfache Administrierbarkeit auszeichnen. Und das auch abseits ihrer ursprünglichen Einsatzgebiete.

Clustered Storage ist ein homogener Speicherverbund, dessen Durchsatz und Kapazität linear mit der Anzahl der Storage Nodes anwächst.
Clustered Storage ist ein homogener Speicherverbund, dessen Durchsatz und Kapazität linear mit der Anzahl der Storage Nodes anwächst.

Herkömmliche NAS- und SAN-Speichersysteme wurden über die Jahre für ganz spezifische Aufgabenstellungen optimiert. Ihr Design ist maßgeblich auf die schnelle Bereitstellung strukturierter, transaktionsorientierter Daten ausgerichtet, wie sie in Datenbanken zu finden sind. Bei wachsender Menge großer unstrukturierter Dateien, wie z.B. Videodateien, stoßen diese Systeme aber immer öfter auch an ihre Grenzen. Und der Aufwand, sie dafür doch einsetzen zu können, ist oft sehr hoch. Selbst die neuesten NAS- und SAN-Systeme sind zwar Weltmeister im Verarbeiten tausender Transaktionen pro Sekunde, geben dadurch aber auch eine architekturbedingte Ausrichtung vor. Herkömmliche Speichersysteme skalieren zwar bezüglich ihrer Gesamtkapazität, nicht aber für gleichzeitigen Zugriff auf einzelne Dateien. Daher führt intensiverer Zugriff auf große Dateien zu Performanceengpässen. Zusammen mit aufwändiger Verwaltung schraubt sich die Kostenspirale immer weiter nach oben. Und das nur, um architekturbedingte Limits mit immer neuen Hardware- oder Software-Komponenten Stück für Stück weiter hinausschieben zu können.
Aus dieser Situation heraus wurden über die letzten Jahre Speichersysteme entwickelt, die auch einzelne Dateien noch problemlos bewältigen können, wenn sie einige Terabyte groß sind. Diese Architekturen meistern auch die Forderungen nach sehr hohem Datendurchsatz und vielen parallelen, gleichzeitigen Zugriffen problemlos; denn genau dafür wurden sie geschaffen.
Zu Beginn der Entwicklung war die Speicherung großer Video- und Audiodateien die treibende Kraft. Die Merkmale dieser neuen Storagearchitektur werden inzwischen aber auch über diesen Einsatzbereich hinaus immer öfter gebraucht. Inzwischen werden unter dem Begriff "Clustered Storage" eben jene Merkmale zusammengefasst, die den Erfolg dieser Architektur ausmachen.

Kapazitätssteigerung bringt höhere Geschwindigkeit

"Clustered Storage" basiert auf einem homogenen Verbund mehrerer Storage Nodes, der nach außen ein großes und dabei extrem leistungsfähiges Dateisystem darstellt. Jeder Storage Node enthält Rechenleistung zur Datenverarbeitung, Cache zur Datenpufferung, Plattenkapazität zur Datenspeicherung und entsprechende Anbindung zur Datenübertragung. Dieses Designprinzip bringt es mit sich, dass bei Hinzufügen eines weiteren Nodes sowohl die Speicherkapazität als auch der Datendurchsatz steigt. Damit wird der gesamte Cluster durch zusätzliche Nodes nicht nur größer sondern auch schneller. Die Lastverteilung der Zugriffe erfolgt, basierend auf vorgebbaren Regeln, automatisch. Diese Architektur bringt mit sich, dass große Dateien effizienter abgespeichert werden als kleine. Sowohl mit Anwachsen des Clusters als auch mit größeren Dateien wird dieser Effekt immer stärker.
Die Erweiterung um einen oder mehrere Nodes erfolgt unterbrechungsfrei, im laufenden Betrieb. Das Dateisystem sorgt dafür, dass die neu hinzugekommenen Ressourcen automatisch mit einbezogen werden. Dabei werden sowohl die Datenmengen als auch die Anbindungen (Client Connections) über das gesamte Speichersystem ausbalanciert. Im Unterschied zu traditionellen Speicherarchitekturen erfolgt das Striping inkl. Paritätsschutz hier nicht innerhalb einer RAID Gruppe über die Festplatten sondern per Datei oder Verzeichnis quer über die Nodes. Das bringt hohe Flexibilität bei Erweiterungen und maßgeschneiderte Konfigurierbarkeit für die jeweiligen Anforderungen; und das völlig unabhängig von RAID-Strukturen.

 

Verfügbarkeit per Design

Die von traditionellen Speicherarchitekturen gewohnte starre Zuordnung von Controllern zu Disk-Gruppen entfällt. Auf jede Datei kann von jedem Node aus zugegriffen werden. Fällt ein beliebiger Node oder eine Komponente aus, so sind die Daten über die anderen Nodes noch immer erreichbar; das Clustered Storagesystem arbeitet weiter. Die Clusterarchitektur ist somit von ihrem Prinzip her hochverfügbar; und das ohne zusätzliche Ausgaben für extra Software oder oftmals teure, redundante Hardware. Die Konfigurationsmöglichkeiten des Speichersystems gehen so weit, dass sogar mehrere gleichzeitige Laufwerks- und Knotenausfälle aufgefangen werden können.

Clustered Storage als zusätzliche Alternative

Bei allen hier angeführten Vorteilen von Clustered Storage, traditionelle Storagelösungen werden auch künftig ihren Platz haben. Sie sind für ihr ursprüngliches Einsatzgebiet optimal ausgelegt. Für viele Speicheranforderungen werden sich allerdings Clustered Storage Konzepte durchsetzen; zu schwer wiegen die Vorteile, als dass ihr Einsatz auf die Speicherung großer Mengen von Mediadaten beschränkt bleiben wird. Überall dort wo es um die wirtschaftliche Speicherung großer Mengen von großen unstrukturierten Dateien geht werden sie ihre Stärken ausspielen. Das stellen sie im Praxiseinsatz bereits eindrucksvoll unter Beweis.