tom's networking guide
 
Anzeige
Aconso: Praxistipps zur Dokumentenerzeugung >
< Ansgar Hinz wird neuer VDE-Chef
27.01.16 20:21 Alter: 2 Jahre
Kategorie: Storage, NAS, Administratoren, Datenrettung, Archivierung, Sicherheit, Top-News
Von: Arno Kral

TELI Jour-fixe: Beste Architektur für aktive Archivspeicher

Zum TELI-Jour-fixe wies Mathias Zahn, CEO der FAST LTA AG, einen Weg aus dem energetischen Dilemma der massenhaften Datenlagerung über lange Zeiträume: COLD Storage kann beim sicheren Aufbewahren von Daten ein Drittel der Energie einsparen.


Matthias Zahn, CEO der FAST LTA AG, mit Silent Brick beim TELI-Jour-fixe

Matthias Zahn, CEO der FAST LTA AG, mit Silent Brick beim TELI-Jour-fixe.

FAST LTA Silent Cube

FAST LTA Silent Cube.

München – Zum ihrem Januar-Jour-fixe 2016 im Internationalen PresseClub München hatte sich die Technisch-Literarische Journalistenvereinigung (TELI e.V.) des Themas "Zukunft der Datenspeicherung" gewidmet und als Referenten den Diplom-Physiker Matthias Zahn, CEO der auf Langzeitspeicherung von Daten spezialisierten FAST LTA AG gewinnen können. Denn eines scheint heute so sicher wie in Zukunft: Daten löschen ist out, Daten bewahren dagegen so in wie nie zuvor – man weiß ja nie, wozu man sie noch gebrauchen könnte. Die FAST LTA AG mit Sitz in München (Slogan: "Wir sichern Terabytes") ist seit 2006 im Speichergeschäft, fertigt und vertreibt aktive Archiv-Speicher (Silent Cubes seit 2009 und Silent Bricks seit 2015). Seit ihrem Bestehen hat sie eine Speicherkapazität von 40.000 Terabyte ausgeliefert.

Welchen Umfang die massenhafte Einlagerung von Daten aller Art angenommen hat, offenbaren nicht erst die Enthüllungen von Edward Snowden. Jeder, der heute ein Smartphone sein eigen nennt, kann es herstellerkonform ohne Cloud-basierten Datendienst schon gar nicht erst nutzen, die meisten Apps generieren ohne Zutun der Anwender Daten, die sie beim "Nachhausetelefonieren" auf Servern ablegen. Und so landen immer mehr von Anwendern und Anwenderinnen – bewusst oder unbewusst – generierte Daten auf irgendwelchen Datenspeichern, die irgendwo im Netz stehen. Hinzu kommen alle die Daten, Videoüberwachung, Suchanfragen, Shops, Gesundheits-Apps, das Internet of Things, Industrie (4.0) oder der Automotive-Bereich generieren.

Einer IDC-Prognose zur Folge, so Matthias Zahn, steigt das zu speichernde Datenvolumen bis zum Jahr 2020 auf 40 Zetabyte an, das sind 40 Millionen Petabyte oder mehr als 5 Terabyte pro Erdbewohner. "Diese Zahl ist so groß, dass die existierende Speicherarchitektur überdenkenswert ist", erklärt Zahn. Denn weniger Daten werden es nicht werden, weil einfach keine Daten mehr weggeworfen werden. Grund, so Zahn: "Löschen ist richtig Arbeit!"

Und so verteilt sich das existierende Datenvolumen "im digitalen Universum" heute im Wesentliche auf drei Sorten Speichermedien:

  • Festplatten (HDD),
  • Halbleiter (Flash) und
  • Bandspeicher (Tape).

Matthias Zahns Einschätzung: "Das Gros stellen Festplatten (85 Prozent), Flash ist stark im Kommen, aber deutlich teurer, und Tape wird zunehmend ungebräuchlich." Diese drei Speichertypen werden laut Zahn auch 2020 noch den Hauptbestandteil stellen, wenngleich immer wieder von neuen Technologien die Rede sei, etwa dem Memristor, ebenfalls ein Festkörper-Speicher, der Daten in dreidimensionalen Strukturen speichern kann, im Gegensatz zum flächigen Aufbau von Flash-Chips. Doch Memristor-Hauptprotagonist, Hewlett Packard, hat erneut einen Rückzieher gemacht. Als Grund nennt Zahn die exorbitanten Kapitalkosten. Bis zu 10 Milliarden US$ kostet heute eine neue Fabrik, egal ob für Flash- oder Festplattenspeicher. Die Kapitalkosten sind so unglaublich hoch, dass die Umsetzung einer Idee in marktreife Produkte mit signifikantem Marktanteil bis 2020 nicht mehr möglich sein wird", so Zahn, dem zur Folge optische Speicher, trotz Holographie, ebenfalls nicht mehr mithalten können.

Für alle Speichertypen gebe es Zielkonflikte bei der Optimierung von Kosten, Qualität und Zeit – auf Speicher übersetzt, Kosten, Integrität und Performanz bedeuten, wobei Zahn bei der Performanz zwischen Geschwindigkeit und Latenzzeit differenziert. Je nach Einsatzgebiet unterscheiden sich die Optimierungsziele jedoch deutlich:

  • Privatanwender legen Wert auf Kosten und Performanz und nehmen daher rund ein Prozent Datenverlust pro Jahr in Kauf.
  • Die Industrie hingegen benötigt 100 Prozent Integrität und kann folgerichtig nur noch zwischen Kosten und Performanz optimieren.

Weil es also mehr als ein Optimum gebe, so Zahn, sei es angebracht, die Speicherarchitektur in verschiedene Stufen zu unterteilen und sich die künftige Entwicklung anzusehen:

  • Beim Primärspeicher, wie er für Datenbankoperationen eingesetzt wird, ist Performance am wichtigsten, während die Kosten fast unwichtig sind. "Dieser Bereich wird ganz schnell an Flash gehen", so Zahn.
  • Der Near-Line-Speicher arbeitet mit heute Latenzzeiten im Millisekunden-Bereich und basiert häufig auf RAID-Systemen, also ebenfalls auf Festplatten. Auch dieser Bereich wird laut Zahn künftig auf Flash gehen.
  • Der aktive Archivspeicher (FAST-LTA-Produkte) braucht keine allzu hohe Performance, muss aber mit vernünftigen Zugriffszeiten aufwarten. "Ein aktives Archiv muss so schnell sein, das es Menschen bei der Arbeit nicht ausbremst. Dafür ist er achtmal preiswerter als Festplatten oder eine Kombination aus Festplatten und Flash.", sagt Zahn. Auch wenn selbst Google bereits Daten von Tape-Archiven wiederherstellen musste, würde das Unternehmen seine Internetsuche nie über Tape-Archiven betreiben können.
  • Das Deep Archive"wird eine Nische für Tape bleiben", ist Zahn überzeugt, oder ebenfalls von "COLD" abgelöst werden (Cost Optimized Linear Disk).

COLD ist cold im Sinne von cool
Rechenzentren brauchen [besonders für Datenbankanwendungen, Anm. d. Red.] ganz viele I/Os (Input-Output-Operationen) und sehr viel Bandbreite. Diese Datenspeicher laufen immer, weshalb sie ständig Strom verbrauchen. Hot Storage. Das Problem solcher ständig laufender Festplatten sind die hohen Personalkosten für ihre Wartung. Denn ein Power-Management ist bei Festplatten, auf die immer und in hoher Frequenz zugegriffen werde, schlicht unmöglich. Am Beispiel Facebook erklärte Matthias Zahn das Einsparpotenzial liegt: 98 Prozent der hochgeladenen Fotos werden nie wieder angeschaut. Doch herauszufinden, welches die anderen zwei Prozent sind, sei unmöglich. Daher seien solche Datenspeicher immer "hot".

Was Cost Optimized Linear Disk (COLD) bedeutet, machte Zahn anhand des Energieverbrauchs von Festplattenspeichern deutlich: Die Festplatte mit dem derzeit besten Preis-Leistungs-Verhältnis ist die 8-TB-Archivplatte von Seagate [STA8000S0012, Anm. d. Red.]. Sie unterbietet Flash bei den Kosten um das Achtfache. Durch SMR (Shingled Magnetic Recording), also durch sich wie Dachschindeln überlappende Magnetspuren auf den Platten (breit schreiben, schmal lesen), verdreifacht sie zwar die Speicherdichte, dafür ist sie weder performant noch effizient und insbesondere ungeeignet für viele Änderungen. Für lineare Schreibvorgänge, also zum dauerhaften Archivieren von Daten, die keiner Änderung mehr bedürfen, bietet sie eine klare Kostenoptimierung, so Zahn. Aber: "Eine Festplatte ist nicht billig, wenn sie immer laufen muss." Archiv-Platten könnten hingegen ganz abgeschaltet werden, wenn ihre Daten nicht gebraucht würden, und müssten lediglich ab und zu hochgefahren werden, um ein Verharzen der Spindellager zu verhindern.

Wir glauben, dass Datenspeicher mit Null Ruheenergie und vernünftigen Zugriffszeiten am besten durch Linear Disk á la Tape realisieren lassen", erklärte Zahn. "Power-Management ist immer dann machbar, wenn Lokalität der Daten auch in der Zeit gegeben ist." Als weitere Vorteile der Linear Disk nannte Zahn

  • die leichte Transportierbarkeit von Daten (-trägern) á la Silent Brick,
  • die leichte Kopierbarkeit (linear aufeinander folgender Datenblöcke),
  • große Datenblöcke,
  • die asynchrone Replikation via LAN oder WAN und
  • lineares Schreiben bei wahlfreiem Lesen (random read).

Sollte ein bestimmter Datenblock benötigt werden, müsse eine schlafen gelegte Festplatte zwar hochgefahren werden, was Zeit im Bereich von Sekunden erfordere. "Wenn sie aber wieder läuft, sind Zugriffszeiten auf weitere Blöcke fast Null", so Zahn.

COLD enables cold, cold spart Strom
"Wir glauben, dass 2020 30 Prozent der Daten in COLD-Inseln gespeichert werden", behauptet Zahn, und begründet das mit einer einfachen Rechnung: Um das für 2020 prognostizierte Speichervolumen von 40 Zetabyte bereit zu stellen, müssen zwei Milliarden typischer, 20 Terabyte fassender, Archivplatten installiert werden. Jede davon will einschließlich Overhead mit 15 Watt Energie versorgt werden, was einen Gesamtbedarf von 30 Gigawatt bedeutet. Das entspricht der Leistung von 30 Atomkraftwerksblöcken. Ein Drittel davon ließe sich mit COLD Storage einsparen, weil die Festplatten im COLD Storage ja nicht ständig laufen müssen. Das wiederum bringe wichtige Vorteile bei Wartung und Lebensdauer mit sich. Die Ersatz-Zyklen für die Massenspeicher verlängerten sich von drei auf zehn Jahre, gegenüber JBOD immerhin noch um das Doppelte.

Unfuckable Storage
Werden als Linear Disks verbaute Festplatten dann noch an einem WORM-Controller (Write Once, Read Manytimes) betrieben, der das Überschreiben oder Löschen von Datenblöcken auf Hardware-Ebene verhindere, lasse sich ein praktisch nicht-kompromittierbarer Datenspeicher – "unfuckable Storage" – realisieren. Dann könne selbst ein mit allen Rechten ausgestatteter Systemadministrator Daten nicht mehr löschen. [In einem früheren TELI-Vortrag hatte Matthias Zahn dargelegt, dass der Großteil von Datenverlusten auf menschliche Fehler beim Datenlöschen zurück zu führen sei. Im Vergleich zu den Kosten durch Datenverluste seien die Kosten für zusätzlichen Speicherplatz fast schon vernachlässigbar, Anm. d. Red.]

Die im Speichermedium integrierte Redundanz der von FAST LTA designten linear Disk-Arrays machen ferner ein zusätzliches Backup obsolet: In den Silent Bricks stecken jeweils 12 Festplatten, von denen bis zu acht ausfallen können, ohne dass es zu Problemen bei der Datenintegrität kommt. "Beim Erasure Resilent Coding, das auch in der Mars-Sonde der NASA eingesetzt werde, sind wir die ersten unter den Speicherherstellern", freut sich Zahn. [Erasure Resilent Coding bezeichnet ein mathematisches Verfahren zum Datenschutz, das Daten in Fragmente aufteilt, erweitert und neu mit redundanten Teilen codiert, die dann auf physikalisch getrennten Orten gespeichert werden. Ziel ist die zuverlässige Wiederherstellung von verlorenen Teilen aus Informationen anderer Datenteilen aus dem Verbund. Wird wegen höhere Effizienz zunehmend statt RAID verwendet, erfordert jedoch mehr Rechenleistung. Anm. d. Red.]

Und obwohl nur rund die Hälfte der von FAST LTA verkauften Bricks und Cubes redundant betrieben würden (beispielsweise in zwei verschiedenen Brandabschnitten eine Gebäudes oder in verschiedenen Gebäuden) "haben wir seit es uns gibt, noch kein einziges Byte verloren", verweist Matthias Zahn mit Stolz auf die Ingenieursleistung seiner Firma.

Eine mechanische Sperre im Rack der Silent Bricks und ein holographisches Siegel am Gehäuse jedes einzelnen der Silent Bricks verhindern, dass einzelne Festplatten unbemerkt aus einem Brick herausgenommen und außerhalb des Systems kompromittiert werden könnten.

Allerdings räumte Zahn ein, dass es Leute gebe, die es verrückt mache, nichts löschen zu können – alte Schule eben. Aber WORM ist ja kein Muss, es sei denn in Anwendungsfällen, in denen Daten absolut revisionssicher gespeichert sein müssten. Das sei beispielsweise bei der Aufbewahrung digitaler Röntgenaufnahmen in Krankenhäusern und radiologischen Praxen der Fall, von deren Inhalt Diagnosen und Behandlungsmethoden – und im ungünstigen Fall Regressforderungen – abhängen. Solche Einrichtungen können auf PACS (Picture Archiving Control System) und ein revisionssicheres Dokumentenmanagement nicht verzichten. Nicht ohne Grund zählt laut Zahn die FAST LTA AG heute mindestens die Hälfte der deutschen Krankenhäuser zu ihren 2500 Kunden.

Zur CeBIT 2016 will die Münchner Firma – neu – ein Secure NAS anbieten, das 300 Terabyte in einem Rack mit sechs Höheneinheiten unterbringt. Dessen Controller soll einen Datendurchsatz von mehr als einem Gigabyte pro Sekunde aufweisen, ein einzelner Brick einen Durchsatz von 600 bis 700 Megabyte pro Sekunde.

Hidden Champion vor der TELI
Kaum ein technischer Bereich ist so un-sexy wie die Archivierung von Daten, und doch kommt in Zeiten der fortschreitenden Digitalisierung keinem Bereich so viel Bedeutung bei. Denn das ach so beliebte weil kosteneffiziente Speichern in der Cloud kommt für viele Einsatzbereiche nicht in Frage: nicht nur in Bayern gibt es eine Vorschrift, Daten in den Behörden immer vor Ort zu speichern. Dem Regionalkreis Süd der Der TELI ist es erneut gelungen, mit der FAST LTA AG einem Hidden Champion ein Forum zu geben, um im Internationalen PresseClub München seine innovative und nützliche Technologie branchenübergreifend präsentieren zu können und die Presse mit unverzichtbaren Informationen über technologische Trends im Zeitalter der fortschreitenden Digitalisierung zu versorgen.


Leserkommentar

Keine Kommentare

Kommentar hinzufügen

* - Pflichtfeld

*





*
*
Rubriken
Anzeige
Anzeige
Anzeige
Anzeige
News

Trend Micro trauert um Günter Untucht

Günter Untucht (Bild: Trend Micro)

Der europäische Chefjustiziar von Trend Micro, Günter Untucht, ist Ende Januar überraschend...

[mehr]

Corel VideoStudio Ultimate 2018 mit neuen Funktionen verfügbar

Corel Logo (Grafik: Logo)

Erste Wahl für anspruchsvolle Gelegenheitsanwender – diesen Anspruch erfüllt das...

[mehr]

Argus 2 - kabellose Überwachungskamera für Akku- und Solarbetrieb

Die Argus 2 ist für innen und außen geeignet. (Bild: Reolink)

Reolink stellt mit der Argus 2 seine neueste Kamera vor. Die innovative Überwachungskamera...

[mehr]

Meltdown und Spectre: MSI liefert BIOS-Updates für Z370-Mainboard

MSI Logo

Mit den Updates will MSI mögliche SIcherheitslücken im aktuellen Intel-Microcode schließén. Updates...

[mehr]

CES 2018: Acer lässt Gamer-Herzen höher schlagen

Acer Nitro 5 (Bild: Acer)

Ob für Gamer, Kreative oder Business-Nutzer - auf der CES in Las Vegas stellt Acer für jeden etwas...

[mehr]

Meltdown und Spectre - ein GAU in zwei Akten

Spectre-Logo (Grafik: Natascha Eibl)

Noch ist nicht klar, wie viele Systeme betroffen sind, aber eines lässt sich schon sagen: Zumindest...

[mehr]
Anzeige
Anzeige