Veröffentlicht am 03. Februar 2022

Kopieren und Speichern riesiger Datenmengen: Einblicke in die optimale Technologie

Komplexe Herausforderungen erfordern besondere Lösungen.

Bereits im ersten Teil des Blog-Beitrags („Wie das Kopieren und Speichern von riesigen Datenmengen zum Kinderspiel wird“, Veröffentlicht am 07. Dezember 2021) haben wir über die Situation unseres Kunden und unsere entsprechende Lösung berichtet.

Worum ging es genau?

Unser Kunde hat die Herausforderung, einen großen Datenpool, den er auf eigenen Speichersystemen vorhält, in einen externen, schnellen Speicher auszulagern, um lokal Platz für neue Daten zu schaffen. Gleichzeit besteht aber der Bedarf, kurzfristig nochmal auf diese ausgelagerten Daten zugreifen zu müssen. Der Restore muss dabei sehr schnell erfolgen. Der Datentransfer zum externen schnellen Speichersystem soll nicht über ein neues Netzwerk, sondern über das Corporate WAN erfolgen. Im letzten Schritt sollen die Daten in einem Langzeitarchive für bis zu 30 Jahre aufbewahrt werden.

Als Antwort auf seine Herausforderung entwickelten wir daher ein 3-stufiges Backup- und Archivierungssystem.

In diesem zweiten Blog gehen wir nun etwas technischer in die Tiefe und zeigen auf, welche Technologien wir eingesetzt haben, um die Anforderungen zu erfüllen.

Das Projekt im Überblick:

✅ > 2 Petabyte (PB) Datenvolumen pro Monat

✅ Über 4 Standorte & 2 Kontinente hinweg

✅ 10 Gbit/s Übertragungsgeschwindigkeit

✅ Kosten- & Zeitersparnis bei Restore und Archivierung

Lösungsdesign

Das neue, zukunftstaugliche Design sieht vor, alle Daten der Standorte auf einen zentralen Multi-Petabyte Ceph Cluster zu übertragen, in der zentralen Datenbank zu katalogisieren und letztendlich auf dem Cloud Archiv Storage zu archivieren.

Technologie

Da die Standorte stets redundant an das Corporate Netzwerk angebunden sind, wird meist eine Leitung nicht aktiv genutzt. Dies ermöglicht eine Startkonfiguration für jeden Standort ohne Netzwerkerweiterung und spart dabei Kosten.

An jedem Standort mit Storages übernehmen mehrere Atempo Miria Datamover das Einlesen der Daten vom Quell Storage. Datamover sind physikalische oder virtuelle Server mit leistungsstarken CPUs zur Hash Berechnung und gleichzeitig breitbandiger Anbindung zur schnellen Übertragung der Daten.

Beim Einlesen der Daten werden bereits Hash Werte der Dateien erstellt, die einerseits zum Einsparen der Bandbreite mittels Deduplication und andererseits zur Sicherstellung der Datenkonsistenz durch die Verifizierung der übertragenen Daten am Ziel verwendet werden.

Durch die Deduplication werden ausschließlich Daten zum Ceph Storage im zentralen Rechenzentrum übertragen, die dort oder auf dem Cloud Speicher noch nicht existieren. Dies führt zu einer Einsparung von Bandbreite, die dann zur Übertragung neuer Daten bereitsteht.

Die Übertragung der Daten vom Quell Storage zum zentralen Ceph Storage verläuft zwischen den Miria Datamovern des Standortes, die die Daten einlesen sowie den Miria Datamovern des zentralen Rechenzentrums, die die Daten auf das Ceph Storage schreiben.

Periodisch werden neue Daten auf dem zentralen Ceph Storage in die Cloud übertragen – ebenfalls zwischen den Miria Datamovern des zentralen Rechenzentrums, die die Rollen nun tauschen und die Daten einlesen sowie den Miria Datamovern in der Cloud, die die Daten in den Archiv Speicher schreiben.

Die Übertragung zwischen Datamovern erfolgt stets verschlüsselt und schützt so zusätzlich die Daten bei der Übertragung.

Die Plattform im zentralen Rechenzentrum stellt die Datendrehscheibe dar. Das zentrale Ceph Storage wird als Cache Speicher genutzt, der bei Erreichen eines definierten Füllstandes automatisch die ältesten Dateien unter der Bedingung löscht, dass diese bereits vollständig auf dem Cloud Archive Storage gesichert wurden. Es werden nur so viele Dateien gelöscht, bis ein definierter Mindest-Füllstand erreicht wird.

Bei der Wiederherstellung von Dateien ermittelt die Software Miria von Atempo automatisch die beste Wiederherstellungsquelle und startet den passenden Wiederherstellungsprozess. Sind die Dateien noch auf dem zentralen Ceph Storage gespeichert, können sie sofort wiederhergestellt werden. Werden die Daten bereits ausschließlich im Cloud Archive Storage vorgehalten, wird die Bereitstellung der Dateien beim Cloud Archive Storage mittels API angefragt und anschließend automatisch die Wiederherstellung zum Quellsystem gestartet.

Die Kombination des zentralen Ceph Storages als Cache Speicher für schnelle Wiederherstellungen der neuesten Dateien in Kombination mit dem Archive Cloud Speicher für kostengünstige Langzeitarchivierung der Daten bietet die Vorteile beider Storagetypen in einer intelligenten Lösung – Zeitersparnis bei der Wiederherstellung und Kosteneinsparung bei der Langzeitarchivierung.


Sie stehen auch vor der Herausforderung, sehr große Datenmengen sicher speichern und archivieren zu müssen? Vor der Herausforderung, eine Lösung zu implementieren, die dem stetigen Datenwachstum auch in Zukunft gerecht wird und nicht jedes Jahr wieder neu gedacht werden muss?

Dann melden Sie sich bei uns für ein unverbindliches Gespräch!

Diesen Artikel teilen:

Andere 11, März 2024

Kosten senken, Leistung steigern: Der Umstieg auf Managed Proxmox

In der Welt der IT-Infrastruktur haben sich in den letzten Jahren zahlreiche Technologien entwickelt, die Unternehmen dabei unterstützen, ihre Ressourcen effizienter zu nutzen und flexibler auf Veränderungen zu reagieren. Eines dieser fortschrittlichen Tools ist Proxmox, das nicht nur leistungsstark ist, sondern auch eine kosteneffiziente Lösung für das IT-Management ist.

Artikel lesen
Computing 11, Januar 2024

Mehr als nur Cloud: weSystems als Wegbereiter für den Fortschritt

In einer Welt, in der die Cloud-Technologie die Art und Weise, wie Unternehmen ihre IT-Infrastrukturen verwalten, revolutioniert hat, sind Features, Automatisierung und nahtlose Anbindung zu entscheidenden Schlüsselfaktoren geworden

Artikel lesen

    Schreiben Sie uns!

    E-Mail: sales@wesystems.ag

    Telefon: +49 89 244140-800

    Vorname *

    Nachname *

    Unternehmen *

    Position

    E-Mail *

    Telefon

    Nachricht *

    Ihre Daten werden ausschließlich dazu verwendet, Ihre Anfrage zu beantworten.


    Vielen Dank!

    Ihre Nachricht wurde erfolgreich gesendet! Unser Team meldet sich schnellstmöglich bei Ihnen zurück. Sollten Sie in der Zwischenzeit noch weitere Fragen haben, kontaktieren Sie uns ganz einfach per E-Mail oder Telefon.