Leistungsdefinition (Service-Level
Agreement) für den Dienst:
"Zentrale Datenspeicherung im IWR"
§1 Zweck dieses Dokumentes
Dieses Dokument definiert die allgemeine Leistung des Dienstes "Zentrale
Datensicherung für Endbenutzer". Es beschreibt die Leistungen für
Backup/Restore und Archive/Retrieve basierend auf Benutzeranforderungen.
§2 Änderungen dieses
Dokumentes
IWR bemüht sich den Leistungsumfang dieses Dienstes möglichst
lange konstant zu halten. Es ist nicht auszuschließen, dass aufgrund
äußerer Randbedingungen, wie etwa funktionale Veränderungen
der Software durch den Hersteller oder Betriebssystem-, Software- oder
Hardwareunverträglichkeiten einzelne Passagen verändert werden
müssen. IWR wird die Änderungen rechtzeitig über die Mailingliste
(adsm@listserv.fzk.de) verteilen und im Web bekannt geben. Mit Großkunden
(individuell eingerichtete Policies) wird vor der Änderung eine einvernehmliche
Regelung getroffen.
§3 Die Serverinfrastruktur
Als zentrales Produkt für Datensicherung wird der IBM Tivoli Storage
Manager (ITSM) eingesetzt. Es stehen fünf Tivoli Storage Manager Server
in zwei Standorten zur Verfügung. Diese können gemeinsam auf
zwei Tape Roboter über ein Speichernetzwerk (Fibre Channel mit 2 Gb/s)
zugreifen und verfügen über 8 Laufwerke des Typs LTO Ultrium
und 16 Laufwerke des Typs LTO Ultrium 2. Alle Server sind über Gigabit
Ethernet an das FZK-LAN angebunden.
Die Server sind in der Funktionalität getrennt in Sicherungs- (Backup)
und Archivierungsserver. Die Benennung der Server ist:
Beispiel IA1: I (Standort IWR oder O für OKD),
A (Archive oder B für Backup), 1 (laufende Nummer)
Welcher Server für einen Client zuständig ist wird von den
Administratoren festgelegt.
§4 Begriffsdefinition
Archivierung
Der Begriff "Archivierung" wird benutzt für eine langfristige Speicherung
von Daten. Dies wird durch Speichern einer oder mehrerer Kopien einer Datei
auf den Archivierungsservern erreicht. Typischerweise wird diese Funktion
benutzt, um eine oder mehrere Kopien von Daten zu einem definierten Zeitpunkt
zu erhalten. Sobald diese Kopien existieren, können diese Daten vom
Plattenspeicher gelöscht werden um Speicherplatz freizugeben. Diese
Dateien können zurückgespeichert (Retrieved) werden, solange
diese auf dem Server existieren. Wie lange die Dateien auf dem Server gespeichert
bleiben hängt vom Regelwerk ab.
Backup
Der Begriff "Backup" wird benutzt für eine kurzzeitige Sicherung
von Daten, die häufig geändert und online gehalten werden. Dies
wird durch Speichern von verschiedenen Versionen auf dem Datensicherungsserver
erreicht. Wenn sich eine Datei ändert, wird die neue Version auf den
Server übertragen und, je nach Regelwerk, eine veraltete auf dem Server
gelöscht. Backup wird als Sicherheitsmaßnahme gegen physikalische
oder logische Fehler ausgeführt. Nach einem Fehler oder versehentlichem
Ändern oder Löschen kann die Datei vom Sicherungsserver zurückgesichert
(Restored) werden. Wie viele verschiedene Versionen dazu zur Verfügung
stehen, hängt vom Regelwerk ab.
§5 Ziele des Dienstes
Das Ziel des Dienstes ist es, dem Endbenutzer ein hochqualitatives Management
seiner Daten zur Verfügung zu stellen.
Der Dienst stellt Sicherungen für Dateien, die dezentral am Client-Rechner
(dsm.sys/dsm.opt User Option Datei) oder zentral in IWR (zentraler ITSM
Scheduler) registriert wurden, zur Verfügung.
Sicherungen (Backups) können sowohl vom User initiiert, als auch
über den zentralen ITSM-Scheduler gesteuert werden. Die Attribute
des ITSM-Schedulers werden im Standardregelwerk definiert. Archivierungen
werden nur vom User initiiert, und unterliegen keinem Automatismus.
Alle Dateien, die ohne Angabe spezieller Optionen gesichert oder archiviert
werden, unterliegen den Definitionen eines Standardregelwerkes (Standard
Managementklasse), deren Attribute und Werte im Folgenden erklärt
werden:
Die Standard Backup Copygroup ist
folgendermaßen definiert:
-
Maximal zwei Backup Versionen eines Files werden auf dem Server gehalten,
wenn dieses File auf dem Clientrechner existiert. Backup unterscheidet
verschiedene Versionen einer Datei.
-
Wenn das File auf dem Clientrechner gelöscht wird, wird nur noch eine
Version gespeichert.
-
Wenn das File auf dem Clientrechner gelöscht wurde, ist diese letzte
Version noch für 60 Tage verfügbar.
-
Die Dateien werden einfach auf Bändern gespeichert. Ein Ausfall eines
Bandes kann zum Verlust der Backupkopie führen.
-
Die Dateien werden zuerst auf Staging-Platten gespeichert und danach mindestens
einmal am Tag auf Bänder verschoben. Diese Staging-Platten sind ohne
Redundanz ausgelegt. Ein Ausfall einer Platte kann zum Verlust der Backupkopie
führen.
-
Die Summe aller Dateien (auf Staging-Platten oder Tape) ist kostenpflichtig
nach der aktuell gültigen IWR Preisliste.
Die Standard Archive Copygroup ist
folgendermaßen definiert:
-
Files können jederzeit archiviert werden, unabhängig ob sich
die Datei geändert hat oder nicht (im Gegensatz zu Backup), solange
die Datei nicht im aktiven Zugriff (geöffnet) eines Benutzers ist.
-
Wenn ein File archiviert wurde, werden zwei Kopien dieses Files für
365 Tage (Managementklasse Arch12) aufgehoben (im Gegensatz zu zwei Versionen
beim Backup werden hier identische Dateien zur Sicherheit gegen Bandfehler
doppelt gehalten).
-
Die Dateien werden auf zwei unterschiedlichen Bändern, in zwei 700m
entfernten Robotersystemen auf zwei unterschiedliche Tapetechnologien gespeichert.
Der Ausfall eines Bandes oder eines Standortes oder eines Fehlers in der
Tapetechnologie führt nicht zum Verlust der Archivkopie. Ein zeitlich
eng zusammen liegender Fehler in zwei Systemen hingegen schon.
-
Die Dateien werden zuerst auf Staging-Platten gespeichert und danach mindestens
einmal am Tag auf Bänder verschoben. Diese Staging-Platten sind als
RAID5 Arrays ohne Hot Spare ausgelegt. Ein Ausfall einer Platte kann nicht
zum Verlust der Archivkopie führen. Ein zeitlich eng zusammen liegender
Fehler zweier Platten hingegen schon.
-
Die Summe aller Dateien auf Staging-Platten oder Tape (da doppelt gehalten
Summe der archivierten Daten mal zwei) auf dem Sicherungsserver ist kostenpflichtig
nach der aktuell gültigen IWR Preisliste.
Alternativ stehen zur Archivierung
folgende Optionen zur Verfügung:
-
Aufbewahrungszeiten für 3 Monate (Managementklasse Arch03), 5 Jahre
(Arch60), 6 Jahre (Arch72) und No Limit (ArchNL).
§6 Abhängigkeiten
Der Dienst baut auf dem Dienst des FZK-LANs auf. Wenn dieser nicht verfügbar
ist, kann auch der Dienst Zentrale Datenspeicherung nicht in Anspruch genommen
werden.
§7 Betriebszeiten
-
Der Dienst ist von Montag bis Freitag 08:00 h – 17:00 h administrationsseitig
besetzt. Eine Betriebsunterbrechung außerhalb dieser Zeit kann, muss
aber nicht zwangsläufig erkannt und beseitigt werden.
-
Wartung an den zentralen Datensicherungsservern wird über die Mailingliste
adsm@listserv.fzk.de mindestens eine
Stunde im Voraus angekündigt und in der Regel innerhalb eines Arbeitstages
abgeschlossen. Wenn Sie Mitglied dieser Liste werden wollen schicken Sie
eine Mail an adsm@iwr.fzk.de .
§8 Zuständigkeiten
-
Benachrichtigung über neue Clientversionen und Meldungen über
End-of-Service werden über die Mailliste verschickt.
-
Der Endbenutzer ist dafür verantwortlich, dass eine mit der aktuellen
Serverversion kompatible und noch in Wartung befindliche Version des Sicherungsclients
(ITSM-Client) verwendet wird. Wenn Hilfe bei der Installation benötigt
wird, steht IWR über die IWR-Hotline (Tel. 6060) oder das ITSM-Team
unter adsm@iwr.fzk.de zur Verfügung.
Auf Wunsch ist auch eine Installation Vor-Ort gegen Vergütung nach
der aktuell gültigen IWR-Preisliste möglich.
-
Der Endbenutzer ist dafür zuständig, dass die gewünschten
Dateien gesichert werden.
-
Sind die Dateien während der Sicherung im aktiven Benutzerzugriff
(geöffnet), können sie nicht gesichert werden.
-
Der Endbenutzer überprüft die clientseitigen Log Dateien auf
korrekte Durchführung der Sicherungsläufe.
-
Eine Sicherung kann den Status COMPLETED (alle Dateien erfolgreich gesichert),
FAILED (eine oder mehrere Dateien nicht gesichert) oder MISSED (keine Datei
gesichert) haben. Bei den Zuständen FAILED oder MISSED wird von IWR
jeden TAG um 09:00 h eine Mail an die vom Nutzer angegebene Mailadresse
geschickt. Der Endbenutzer ist dafür verantwortlich, dass diese Mailadresse
gültig und aktuell ist. Nach Möglichkeit sollte eine Mailliste
angegeben werden, damit bei Urlaub oder Krankheit eines Administrators
trotzdem jemand benachrichtigt wird.
-
Der Endbenutzer ist dafür zuständig, dass eventuell installierte
Datenbanken (SQL, Oracle, DB2 etc) oder Applikationen (Lotus Notes, Exchange,
SAP etc), die verhindern, dass eine Sicherung aufgrund geöffneter
Dateien möglich ist, diese IWR mitzuteilen und einen entsprechenden
Client (TDP – Tivoli DataProtection Agent) zu installieren. TDPs sind gesondert
kostenpflichtig.
-
Der Endbenutzer ist dafür zuständig, dass gewünschte Schedules
(automatische Sicherungen) von IWR eingetragen werden.
-
Zentrale Schedules können nur für Rechner eingerichtet werden,
die ständig (auch im Urlaub etc) laufen.
-
Der Endbenutzer ist für Restores der Daten selber verantwortlich.
Aufgrund der höchst inhomogenen Landschaft im FZK ist die Erarbeitung
einer generellen Restoreanleitung nicht möglich. Dies gilt insbesondere
für Datenbanken etc. Entsprechende Tests sind unbedingt notwendig,
damit im Fall eines Datenverlustes der Administrator vor Ort schnell und
sicher reagieren kann.
-
Der Benutzer hat dafür Sorge zu tragen, dass das Passwort seines ITSM-Clients
nur den berechtigten Personen bekannt ist. Mit diesem Passwort hat man
unbeschränkten Zugang zu den gespeicherten Daten auf dem Sicherungsserver.
-
Es stehen eine Hotline (Tel: 6060) und eine Mailingliste adsm@iwr.fzk.de
als Forum für die Problembeseitigung zur Verfügung. IWR hat Zugang
zum Herstellersupport und kann Probleme zentral beim Hersteller melden.
§9 Sicherung der Server
Die zentralen Datensicherungsserver in IWR verfügen über eine
Datenbank in der alle Informationen über Files und Regelwerke (Policies)
verzeichnet sind. Diese Datenbank ist notwendig zum Zurückholen der
Dateien. Sie wird deshalb täglich um 12:00 h in einen örtlich
vom Server getrennten Bandroboter gesichert. Darüber hinaus verfügt
sie über ein Recoverylog, das eine Wiederherstellung der Datenbank
auch granularer als die tägliche Vollsicherung erlaubt. Im Betrieb
werden zwei Kopien dieser Datenbank und des Recoverylogs gepflegt.
§10 Anhang
Spezielle Policyinformationen für
SAP
IK
ENVISAT
METEOSAT