Konvertierung von Legacy‑WordPerfect‑Dateien in moderne Formate: Ein praktischer Leitfaden

WordPerfect war einst die dominierende Textverarbeitungsplattform für Unternehmen, Anwaltskanzleien und Bildungseinrichtungen. Obwohl das Programm noch existiert, haben die meisten Organisationen zu Microsoft Word, Google Docs oder Open‑Source‑Suiten migriert. Die Realität ist jedoch, dass unzählige alte *.wpd‑Dateien auf gemeinsamen Laufwerken, in Archivkartons oder auf Sicherungsbändern liegen und oft Verträge, Akten oder Forschungsarbeiten enthalten, die rechtlich oder historisch wichtig bleiben. Diese Dokumente ohne Verlust von Formatierung, eingebetteten Objekten oder Metadaten zu konvertieren, ist keine triviale Aufgabe. Dieser Leitfaden führt durch einen vollständigen Workflow – von der Bewertung der Quellsammlung bis zur Validierung des Endergebnisses – mit Fokus auf Treuewahrung und langfristiger Zugänglichkeit.

1. Die Herausforderungen bei der WordPerfect‑Konvertierung verstehen

WordPerfect verwendet ein proprietäres binäres Layout, das sich deutlich von der Office‑Open‑XML‑Struktur von DOCX oder den PDF‑Spezifikationen unterscheidet. Die häufigsten Stolpersteine sind:

  • Schriftart‑Substitution – WordPerfect bettet Schriftmetriken ein, nicht die Schriftdateien selbst. Fehlen die originalen Schriftarten auf dem Konvertierungs‑Host, kann die Engine sie durch Standard‑Schriften ersetzen, wodurch Zeilenumbrüche und Seitenumbrüche verändert werden.
  • Komplexe Layout‑Features – Kopf‑/Fußzeilenbereiche, mehrspaltige Abschnitte, Fußnoten und bedingte Textregeln können von naiven Konvertern falsch interpretiert werden, was zu fehlerhaft platziertem Inhalt führt.
  • Eingebettete Objekte – OLE‑Objekte (z. B. Excel‑Diagramme, Visio‑Grafiken) werden als Binär‑Blobs gespeichert. Einige Konvertierungstools können diese nicht extrahieren oder rendern, sodass Informationen verloren gehen.
  • Makros und Skripte – Die WordPerfect‑Makrosprache (WPM) wird außerhalb der native Umgebung kaum unterstützt. Die Konvertierung eines Dokuments, das auf makro‑generierten Inhalt angewiesen ist, erfordert eine separate Strategie.
  • Metadaten‑Lücken – Ältere WordPerfect‑Versionen speichern Autor, Erstellungsdatum und Versionsgeschichte in proprietären Feldern. Während der Konvertierung können diese verworfen werden, wenn das Tool sie nicht auf Standard‑Dublin‑Core‑ oder Office‑Open‑XML‑Eigenschaften abbildet.

Das frühzeitige Erkennen dieser Fallstricke verhindert teure Nacharbeiten später in der Migrationspipeline.

2. Vorbereitung der Quelldateien für die Konvertierung

Eine disziplinierte Vorbereitungsphase reduziert Risiken und macht die nachfolgenden Konvertierungsschritte reproduzierbar.

2.1 Inventarisierung und Kategorisierung

Erstellen Sie eine Tabelle, die jede *.wpd‑Datei, ihre Größe, das letzte Änderungsdatum und bekannte Nutzungskontexte (z. B. Rechtsvertrag, Marketing‑Broschüre) auflistet. Durch Priorisierung (z. B. hochriskante Rechtsdokumente für manuelle Prüfung, massenhaft‑typische Newsletter für Batch‑Verarbeitung) können Ressourcen gezielt zugewiesen werden.

2.2 Schriftart‑Konsolidierung

Sammeln Sie die originalen Schriftdateien, die in den Dokumenten verwendet werden. Handelt es sich um proprietäre Schriften, prüfen Sie Lizenz‑Ersatzschriften mit ähnlichen Metriken. Installieren Sie diese Schriften auf dem Konvertierungs‑Arbeitsplatz; die meisten Konverter greifen auf die zuerst gefundene passende Schrift zurück.

2.3 Backup vor der Transformation

Arbeiten Sie niemals direkt an den Original‑Archiven. Kopieren Sie die gesamte Sammlung auf ein dediziertes Konvertierungs‑Laufwerk. Das bietet ein Sicherheitsnetz für unerwartete Beschädigungen.

2.4 Redundante Dateien bereinigen

Löschen Sie doppelte oder veraltete *.wpd‑Dateien. Das Durchführen eines Duplikat‑Finders auf dem Inventar kann den Arbeitsaufwand um 10‑20 % reduzieren und Speicherkosten minimieren.

3. Auswahl des/zur Ziel‑Formats/-Formate

Das optimale Ausgabeformat hängt vom nachgelagerten Anwendungsfall ab.

  • DOCX – Ideal, wenn das Dokument weiterhin in Office oder Google Workspace bearbeitet wird. DOCX erhält die meisten Strukturelemente (Stile, Tabellen, Kommentare) und unterstützt Nachverfolgung von Änderungen.
  • PDF/A‑2 – Perfekt für die Archivierung. PDF/A bettet externe Schriften ein und verbietet aktive Inhalte, wodurch eine nur‑lesbare Darstellung garantiert wird.
  • ODT – Nützlich für Organisationen, die Open‑Source‑Ökosysteme wie LibreOffice bevorzugen.
  • HTML5 – Wenn der Inhalt auf einer Website oder im Intranet veröffentlicht wird, bewahrt die Konvertierung zu sauberem, semantischem HTML die Überschriftenhierarchie und ermöglicht einfaches Styling.

In vielen Projekten wird ein Dual‑Output‑Ansatz gewählt: ein DOCX für zukünftige Bearbeitungen und ein PDF/A für Compliance und Langzeit‑Speicherung.

4. Auswahl der Konvertierungs‑Engine

Es gibt drei grobe Kategorien von Konvertierungstools:

KategorieTypische WerkzeugeStärkenSchwächen
Native WordPerfect‑ExportfunktionWordPerfect 12‑14 (Speichern als .docx, .pdf)100 % Layout‑Treue für unterstützte FeaturesBenötigt lizenziert­es Windows‑WordPerfect; begrenzte Automatisierung
Spezial‑KonvertierungssoftwareAble2Extract, Zamzar Desktop, UniDOCStapelverarbeitung, skriptbare APIs, Unterstützung für eingebettete ObjekteKann komplexe Layouts missinterpretieren; Lizenzkosten
Cloud‑basierte Konverterconvertise.app, CloudConvert, Zamzar (online)Keine lokale Installation, skalierbar, API‑ZugangAbhängig von Internet‑Bandbreite; Datenschutz‑Compliance prüfen

Für ein großes, datenschutzsensibles Archiv funktioniert ein hybrider Ansatz gut: Verwenden Sie eine lokal installierte WordPerfect‑Instanz (oder eine lizenzierte Testversion) für die komplexesten Dateien und greifen Sie bei den unkomplizierten Dokumenten auf einen Cloud‑Service wie convertise.app zurück. Convertise verarbeitet Dateien nach Möglichkeit vollständig im Browser, sodass die Quelle nie das Gerät des Nutzers verlässt – ein entscheidender Faktor bei vertraulichen Rechtsverträgen.

5. Detaillierter Konvertierungs‑Workflow

Im Folgenden ein wiederholbarer, schritt‑für‑Schritt‑Prozess, der nach Auswahl der Werkzeuge skriptgesteuert werden kann.

5.1 Automatisiertes Vor‑Check‑Skript (PowerShell‑Beispiel)

# Durchsucht einen Ordner nach .wpd‑Dateien und erzeugt einen CSV‑Report
Get-ChildItem -Path "E:\LegacyWPD" -Recurse -Filter *.wpd |
Select-Object FullName, Length, LastWriteTime |
Export-Csv -Path "E:\ConversionReport\wpd_inventory.csv" -NoTypeInformation

Der erzeugte CSV‑Report wird an die Batch‑Engine übergeben, sodass Sie Dateien über einer bestimmten Größe (> 5 MB) für eine manuelle Prüfung kennzeichnen können.

5.2 Stapelkonvertierung via Convertise‑CLI (hypothetisch)

# Angenommen, convertise stellt einen CLI‑Wrapper namens cs-cli bereit
cs-cli batch \
  --input "E:/LegacyWPD/**/*.wpd" \
  --output-format docx \
  --output-dir "E:/Converted/DOCX" \
  --log "E:/ConversionReport/batch_log.txt"

Der CLI bewahrt die ursprünglichen Zeitstempel und schreibt für jede Ausgabedatei einen Checksum‑Wert (SHA‑256). Diese Hashes bilden die Grundlage für die spätere Verifikation.

5.3 PDF/A‑Erstellung (mit LibreOffice im Headless‑Modus)

libreoffice --headless --convert-to pdf:writer_pdf_Export --outdir "E:/Converted/PDF" "E:/Converted/DOCX/*.docx"
# Nachbearbeitung mit Ghostscript, um PDF/A‑2‑Konformität zu erzwingen
for f in E:/Converted/PDF/*.pdf; do
  gs -dPDFA -dBATCH -dNOPAUSE -sProcessColorModel=DeviceRGB \
     -sDEVICE=pdfwrite -sOutputFile="${f%.pdf}_pdfa.pdf" "$f"
done

Dieser zweistufige Ansatz stellt sicher, dass die resultierenden PDFs den Archivierungsstandards entsprechen.

5.4 Validierung und Qualitätssicherung

  1. Checksum‑Vergleich – Prüfen Sie, dass die Quelldatei während der Konvertierung nicht verändert wurde, indem Sie bestätigen, dass der Vor‑Konvertierungs‑Hash mit dem Hash der Begleit‑Metadatendatei übereinstimmt.
  2. Visuelle Stichprobe – Wählen Sie zufällig 5 % der konvertierten Dokumente aus. Öffnen Sie sie in Word/LibreOffice und vergleichen Sie Seitenzahl, Kopf‑/Fußzeilen‑Konsistenz und Tabellenausrichtung.
  3. Metadaten‑Audit – Extrahieren Sie Eigenschaften mit exiftool oder pdfinfo und prüfen Sie, ob Autor, Erstellungsdatum und Stichwörter erhalten geblieben sind. Fehlende Felder können per Skript aus der ursprünglichen Inventar‑CSV nachgetragen werden.

6. Umgang mit eingebetteten Objekten und Makros

6.1 OLE‑Objekte extrahieren

WordPerfect speichert OLE‑Objekte als Binär‑Streams. Werkzeuge wie Ole2Extract können diese vor der Konvertierung herausziehen. Nach dem Extrahieren können Sie sie manuell oder über ein Makro wieder in das Ziel‑Dokument einbetten.

6.2 WordPerfect‑Makros behandeln

Da WPM‑Makros nicht portierbar sind, ist der sicherste Weg, das Makro in einer WordPerfect‑Umgebung auszuführen, den resultierenden Inhalt als statisches Dokument (z. B. PDF) zu exportieren und dann dieses statische Ergebnis zu konvertieren. Enthält das Makro nur Text, kann die Logik ggf. in einem einfachen Python‑Skript reproduziert werden, das die rohe *.wpd‑Datei mit einer Bibliothek wie python‑wpd (sofern verfügbar) verarbeitet.

7. Metadaten erhalten und abbilden

Standard‑Metadatenfelder, die die Konvertierung überstehen, sind:

  • Titledc:title (PDF) bzw. coreProperties.title (DOCX)
  • Authordc:creator / coreProperties.author
  • Subject/Keywordsdc:description / coreProperties.subject
  • Creation/Modification Datesdcterms:created / dcterms:modified

Falls ein Konvertierungstool diese Felder verwirft, kann ein Nachbearbeitungsschritt sie wieder einfügen. Beispiel für DOCX mit python‑docx:

from docx import Document
import csv, datetime
from pathlib import Path

metadata = {row['filename']: row for row in csv.DictReader(open('wpd_inventory.csv'))}
for file in Path('E:/Converted/DOCX').glob('*.docx'):
    doc = Document(str(file))
    meta = metadata[file.name]
    doc.core_properties.title = meta.get('title', '')
    doc.core_properties.author = meta.get('author', '')
    if meta.get('created'):
        doc.core_properties.created = datetime.datetime.fromisoformat(meta['created'])
    doc.save(str(file))

8. Batch‑Automatisierung für große Sammlungen

Enthält das Archiv Zehntausende von Dateien, kann ein warteschlangenbasiertes System wie RabbitMQ oder AWS SQS die Worker koordinieren, die die Konvertierungsschritte asynchron ausführen. Jeder Worker holt eine Nachricht mit dem Dateipfad, führt die Pipeline aus, schreibt das Ergebnis in einen Ausgabebucket und veröffentlicht ein Erfolgs‑/Fehlerinformation‑Event. Dieses Design bietet:

  • Skalierbarkeit – Zusätzliche Worker können hochgefahren werden, wenn die Warteschlange sich staut.
  • Fehlertoleranz – Fehlgeschlagene Jobs werden automatisch erneut versucht.
  • Auditing – Jede Nachricht enthält eine eindeutige Kennung; Logs werden zentral für Compliance‑Berichte gesammelt.

9. Datenschutz‑ und Compliance‑Überlegungen

Auch wenn viele alte WordPerfect‑Dateien intern sind, können sie personenbezogene Daten (PII) oder geschützte Gesundheitsinformationen (PHI) enthalten. Bevor Sie irgendeine Datei an einen Cloud‑Service senden, stellen Sie sicher:

  1. Daten‑Residency – Der Service verarbeitet Dateien in derselben Rechtsordnung wie Ihr Unternehmen.
  2. End‑to‑End‑Verschlüsselung – Dateien werden während der Übertragung (TLS) und, wo möglich, für die kurze Verarbeitungsdauer auch im Ruhezustand verschlüsselt.
  3. Keine persistente Speicherung – Vergewissern Sie sich, dass der Anbieter nach der Konvertierung keine Kopien behält. Convertise.app beispielsweise verwirft Dateien sofort nach Abschluss der Konvertierung.

Erfüllt eine Datei diese Kriterien nicht, bleibt die Konvertierung on‑premise.

10. Archivierung der konvertierten Assets

Nach erfolgreicher Konvertierung speichern Sie die Ergebnisse gemäß Ihrer Aufbewahrungsrichtlinie. Eine empfohlene Hierarchie:

ArchiveRoot/
├── Original_WPD/        # Nur‑Lese‑Backup, unveränderlich
├── DOCX_Editable/       # Für zukünftige Bearbeitungen
├── PDF_A_Archive/       # Langzeit‑, Nur‑Lese‑Archiv
└── Metadata/            # CSV‑Reports, Checksummen, Audit‑Logs

Verwenden Sie für die PDF/A‑Ebene ein WORM‑Speicher‑Tier (Write‑Once‑Read‑Many), um versehentliche Änderungen zu verhindern. Setzen Sie Deduplizierung ein, um Speicher zu sparen, während die Checksum‑Integrität erhalten bleibt.

11. Häufige Stolpersteine und Lösungen

SymptomWahrscheinliche UrsacheLösung
Fehlende Schriften, verschobener TextSchrift nicht installiert oder falsche MetrikExakte Original‑Schrift installieren bzw. Schrift‑Substitutions‑Map im Konverter einstellen
Tabellen zerfallen zu einfachem TextKonverter erkennt WordPerfect‑Tabellen‑Markup nichtVor‑Verarbeitung der *.wpd mit WordPerfects „Export as RTF“ und anschließend RTF‑zu‑DOCX konvertieren, um Tabellenstrukturen zu erhalten
Fußnoten verschwindenFußnoten‑Stil nicht unterstützt im Ziel‑Format„Footnotes preserve“-Option aktivieren; alternativ zuerst zu PDF konvertieren, dann PDF‑zu‑DOCX mittels OCR‑basierter Extraktion für Fußnotentext
Eingebettetes Excel‑Diagramm wird zu BildOLE‑Objekt nicht geparstOLE separat extrahieren, Excel‑Datei konvertieren und dann wieder in das Ziel‑Dokument einbetten
Checksum‑Abweichung nach KonvertierungDatei wurde während der Konvertierung (z. B. Zeilenende‑Umwandlung) verändertEinen Modus verwenden, der binäre Integrität wahrt (z. B. „Exact copy“-Option) oder nachträglich einen Binär‑Diff durchführen, um sicherzustellen, dass nur beabsichtigte Änderungen stattfinden

12. Zukunftssicherheit des konvertierten Bestands

Liegt das Material in offenen, gut dokumentierten Formaten (DOCX, PDF/A, ODT) vor, sinkt das Risiko der Obsoleszenz stark. Um dies zu festigen:

  • Validierung gegen Standards – PDF/A‑Validierungstools (z. B. veraPDF) und DOCX‑Schema‑Validatoren ausführen.
  • Regelmäßige Medienmigration – Alle 5‑7 Jahre auf neuere Speichermedien umstellen.
  • Konvertierungs‑Rezept archivieren – Die genauen Befehlszeilen‑Argumente, Tool‑Versionen und Schriftenpakete festhalten. Dieses Rezept ermöglicht bei Änderungen an nachgelagerten Systemen ein erneutes Erzeugen der gleichen Ergebnisse.

Durch die Behandlung der WordPerfect‑Legacy‑Konvertierung als diszipliniertes Daten‑Migrationsprojekt – komplett mit Inventarisierung, kontrollierten Werkzeugen, automatisierter Validierung und robuster Archivierung – können Organisationen jahrzehntelangen wertvollen Inhalt freischalten, ohne Layout‑Treue oder Compliance zu opfern. Ganz gleich, ob Sie eine rein lokale Lösung bevorzugen oder datenschutz‑bewusste Cloud‑Tools wie convertise.app einsetzen, die hier dargelegten Prinzipien halten den Prozess transparent, wiederholbar und prüfbar.