Barrierefreie Dokumente durch durchdachte Dateikonvertierung erstellen

Barrierefreiheit ist mehr als eine Checkliste; sie ist eine Designphilosophie, die sicherstellt, dass jeder — unabhängig von einer Behinderung — digitale Inhalte mühelos nutzen kann. Wenn ein Dokument von einem Format in ein anderes überführt wird, können die zugrunde liegende Struktur, Tags und Beschreibungen, die Bildschirmleser und unterstützende Technologien ermöglichen, verloren gehen oder beschädigt werden. Eine Konvertierung, die lediglich das visuelle Erscheinungsbild reproduziert, ohne die Semantik zu berücksichtigen, erzeugt häufig eine Datei, die auf dem Bildschirm gut aussieht, aber für Nutzerinnen und Nutzer, die auf Tastaturnavigation, Sprachassistenten oder Braille‑Displays angewiesen sind, zum Hindernis wird. Dieser Artikel führt die praktischen Schritte aus, die nötig sind, um Barrierefreiheit bei der Dateikonvertierung zu erhalten und sogar zu verbessern. Er behandelt die gängigsten Quell‑ und Zielformate, die technischen Details semantischer Auszeichnung und die Werkzeuge, die bei der Prüfung der Konformität helfen.

Verständnis der Barrierefreiheitsanforderungen

Im Kern des barrierefreien Dokumenten‑Designs stehen drei Säulen: Wahrnehmbarkeit, Bedienbarkeit und Verständlichkeit. Wahrnehmbarkeit verlangt, dass alle Informationen in einer Form präsentiert werden, die Nutzer*innen über Sehen, Hören oder Tasten erfassen können. Bedienbarkeit fordert, dass Navigation und Interaktion über Tastatur oder alternative Eingabemethoden möglich sein müssen. Verständlichkeit verlangt eine klare, logische Struktur und vorhersehbares Verhalten.

Beim Konvertieren von Dateien wird jede Säule in konkrete technische Erwartungen übersetzt. Für ein PDF schreibt die PDF/UA‑Norm (Universal Accessibility) getaggte Inhalte, eine korrekte Lesereihenfolge und Alternativtexte für Nicht‑Text‑Elemente vor. Für ein EPUB verlangt die EPUB Accessibility 1.0‑Spezifikation semantisches HTML, ARIA‑Rollen dort, wo sie benötigt werden, und korrekte Navigationslandmarken. Word‑Dokumente müssen Überschriften‑Stile, Listenstrukturen und Alt‑Texte beibehalten. Das Ignorieren dieser Attribute während der Konvertierung kann dazu führen, dass unterstützende Software das Dokument falsch interpretiert, was zu Verwirrung oder verlorenen Informationen führt.

Auswahl des richtigen Zielformats

Nicht jedes Format ist gleichermaßen für Barrierefreiheit geeignet. Die Entscheidung muss die Bedürfnisse der Zielgruppe, den Vertriebskanal und die technischen Möglichkeiten des gewählten Formats ausbalancieren.

  • PDF/UA – Ideal für statische, druckbare Dokumente, die das Layout genau beibehalten müssen. Geeignet für Rechtsverträge, akademische Arbeiten und behördliche Formulare.
  • EPUB (mit Barrierefreiheits‑Erweiterungen) – Perfekt für fließenden Text, etwa Romane, Handbücher und Anleitungsguides, bei denen Leser*innen die Schriftgröße ändern oder in einen Dunkel‑Modus wechseln können.
  • HTML – Wenn das Dokument online konsumiert wird, bietet eine gut strukturierte HTML‑Seite die umfangreichsten Barrierefreiheits‑Funktionen.
  • DOCX – Sinnvoll, wenn nachträgliche Bearbeitung nötig ist, allerdings nur, wenn die Bearbeitungsumgebung (z. B. Microsoft Word) die Barrierefreiheits‑Metadaten respektiert.

Das Verständnis dieser Trade‑offs hilft dabei, einen Konvertierungsweg zu wählen, der Barrierefreiheit nicht dem Komfort opfert.

Erhalt semantischer Strukturen

Der häufigste Grund für das Scheitern von Barrierefreiheit ist der Verlust semantischer Informationen — Überschriften, Listen, Tabellen und Lesereihenfolge. Während der Konvertierung muss die Engine die Quell‑Auszeichnung zu entsprechenden Tags im Zielformat abbilden, anstatt alles zu reinem Text oder Rasterbildern zu verflachen.

Von Word zu PDF/UA

Microsoft Word speichert strukturelle Informationen in Stildefinitionen (z. B. Überschrift 1, Überschrift 2, List Paragraph). Beim Export nach PDF sicherstellen, dass die Option „Getaggtes PDF erstellen“ aktiviert ist. Dadurch bettet Word die Stilhierarchie als PDF‑Tags ein, die Bildschirmleser als logische Gliederung interpretieren. Wird ein Drittanbieter‑Konverter verwendet, prüfen, ob er die Tags „Heading」 und „Structure」 respektiert; andernfalls muss das PDF nachträglich mit einem Werkzeug wie Adobe Acrobat Pro bearbeitet werden, um fehlende Tags manuell hinzuzufügen.

Von PDF zu EPUB

Die Konvertierung eines statischen PDFs in ein fließbares EPUB ist schwierig, weil PDFs häufig keine logische Reihenfolge besitzen. Ein robustes Konvertierungs‑Workflow extrahiert die internen Textobjekte des PDFs, analysiert Leerzeichen, um Absätze abzuleiten, und rekonstruiert einen semantischen HTML‑Baum. Werkzeuge, die OCR mit Layout‑Analyse kombinieren — z. B. pdf2epub mit einem Machine‑Learning‑Backend — schneiden besser ab als einfache Bitmap‑zu‑Text‑Konverter, weil sie Überschriften und Listen erhalten statt alles in einen einzigen Block zu wandeln.

Von Bildern zu barrierefreien Formaten

Enthält ein Dokument gescannte Bilddateien, muss vor der Konvertierung OCR (Optical Character Recognition) eingesetzt werden. OCR extrahiert nicht nur den Text, sondern ermöglicht auch das Zuweisen passender Tags zu Überschriften, Tabellen und Bildunterschriften. Einige OCR‑Engines, z. B. ABBYY FineReader, erlauben das Einbetten des erkannten Textes direkt in ein PDF/UA mit durchsuchbaren Schichten und auswählbaren Überschriften.

Umgang mit Bildern und Alternativtexten

Bilder transportieren in vielen Dokumenten Bedeutung — Diagramme, schematische Darstellungen, dekorative Symbole und Fotos. Für Bildschirmleser*innen ist der einzige Weg, diese Bedeutung zu vermitteln, der Alternativtext (Alt‑Text). Während der Konvertierung:

  1. Bildelemente erkennen – Jede <img>‑Markierung im HTML oder jedes Bildobjekt im PDF identifizieren.
  2. Vorhandene Alt‑Attribute extrahieren – Moderne Autorentools speichern häufig Alt‑Texte; diese beibehalten.
  3. Alt‑Text generieren, wo er fehlt – Fehlt die Beschreibung im Quell‑Dokument, KI‑gestützte Caption‑Dienste (z. B. Microsoft Azure Computer Vision) nutzen, um knappe Beschreibungen zu erzeugen. Den erzeugten Text manuell prüfen; automatisierte Bildunterschriften können Nuancen übersehen.
  4. Alt‑Text einbetten – In PDFs wird Alt‑Text als /ActualText‑Eintrag gespeichert; in EPUB/HTML gehört er ins alt‑Attribut.

Der Versuch, dekorative Bilder ohne jegliche Beschreibung zu lassen, sollte vermieden werden. Im HTML kann role="presentation" oder ein leeres alt="" gesetzt werden, um anzugeben, dass das Bild rein dekorativ ist. In PDF/UA setzt man das /Artifact‑Flag, sodass unterstützende Technologien das Bild komplett überspringen.

Tabellen und komplexe Layouts verwalten

Tabellen sind eine häufige Fehlerquelle, weil sie Daten mit visueller Formatierung verbinden. Eine Konvertierung, die eine Tabelle in ein Bild umwandelt, verliert die Zellbeziehungen und macht es assistiver Software unmöglich, die Informationen zu vermitteln.

  • Tabellensemantik erhalten – Sicherstellen, dass das Zielformat korrekte <table>, <thead>, <tbody> und <th>‑Tags (oder PDF‑Tabellen‑Tags) enthält. Beim Konvertieren von Word die Option „Tabellenkonvertierung“ aktivieren, die Word‑Tabellen vor der PDF‑Erstellung in HTML‑Tabellen überführt.
  • Zusammenfassung und Caption bereitstellen – Sowohl HTML als auch PDF/UA unterstützen eine kurze Zusammenfassung, die den Zweck der Tabelle erklärt. Diese als <caption>‑Element im HTML oder als Table Caption‑Tag im PDF einbinden.
  • Verschachtelte Tabellen vermeiden – Verschachtelte Strukturen stören häufig die Lesereihenfolge. Werden sie im Quell‑Dokument nur für das Layout genutzt, sollten sie in eine einzige, gut strukturierte Tabelle umgestaltet oder das visuelle Alignment mittels CSS realisiert werden.

Bei stark formatierten Berichten — z. B. Finanzberichte mit mehrspaltigen Layouts — das Dokument zunächst in logische Abschnitte zerlegen und jeden Abschnitt separat konvertieren, um eine saubere Auszeichnungshierarchie zu bewahren.

Konvertierung zu barrierefreien PDFs (PDF/UA)

PDF/UA‑Konformität ist ein anspruchsvolles, aber erreichbares Ziel. Der Konvertierungsprozess lässt sich in drei Phasen unterteilen:

  1. Quellvorbereitung – Überschriften‑, Listen‑ und Alt‑Text‑Stile im Autorentool anwenden. Eingebaute Barrierefreiheits‑Checker (Word‑Accessibility‑Checker, Adobe InDesign‑Accessibility‑Panel) nutzen, um Probleme vor dem Export zu beheben.
  2. Getaggter Export – Das Dokument als getaggtes PDF exportieren. In Word: Datei → Speichern unter → PDF und die Option „Best für elektronische Verteilung und Barrierefreiheit“ aktivieren. In InDesign: „Create Tagged PDF“ und „Include Structure Tags for Accessibility“ einschalten.
  3. Post‑Export‑Validierung – Einen Validator wie PAC 3 (PDF Accessibility Checker) oder das kostenlose pdfaPilot‑Tool ausführen. Diese Werkzeuge prüfen das PDF auf fehlende Tags, ungetaggte Bilder und Lesereihenfolge‑Probleme. Identifizierte Mängel entweder manuell in Acrobat Pro beheben oder das Ausgangsdokument erneut anpassen.

Für die Verarbeitung großer PDF‑Mengen kann eine automatisierte Pipeline auf Basis von Ghostscript und pdf2pdf‑Skripten gebaut werden, die Tags erhalten. Dennoch sollte ein Stichproben‑Set geprüft werden, um sicherzustellen, dass keine kritischen Metadaten verloren gehen.

Barrierefreiheit in E‑Books (EPUB)

E‑Books stellen eigene Herausforderungen dar, weil sie von Natur aus fließend sind. Das EPUB‑Format ist im Wesentlichen ein gezipptes Bündel aus HTML, CSS und Bild‑Assets. So wird ein EPUB barrierefrei:

  • Richtige Überschriftenhierarchie verwenden<h1> bis <h6> sollten die logische Gliederung von Kapiteln und Abschnitten widerspiegeln.
  • Navigationsdokument bereitstellen – Die nav.xhtml‑Datei fungiert als Inhaltsverzeichnis für Bildschirmleser. Jede Zeile muss auf das korrekte Landmark verweisen.
  • ARIA‑Landmarks hinzufügen – Bei komplexen Seiten role="navigation", role="main" und role="complementary" einbinden, um Nutzern das Springen zu wichtigen Bereichen zu erleichtern.
  • Bildbeschreibungen sichern – Wie bei PDFs alt‑Attribute für jedes Bild einbetten.
  • Mit EPUBCheck validieren – Das W3C‑Tool EPUBCheck meldet fehlende Landmarks, nicht referenzierte Dateien und andere Barrierefreiheits‑Lücken.

Die Konvertierung von DOCX zu einem barrierefreien EPUB lässt sich mit LibreOffice s Export as EPUB‑Funktion durchführen, dabei jedoch die Option „Export headings as structure“ aktivieren und das resultierende HTML manuell nach fehlenden Alt‑Texte prüfen. Für zuverlässigere Ergebnisse empfiehlt sich ein spezialisierter Konvertierungsdienst, der die EPUB‑Accessibility‑Spezifikation einhält.

Test‑ und Validierungs‑Werkzeuge

Ein Konvertierungs‑Workflow ist ohne systematisches Testen unvollständig. Nachfolgend die verlässlichsten Werkzeuge für jedes Format:

  • PDF/UAPAC 3, Adobe Acrobat Pro Accessibility Checker, NVDA (kostenloser Screen‑Reader) für manuelle Navigations‑Checks.
  • EPUBEPUBCheck, Ace by DAISY, VoiceOver auf macOS für die Prüfung der Lesereihenfolge.
  • HTMLWAVE Web Accessibility Evaluation Tool, axe DevTools und manuelle Inspektion mit einem Screen‑Reader.
  • DOCX – Der integrierte Accessibility Checker von Microsoft Word, gefolgt von einem kurzen Test in NVDA, um Überschriften und Listenstrukturen zu bestätigen.

Diese Werkzeuge nach jeder Konvertierung auszuführen, fängt Regressionen frühzeitig ab. Sie können in eine Continuous‑Integration‑Pipeline eingebunden werden, wenn großflächige, automatisierte Konvertierungen durchgeführt werden.

Workflow‑Tipps für konsistente Ergebnisse

  1. Quell‑Stilrichtlinien standardisieren – Vor der Konvertierung einen Style‑Guide über alle Dokumente hinweg durchsetzen. Einheitliche Überschriftenebenen, Listenformate und Bildbezeichnungen erleichtern das automatisierte Mapping.
  2. Konvertierungs‑Checkliste erstellen – Die erforderlichen Barrierefreiheits‑Attribute (Tags, Alt‑Text, Captions) auflisten und nach der Konvertierung jedes Element prüfen.
  3. Ein einziges Konvertierungs‑Engine verwenden, wenn möglich – Der Wechsel zwischen mehreren Tools kann Variabilität einführen. Dienste wie convertise.app bieten cloud‑basierte Konvertierung, die Tags respektiert und per Skript für Batch‑Verarbeitung nutzbar ist, während die Dateien nicht lokal gespeichert werden.
  4. Ausnahmen dokumentieren – Enthält eine Datei eine komplexe Tabelle, die der Konverter nicht verarbeiten kann, notieren und einen manuellen Nachbearbeitungsschritt einplanen.
  5. Versionskontrolle – Quell‑ und konvertierte Dateien in einem Repository (z. B. Git) ablegen, um Änderungen, die Barrierefreiheits‑Lücken einführen, nachverfolgen zu können.

Durch die Verankerung dieser Gewohnheiten im Arbeitsalltag reduzieren Teams das Risiko, nicht‑barrierefreie Dokumente zu veröffentlichen.

Häufige Stolperfallen und wie man sie vermeidet

  • PDFs flattenen – Die Umwandlung eines PDFs in eine rein bildbasierte Version zerstört Durchsuchbarkeit und Tags. Das Original‑PDF als Quelle behalten; nur rasterisieren, wenn ein nicht‑editierbares Grafik‑Element unbedingt eingebettet werden muss.
  • Nur auf visuelles Layout setzen – Eine optisch ansprechende Seite kann eine Lesereihenfolge besitzen, die hin‑und‑her springt. Das Reading Order‑Panel in Acrobat bzw. den DOM‑Inspector im Browser nutzen, um den logischen Fluss zu prüfen.
  • Sprachattribute vernachlässigen – Bei mehrsprachigen Dokumenten lang="en" oder lang="fr" im Wurzelelement von HTML/EPUB und das Language‑Tag im PDF angeben. Screen‑Reader nutzen diese Angabe für korrekte Aussprache‑Regeln.
  • Standard‑Alt‑Text für ausreichend halten – Generische Beschreibungen wie „image1“ liefern keinen Mehrwert. Durch kontextspezifische Beschreibungen ersetzen, die den Zweck des Bildes vermitteln.
  • Validierung überspringen – Schon ein fehlendes Tag kann die Navigation eines Screen‑Readers zum Stillstand bringen. Validierung als unverzichtbaren Schritt treatieren, nicht als optionalen Nachgedanken.

Fazit

Barrierefreiheit ist kein nachträglicher Gedanke, sondern ein integraler Bestandteil des Konvertierungsprozesses. Durch die Behandlung von semantischer Struktur, Alternativtext, Tabellenauszeichnung und Sprachattributen als Erst‑Klasse‑Komponenten lässt sich ein simples Dateiformat in eine universell nutzbare Ressource verwandeln. Der Weg beginnt mit diszipliniertem Autorieren — einheitliche Überschriften, korrekter Alt‑Text und klare Tabellen — setzt sich fort über die sorgsame Auswahl des Zielformats und endet mit einer rigorosen Validierung mithilfe spezialisierter Werkzeuge. Wird dieser Ablauf in einen wiederholbaren Workflow eingebettet, können Organisationen PDFs, EPUBs und HTML‑Dokumente sicher verbreiten, die allen Nutzer*innen, unabhängig von ihren Fähigkeiten, gerecht werden. Das Befolgen solcher Praktiken entspricht nicht nur gesetzlichen Vorgaben und ethischen Verpflichtungen, sondern steigert zudem die Gesamtqualität und Professionalität digitaler Kommunikation.