♿️Alternativtexte

In dieser Artikelreihe (Teil 1, Teil 2 und Teil 3) möchten wir von einem konkreten Projekt berichten. Wir durften dabei helfen, die Backlist eines Verlages barrierefrei zu machen. Vielleicht interessiert dich ein solches Projekt. Wir haben definitiv viel gelernt und teilen das Gelernte gerne hier im Blog mit dir - zumindest einen Teil davon! ☺️

Besonders spannend war das Thema „Alternativtexte“. Denn schon alleine die enorme Anzahl der Bilder war eine Herausforderung. Und neben „normalen“ Fotos gab es viele Schaubilder, Diagramme und auch Comics.

Große Zahl

Da wir nicht nur von Bildern reden, sondern auch von einer großen Anzahl von Symbolen, Icons und so weiter, reden wir von über 300.000 Objekten, die einen Alternativtext benötigen. Das ist selbstverständlich nicht konventionell zu lösen. Dass Menschen diese Texte erzeugen, hätte sowohl den Kosten- als auch den Zeitrahmen gesprengt.

Da kam uns die KI-Technologie gerade recht.

Besondere Anforderungen

Schauen wir uns das Bild an - stell es dir zunächst ohne die roten Rechtecke vor.

Dieses Bild hat ein leeres Alt-Attribut. Der Dateiname ist image-1.jpg

Es handelt sich um ein Bild mit textlosen Blanko-Namensschildern. Die Texte wurden in InDesign drüber gesetzt.

Dies würde im barrierefreien PDF für Probleme sorgen, denn was will man mit einem Bild mit dem Alternativtext „Sechs leere Namensschilder“ und dann sechsmal die Texte „Hello my name is“ gefolgt von „Brian“, „Sarah“, „James“ und so weiter.

Daher lautete die Arbeitsanweisung an den Dienstleister, die Seitenelemente in dieser Form mit <figure> Tags zu versehen.

Auch im folgenden Fall wird ein besonderes Vorgehen nötig. Wenn das in InDesign gebaut wurde, dann ist jeder Text ein Text. Allerdings macht es keinen Sinn, dass „Attach File“ oder „Dictate“ im Screenreader vorgelesen wird. Denn das hat alles nur illustrativen Charakter. Daher wurde im Projekt beschlossen, dass das alles komplett als „Figure“ getaggt wird.

Der „ATC“

Diese Software, der „Alternative Text Creator“, wurde von der Firma „Actino“ entwickelt. Wir haben sie per API in unseren Switch-Flow integriert. Im Detail funktioniert das Ganze so:

Der Dienstleister taggt die PDFs. Schaut also, dass die richtigen Seitenobjekte einen <figure>-Tag bekommen, so wie oben beschrieben. Zusätzlich werden alle „normalen“ Bilder und auch alle Symbole und Icons entsprechend getaggt.

Diese PDFs lädt der Dienstleister nun in einen Nextcloud-Ordner hoch.

Unser Enfocus-Switch lädt sich diese PDFs herunter und übergibt diese an den „ATC“.

Der wiederum trennt die „Figure“-Tags aus dem PDF. Er macht quasi aus den „roten Rechtecken“ kleine „Screenshots“.

Diese lädt er zu „OpenAI“ zusammen mit einem Prompt, der die genaue Anforderung des Alternativtextes enthält. Außerdem enthält er die Angabe der Sprache, denn der Kunde hat Titel in verschiedenen Sprachen.

Im Ergebnis erhalten wir in den <figure>-Tags die richtigen Alternativtexte: „Ein Namensschild mit der Aufschrift ‚Hello my name is Brian‘“ oder „Ein typisches Fenster eines E-Mail-Programmes, dass den schematischen Aufbau einer E-Mail illustriert“.

Wie bereits erwähnt, wäre das Projekt ohne diese KI-basierte Lösung undenkbar gewesen. Der manuelle Aufwand wäre nicht zu leisten und die Kosten wären explodiert. Die von „OpenAI“ erstellten Texte - zusätzlich noch in leichter Sprache - sind überraschend gut!
Christoph Steffens