Het begrijpen van de rol van bestandsconversie in lokalisatie
Lokalisatie is meer dan woorden vertalen; het is het proces waarbij elk stukje content – tekst, grafische elementen, lay‑out en interactieve onderdelen – wordt aangepast aan een doeltaal en -cultuur. In het kernproces hiervan zit bestandsconversie. Of een marketingbrochure nu binnenkomt als een Adobe InDesign‑bestand, een producthandleiding als een Word‑document, of een UI‑mock‑up als een gelaagd Photoshop‑bestand, elk formaat brengt zijn eigen uitdagingen met zich mee voor vertalers, ontwerpers en ontwikkelaars. Het omzetten van deze bron‑assets naar formaten die zowel lokalisatie‑vriendelijk als downstream‑klaar zijn, bepaalt of het project op schema blijft, aan de kwaliteitseisen voldoet en kostbaar herwerk vermijdt.
Een goed ontworpen conversiepijplijn moet drie doelen bereiken: (1) de visuele getrouwheid behouden zodat look‑and‑feel consistent blijft na de vertaling, (2) vertaalbare content blootleggen in een formaat dat lokalisatietools kunnen importeren zonder handmatige extractie, en (3) metadata behouden of mappen die workflow‑automatisering aandrijven, zoals taaltags, versienummers en asset‑herkomst. De volgende secties splitsen de praktische stappen uiteen die nodig zijn voor elk type asset en belichten valkuilen die lokalisatieprojecten vaak doen ontsporen.
Tekst‑zware documenten voorbereiden voor vertaling
Kies een tussenvormaat met gestructureerde tekst
Bronbestanden die tekst combineren met een complexe lay‑out – Word, InDesign of PowerPoint – plaatsen tekst vaak binnen grafische kaders, voetnoten of tabellen. Het direct leveren van die binaire bestanden aan een Translation Management System (TMS) kan de structuur verbergen, wat leidt tot kapotte opmaak in de doeltaal. De voorkeursaanpak is om het oorspronkelijke bestand te converteren naar een uitwisselformaat dat de hiërarchie bewaart en tegelijk platte tekst blootlegt. Twee breed geaccepteerde opties zijn:
- XLIFF (XML Localization Interchange File Format) – Specifiek ontworpen voor lokalisatie, scheidt XLIFF bron‑ en doel‑segmenten, behoudt contextinformatie en kan aangepaste notities voor vertalers embedden. De meeste moderne TMS‑platforms kunnen XLIFF direct importeren.
- HTML/XML met taalattributen – Wanneer het oorspronkelijke document web‑gericht is, maakt export naar schone HTML (semantische tags,
lang‑attributen) het mogelijk om in vertrouwde WYSIWYG‑ of CAT‑tools te werken terwijl de structurele markup intact blijft.
De conversiestap moet verliesloos zijn voor lay‑outinformatie: converteer de bron eerst naar PDF/A om het visuele ontwerp vast te zetten, haal daarna de tekst uit in XLIFF of HTML met een tool die regeleinden, tabellen en ingebedde objecten behoudt. Diensten zoals convertise.app kunnen de PDF/A‑generatie uitvoeren zonder registratie, zodat de visuele basis ongerept blijft.
Stijlen, variabelen en placeholders behouden
Tijdens lokalisatie moeten placeholders (bijv. {{username}}, %1$s) onveranderd blijven; anders kunnen ze per ongeluk vertaald of kapot gemaakt worden. Bij export naar XLIFF, map deze tokens naar niet‑vertaalbare segmenten met de <mrk>‑tag en het attribuut type="x-placeholder". In HTML, wikkel placeholders in <span class="notranslate"> of gebruik het attribuut translate="no". Deze expliciete markering voorkomt dat CAT‑tools de markup aanpassen en houdt het uiteindelijke samengestelde document functioneel.
Omgaan met rechts‑naar‑links (RTL) talen
RTL‑talen zoals Arabisch of Hebreeuws vereisen niet alleen een wijziging in tekstrichting, maar ook aanpassingen in de lay‑out – het spiegelen van UI‑elementen, herordenen van tabellen en het verwisselen van iconen die richting aangeven. Na conversie van de bron naar een tussenvormaat, voer een validatiescript uit dat controleert op hardgecodeerde links‑gealigneerde eigenschappen (bijv. text-align:left;). Vervang deze door logische eigenschappen (text-align:start;) zodat dezelfde stylesheet zowel LTR‑ als RTL‑locales kan ondersteunen. Deze voorbereiding vermindert de handmatige inspanning later in de ontwerp‑fase.
Grafische elementen en afbeeldingen behandelen
Tekst uit afbeeldingen halen vóór vertaling
Veel marketing‑assets hebben tekst direct ingebed in rasterafbeeldingen (JPEG, PNG) of vector‑graphics (SVG, AI). Het vertalen van zulke assets vereist ofwel een volledige herontwerp, ofwel een gelaagde workflow waarbij de oorspronkelijke tekst wordt verwijderd en vervangen. Het conversie‑proces moet daarom:
- De afbeelding scheiden van de tekstlaag – Exporteer gelaagde bestanden (PSD, AI) naar een formaat dat lagen behoudt (bijv. gelaagde PDF). Als alleen een vlakke rasterafbeelding beschikbaar is, voer OCR uit om de tekst naar een side‑car‑bestand te extraheren.
- Lokalisatie‑placeholders creëren – Vervang geëxtraheerde strings door placeholders die overeenkomen met de token‑syntaxis die in het hoofd‑document wordt gebruikt.
- Een lokalisatie‑klare afbeelding exporteren – Sla de graphic op als een hoogwaardige PNG of WebP voor het ontwerpteam, terwijl de vertaalde tekst later wordt samengevoegd met dezelfde laagstructuur.
Het behouden van de oorspronkelijke bewerkbare bron (PSD, AI) is essentieel; tekst uit een afgeplatte JPEG strippen betekent dat de enige optie is om de afbeelding helemaal opnieuw te maken.
Kleurenprofielen en DPI behouden
Wanneer graphics worden geconverteerd voor lokalisatie, moet altijd het oorspronkelijke ICC‑profiel en de DPI behouden blijven. Een wijziging in de kleurenspace kan merkkleuren verschuiven, wat problematisch is wanneer de doellocatie strikte visuele richtlijnen heeft. Gebruik verliesloze conversietools die het originele profiel embedden in het bestemmingsbestand, en controleer het resultaat met een kleurbeheertool voordat je het aan het lokalisatieteam geeft.
Multimedia‑assets aanpassen
Ondertitels en captions
Videolokalisatie draait om nauwkeurige ondertitel‑bestanden. Het voorkeurs‑uitwisselformaat is WebVTT of TTML, beide ondersteunen tijdcode‑precisie, styling en taalmMetadata. Converteer bron‑SRT‑bestanden naar WebVTT met een verliesloos conversiescript dat UTF‑8‑codering en eventuele markup (bijv. <c> voor sprekeridentificatie) behoudt. Tijdens deze stap voeg een lang‑attribuut toe om de doeltaal aan te geven; dit voorkomt dat downstream‑tools talen in hetzelfde bestand mengen.
Audiotracks en voice‑overs
Wanneer een video een native audiotrack bevat die wordt vervangen, extraheer de audio naar een verliesloze container zoals WAV of FLAC. Behoud de oorspronkelijke sample‑rate (meestal 48 kHz voor video) om kwaliteitsverlies te vermijden. Lever de lokalisatie‑leverancier een cue‑sheet aan die timestamps, spreker‑IDs en eventuele on‑screen prompts vermeldt. Nadat de voice‑over is opgenomen, her‑encodeer de audio naar een efficiënte codec zoals AAC, maar houd de bitrate op een niveau dat overeenkomt met de oorspronkelijke kwaliteit (bijv. 256 kbps voor 5.1 surround). Deze strategie zorgt ervoor dat het eindproduct professioneel klinkt zonder onnodig veel opslag te vereisen.
Metadata behouden voor automatisering
Metadata drijft workflow‑automatisering: versienummers, aanmaakdatums, auteursnamen en taaltags worden door projectmanagers gebruikt om assets correct te routeren. Tijdens conversie verwijderen veel tools metadata standaard. Om dit verlies te voorkomen:
- Map bron‑metadata naar standaardvelden – Voor PDFs, behoud
dc:title,dc:creatorenxmp:Language. Voor afbeeldingen, behoud EXIF‑velden zoalsDateTimeOriginalenSoftware. - Export metadata naar een side‑car JSON‑bestand – Als het bestemmingsformaat bepaalde aangepaste velden niet kan bevatten, sla ze dan op in een JSON‑manifest dat met de asset meereist. Het manifest kan door CI‑pipelines of TMS‑API’s gelezen worden om records gesynchroniseerd te houden.
- Valideer na conversie – Gebruik een checksum (SHA‑256) op de bron en het manifest, bereken daarna opnieuw na conversie om te garanderen dat er geen onverwachte wijziging heeft plaatsgevonden.
Een herhaalbare conversiepijplijn bouwen
Een lokalisatieproject omvat vaak tientallen tot honderden assets. Handmatige conversie is foutgevoelig en schaalt slecht. Het automatiseren van de pijplijn met een scriptbare workflow bespaart niet alleen tijd, maar handhaaft ook consistentie.
Stap‑voor‑stap automatiserings‑blueprint
- Inname – Haal bronbestanden op uit een versie‑control‑repository of cloud‑storage‑bucket.
- Assettype identificeren – Gebruik extensie‑heuristieken en magic‑number‑checks om PDFs, afbeeldingen en video’s naar de juiste conversiemodule te routeren.
- Converteren naar tussenvormaat – Voor documenten, produceer XLIFF; voor afbeeldingen, output gelaagde PDFs; voor video, extraheer ondertitels en audio.
- Pre‑processing regels toepassen – Voer placeholder‑tagging, RTL‑aanpassingen en kleur‑profiel‑embedding uit.
- Valideren – Controleer checksums, bevestig aanwezigheid van vereiste metadata, en voer schema‑validatie uit op XLIFF/JSON‑manifesten.
- Publiceren – Sla de conversie‑output op in een gestructureerde maphiërarchie (
/localisation/{language}/{asset-type}) en notify het lokalisatie‑platform via webhook.
Het implementeren van deze pijplijn in een serverless‑omgeving (bijv. AWS Lambda, Azure Functions) voegt schaalbaarheid toe en houdt de verwerkingsomgeving geïsoleerd, wat aansluit bij privacy‑first‑principes.
Veelvoorkomende valkuilen en hoe ze te vermijden
| Valkuil | Symptoom | Preventieve actie |
|---|---|---|
| Tekst wordt aaneengeschakeld na conversie | Ontbrekende spaties, gebroken woorden in vertaalde output | Zorg dat de conversie oorspronkelijke regeleinden (\r\n vs \n) behoudt en Unicode‑compatibele encoderingen gebruikt. |
| Placeholder‑tokens worden vertaald | Placeholders verschijnen als onzinnige tekst in het eindproduct | Markeer placeholders expliciet als niet‑vertaalbaar in XLIFF (<mrk type="x-placeholder">). |
| Kleur van afbeeldingen verschuift | Merkkleuren zien er anders uit in de doelland | Behoud het originele ICC‑profiel en vermijd automatische kleurenspace‑conversie; controleer met een kleurbeheertool. |
| RTL‑lay‑out breekt | UI‑elementen blijven links‑gealigneerd na vertaling | Gebruik logische CSS‑eigenschappen (margin-inline-start) en test met een rendering engine die spiegelen ondersteunt. |
| Metadata gaat verloren | Versienummers verdwijnen uit geconverteerde PDFs | Map metadata naar standaard XMP‑velden en exporteer een side‑car manifest indien nodig. |
Door deze issues vroegtijdig te anticiperen en controles in het conversiescript te embedden, verminderen teams herwerk en behouden ze een hoog kwaliteitsniveau.
Kwaliteitsborging voor gelokaliseerde assets
Na conversie en vertaling bevestigt een rigoureus QA‑proces dat de lokalisatie geen visuele of functionele defecten heeft geïntroduceerd.
- Visuele regressietests – Render de bron‑ en doelfiles (PDF) naast elkaar en voer een pixel‑diff‑vergelijking uit. Acceptabele drempels verschillen per assettype; voor tekst‑zware documenten mag een tolerantie van 1‑2 % vanwege taal‑specifieke regel‑omslagen.
- Functionele tests voor interactieve media – Voor UI‑mock‑ups, laad de gelokaliseerde HTML/CSS in een headless browser en controleer dat alle interactieve elementen (knoppen, menu’s) klikbaar blijven en dat het
lang‑attribuut overeenkomt met de doeltaal. - Audio/Video‑sync checks – Speel de gelokaliseerde video af en zorg dat ondertitels synchroon lopen met de gesproken audio. Geautomatiseerde tools kunnen tijds‑gaten tussen originele en vertaalde ondertitel‑bestanden vergelijken.
- Metadata‑audit – Vergelijk de bron‑ en bestemmings‑manifesten; ontbrekende velden moeten een waarschuwing in de pijplijn activeren.
QA moet geïntegreerd worden in dezelfde CI‑omgeving die de conversie uitvoert, zodat fouten al worden opgevangen voordat assets aan ontwerpers of ontwikkelaars worden overgedragen.
Balanceren van snelheid, kosten en kwaliteit
Voor grote lokalisatieprogramma’s staan snelheid en kosten vaak haaks op kwaliteit. De conversiestrategie kan het evenwicht verschuiven:
- Batch‑conversies – Verwerk groepen vergelijkbare assets tegelijk (bijv. alle productafbeeldingen) om de overhead van het laden van conversiebibliotheken te amortiseren.
- Selectief verliesloos – Houd rasterafbeeldingen verliesloos wanneer ze tekst bevatten (om onscherpte te vermijden) maar pas high‑efficiency compressie (AVIF, WebP) toe op decoratieve graphics.
- Parallel processing – Gebruik cloud‑gebaseerde workers om meerdere bestanden gelijktijdig te converteren; dit verkort de totale doorlooptijd zonder de getrouwheid te ondermijnen.
Door de conversie‑aanpak af te stemmen op de specifieke eisen van elk assettype, kunnen organisaties zowel budget als planning optimaliseren.
Afsluitende gedachten
Effectieve lokalisatie begint met een solide bestandsconversie‑fundament. Documenten omzetten naar XLIFF, vertaalbare strings uit graphics extraheren, kleurprofielen bewaren en rijke metadata behouden zijn allemaal cruciale stappen die een naadloze, hoogwaardige aanpassing voor wereldwijde doelgroepen mogelijk maken. Wanneer deze processen geautomatiseerd, gevalideerd en geïntegreerd zijn in een bredere workflow, kunnen lokalisatieteams zich richten op het creatieve werk van culturele aanpassing in plaats van te worstelen met kapotte bestanden of ontbrekende informatie. De hier beschreven principes gelden ongeacht de gekozen tools — of het nu een eigen script, een cloud‑conversieservice of een open‑source bibliotheek is — zolang de workflow trouw blijft aan getrouwheid, metadata‑integriteit en de nuances van elke doellocatie.