Porozumění roli konverze souborů v lokalizaci
Lokalizace není jen překlad slov; jde o proces přizpůsobení každého kusu obsahu — textu, grafiky, rozvržení a interaktivních prvků — cílové kultuře. V jádru tohoto pracovního postupu leží konverze souborů. Ať už marketingová brožura dorazí jako soubor Adobe InDesign, produktová příručka jako dokument Word nebo UI mock‑up jako vrstvený soubor Photoshop, každý formát přináší vlastní sadu výzev pro překladatele, designéry i vývojáře. Převod těchto zdrojových aktiv do formátů, které jsou jak lokalizačně přátelské, tak připravené pro další zpracování, určuje, zda projekt zůstane v časovém plánu, splní očekávanou kvalitu a vyhne se nákladnému přepracování.
Dobře navržená konverzní pipeline by měla dosáhnout tří cílů: (1) zachovat vizuální věrnost, aby vzhled a pocit zůstaly po překladu konzistentní, (2) vystavit přeložitelný obsah ve formátu, který lokalizační nástroje mohou načíst bez ruční extrakce, a (3) zachovat nebo mapovat metadata, která řídí automatizaci pracovních toků, jako jsou jazykové značky, čísla verzí a původ aktiv. Následující sekce rozebírá praktické kroky potřebné pro každý typ aktiva a upozorňuje na úskalí, která často zmaří lokalizační projekty.
Příprava textově náročných dokumentů k překladu
Zvolte mezilehlý formát se strukturovaným textem
Zdrojové soubory, které kombinují text s komplexním rozvržením — Word, InDesign nebo PowerPoint — často vkládají text do grafických rámců, poznámek pod čarou nebo tabulek. Přímé předání těchto binárek do systému pro správu překladů (TMS) může strukturu zahalit a vést k poškozenému formátování v cílovém jazyce. Preferovaný přístup je převést původní soubor do výměnného formátu, který zachovává hierarchii a zároveň odhaluje čistý text. Dvě široce akceptovaná řešení jsou:
- XLIFF (XML Localization Interchange File Format) — Navržený speciálně pro lokalizaci, XLIFF odděluje segmenty zdrojového a cílového textu, zachovává kontextové informace a může vkládat vlastní poznámky pro překladatele. Většina moderních TMS platforem může XLIFF importovat přímo.
- HTML/XML s jazykovými atributy — Když je původní dokument orientován na web, export do čistého HTML (sémantické značky, atributy
lang) umožní překladatelům pracovat v dobře známých WYSIWYG nebo CAT nástrojích při zachování strukturovaného značkování.
Konverzní krok by měl být bezztrátový pro informace o rozvržení: nejprve převést zdroj do PDF/A, aby se uzamkl vizuální design, a pak extrahovat text do XLIFF nebo HTML pomocí nástroje, který zachovává koncové znaky, tabulky a vložené objekty. Služby jako convertise.app mohou PDF/A generovat bez registrace, čímž zajistí, že vizuální základ zůstane nedotčený.
Zachovejte styly, proměnné a zástupné znaky
Během lokalizace musí zástupné znaky (např. {{username}}, %1$s) přežít konverzi beze změny; jinak mohou být omylem přeloženy nebo poškozeny. Při exportu do XLIFF mapujte tyto tokeny na nepřeložitelné segmenty pomocí značky <mrk> s atributem type="x-placeholder". V HTML obalte zástupné znaky do <span class="notranslate"> nebo použijte atribut translate="no". Toto explicitní označení zabrání CAT nástrojům upravit značkování a udrží finální sestavený dokument funkční.
Správa jazyků psaných zprava doleva (RTL)
Jazyky RTL, jako arabština nebo hebrejština, vyžadují nejen změnu směru textu, ale i úpravu rozvržení — zrcadlení UI prvků, přeuspořádání tabulek a výměnu ikon, které vyjadřují směr. Po převodu zdroje do mezilehlého formátu spusťte validační skript, který hledá pevně zakódované levé zarovnání (text-align:left;). Nahraďte je logickými vlastnostmi (text-align:start;), aby stejný stylesheet podporoval jak LTR, tak RTL lokály. Tato příprava snižuje pozdější manuální úsilí v designové fázi.
Práce s grafikou a obrázky
Extrahujte text z obrázků před překladem
Mnoho marketingových materiálů vkládá text přímo do rastrových obrázků (JPEG, PNG) nebo vektorové grafiky (SVG, AI). Překlad takových materiálů vyžaduje buď kompletní redesign, nebo vrstvený postup, kdy je původní text odstraněn a nahrazen. Proto by konverzní proces měl:
- Oddělit obrázek od jeho textové vrstvy — Exportujte vrstvené soubory (PSD, AI) do formátu, který vrstvy zachová (např. vrstvené PDF). Pokud je k dispozici jen plochý raster, spusťte OCR, aby se text extrahoval do samostatného souboru.
- Vytvořit lokalizační zástupné znaky — Nahraďte extrahované řetězce zástupnými znaky odpovídajícími syntaxi tokenů používaných v hlavním dokumentu.
- Exportujte připravený obrázek — Uložte grafiku jako vysoce kvalitní PNG nebo WebP pro designérský tým, zatímco přeložený text bude později sloučen pomocí stejné vrstvy.
Uchování originálního editovatelného zdroje (PSD, AI) je zásadní; odstranění textu z plochého JPEG znamená, že jedinou možností je znovu vytvořit obrázek od začátku.
Zachovejte barevné profily a DPI
Při konverzi grafiky pro lokalizaci vždy udržujte původní ICC profil a DPI. Změna barevného prostoru může posunout firemní barvy, což je obzvláště problematické, když cílový trh má přísné vizuální směrnice. Používejte bezztrátové konverzní nástroje, které do cílového souboru vloží původní profil, a před předáním lokalizačnímu týmu ověřte výsledek pomocí nástroje pro správu barev.
Přizpůsobení multimediálních aktiv
Titulky a popisky
Lokalizace videa spočívá na přesných titulkových souborech. Preferovaným výměnným formátem jsou WebVTT nebo TTML, oba podporují časovou přesnost, formátování a jazyková metadata. Převeďte zdrojové SRT soubory do WebVTT pomocí bezztrátového skriptu, který zachová kódování UTF‑8 a jakékoli značky (např. <c> pro identifikaci mluvčího). Během tohoto kroku vložte atribut lang, který určuje cílový jazyk; tím se zabrání míchání jazyků ve stejném souboru v následujících nástrojích.
Zvukové stopy a dabing
Když video obsahuje nativní zvukovou stopu, která bude nahrazena, extrahujte audio do bezztrátového kontejneru, např. WAV nebo FLAC. Zachovejte původní vzorkovací frekvenci (typicky 48 kHz pro video), aby nedošlo ke ztrátě kvality. Poskytněte lokalizačnímu dodavateli cue‑sheet, který uvádí časové značky, ID mluvčích a případné on‑screen výzvy. Po nahrání dabingu znovu kódujte audio do efektivního kodeku, jako je AAC, ale udržujte bitrate na úrovni odpovídající původní kvalitě (např. 256 kbps pro 5.1 surround). Tato strategie zajišťuje, že finální produkt zní profesionálně, aniž by vyžadoval nadměrné úložiště.
Zachování metadat pro automatizaci
Metadata řídí automatizaci pracovních toků: čísla verzí, data vytvoření, jména autorů a jazykové značky jsou používány projektovými manažery k správnému směrování aktiv. Během konverze mnoho nástrojů metadata standardně odstraňuje. Aby se předešlo jejich ztrátě:
- Mapujte zdrojová metadata na standardní pole — U PDF zachovejte
dc:title,dc:creatoraxmp:Language. U obrázků uchovejte EXIF pole jakoDateTimeOriginalaSoftware. - Exportujte metadata do samostatného JSON souboru — Pokud cílový formát nedokáže pojmout některá vlastní pole, uložte je do JSON manifestu, který cestuje s aktivem. Manifest může být čten CI pipeline nebo TMS API a udržet záznamy synchronizované.
- Validujte po konverzi — Použijte kontrolní součet (SHA‑256) na zdroj a manifest, poté jej po konverzi přepočtěte, aby bylo jisté, že nedošlo k neočekávaným změnám.
Vytvoření opakovatelné konverzní pipeline
Lokalizační projekt často zahrnuje desítky či stovky aktiv. Manuální konverze je náchylná k chybám a špatně škáluje. Automatizace pipeline pomocí skriptovatelného workflow nejen šetří čas, ale také vynucuje konzistenci.
Krok‑za‑krokem návod na automatizaci
- Ingest — Načtěte zdrojové soubory z repozitáře verzování nebo cloudového úložiště.
- Identifikujte typ aktiva — Pomocí heuristiky přípon a kontrol magic‑number směrujte PDF, obrázky a videa do odpovídajícího konverzního modulu.
- Převod do mezilehlého formátu — U dokumentů vytvořte XLIFF; u obrázků výstupní vrstvené PDF; u videí extrahujte titulky a audio.
- Aplikujte předzpracovací pravidla — Spusťte označování placeholderů, úpravy RTL a vkládání barevných profilů.
- Validujte — Zkontrolujte kontrolní součty, potvrďte přítomnost požadovaných metadat a proveďte schématickou validaci XLIFF/JSON manifestů.
- Publikujte — Uložte výstupy konverze do strukturované hierarchie složek (
/localisation/{language}/{asset-type}) a upozorněte lokalizační platformu pomocí webhooku.
Implementace této pipeline v serverless prostředí (např. AWS Lambda, Azure Functions) přidává škálovatelnost a izoluje zpracovatelské prostředí, což je v souladu s principy „privacy‑first“.
Časté úskalí a jak se jim vyhnout
| Úskalí | Příznak | Preventivní opatření |
|---|---|---|
| Text se po konverzi spojí | Chybějící mezery, rozbité slova v přeloženém výstupu | Zajistěte, aby konverze zachovávala původní koncové znaky (\r\n vs \n) a používala Unicode‑kompatibilní kódování. |
| Placeholder tokeny jsou přeloženy | Placeholdry se objeví jako nesrozumitelný text ve finálním produktu | Explicitně označte placeholdery jako nepřeložitelné v XLIFF (<mrk type="x-placeholder">). |
| Barvy obrázků se posunou | Firemní barvy vypadají v cílovém trhu jinak | Zachovejte původní ICC profil a vyhněte se automatické konverzi barevného prostoru; ověřte pomocí nástroje pro správu barev. |
| RTL rozvržení selže | UI prvky zůstávají levě zarovnané po překladu | Používejte logické CSS vlastnosti (margin-inline-start) a testujte v rendering engine, který podporuje zrcadlení. |
| Metadata se ztratí | Čísla verzí zmizí z konvertovaných PDF | Mapujte metadata do standardních XMP polí a exportujte samostatný manifest, pokud je potřeba. |
Předvídáním těchto problémů již v rané fázi a vložením kontrol do konverzního skriptu týmy snižují přepracování a udržují vysokou úroveň kvality.
Kontrola kvality (QA) pro lokalizovaná aktiva
Po konverzi a překladu potvrzuje důkladný QA proces, že lokalizace nepřinesla vizuální ani funkční defekty.
- Test vizuální regrese — Vykreslete zdrojové a cílové PDF vedle sebe a spusťte pixel‑diff porovnání. Přijatelné prahy se liší podle typu aktiva; u dokumentů s velkým množstvím textu povolte toleranci 1‑2 % kvůli jazykově specifickému zalamování řádků.
- Funkční testy pro interaktivní média — U UI mock‑upů načtěte lokalizovaný HTML/CSS v headless prohlížeči a ověřte, že všechny interaktivní prvky (tlačítka, menu) jsou klikatelné a že atribut
langodpovídá cílovému jazyku. - Kontrola synchronizace audio/video — Přehrát lokalizované video a ujistit se, že titulky jsou synchronizované s mluveným slovem. Automatické nástroje mohou porovnat časové mezery mezi originálním a přeloženým titulkovým souborem.
- Audit metadat — Porovnejte zdrojové a cílové manifesty; jakékoli chybějící pole by měly vyvolat varování v pipeline.
QA by měla být integrována do stejného CI prostředí, které spouští konverzi, takže selhání jsou zachycena dříve, než jsou aktiva předána designérům či vývojářům.
Vyvážení rychlosti, nákladů a kvality
U velkých lokalizačních programů jsou rychlost a náklady často v rozporu s kvalitou. Strategie konverze může posunout rovnováhu:
- Dávkové konverze — Zpracovávejte skupiny podobných aktiv najednou (např. všechny produktové obrázky), čímž amortizujete režii načítání konverzních knihoven.
- Selektivní bezztrátovost — Udržujte rastrové obrázky bezztrátové, pokud obsahují text (aby nedošlo k rozmazání), ale aplikujte vysoce efektivní kompresi (AVIF, WebP) na dekorativní grafiku.
- Paralelní zpracování — Využijte cloudové pracovníky k souběžnému převodu více souborů; sníží to celkovou dobu zpracování bez ztráty věrnosti.
Súlad konverzního přístupu se specifickými požadavky každého typu aktiva mohou organizace optimalizovat jak rozpočet, tak termín.
Závěrečné úvahy
Efektivní lokalizace začíná pevnými základy konverze souborů. Převod dokumentů do XLIFF, extrahování přeložitelných řetězců z grafiky, zachování barevných profilů a udržení bohatých metadat jsou všechny kritické kroky, které umožňují plynulé, vysoce kvalitní přizpůsobení pro globální publikum. Když jsou tyto procesy automatizovány, validovány a integrovány do širšího pracovního toku, lokalizační týmy se mohou soustředit na kreativní práci kulturní adaptace místo boje s rozbitými soubory či chybějícími informacemi. Principy uvedené zde platí bez ohledu na zvolený nástroj — ať už je to vlastní skript, cloudová konverzní služba nebo open‑source knihovna — pokud workflow respektuje věrnost, integritu metadat a nuancí každého cílového trhu.