파일 변환이 현지화에서 차지하는 역할 이해하기

현지화는 단순히 단어를 번역하는 것이 아니라 텍스트, 그래픽, 레이아웃, 인터랙티브 요소 등 모든 콘텐츠를 목표 문화에 맞게 조정하는 과정입니다. 이 워크플로의 핵심에 파일 변환이 있습니다. 마케팅 브로셔가 Adobe InDesign 파일로, 제품 매뉴얼이 Word 문서로, UI 목업이 레이어가 있는 Photoshop 파일로 전달되든, 각 포맷은 번역가, 디자이너, 개발자에게 고유한 과제를 안겨줍니다. 이러한 원본 자산을 현지화 친화적이고 후속 작업에 바로 사용할 수 있는 형식으로 변환하는 것이 프로젝트 일정 유지, 품질 기대 충족, 비용이 많이 드는 재작업 방지의 열쇠가 됩니다.

잘 설계된 변환 파이프라인은 세 가지 목표를 달성해야 합니다. (1) 시각적 충실도를 유지해 번역 후에도 룩앤필이 일관되게 유지되도록, (2) 번역 도구가 수동 추출 없이도 처리할 수 있도록 번역 가능한 콘텐츠를 노출하고, (3) 언어 태그, 버전 번호, 자산 출처와 같은 워크플로 자동화를 구동하는 메타데이터를 보존하거나 매핑합니다. 아래 섹션에서는 각 자산 유형별 실무 단계와 현지화 프로젝트를 자주 좌절시키는 함정을 짚어봅니다.

번역을 위한 텍스트 중심 문서 준비

구조화된 텍스트가 포함된 중간 포맷 선택

텍스트와 복잡한 레이아웃이 뒤섞인 원본 파일—Word, InDesign, PowerPoint—은 텍스트가 그래픽 프레임, 각주, 표 안에 삽입되는 경우가 많습니다. 이러한 바이너리를 번역 관리 시스템(TMS)에 바로 넘기면 구조가 흐려져 목표 언어에서 서식이 깨지는 문제가 발생합니다. 권장 방법은 계층 구조를 보존하면서도 순수 텍스트를 노출하는 교환 포맷으로 원본을 변환하는 것입니다. 널리 사용되는 두 가지 옵션은 다음과 같습니다.

  • XLIFF (XML Localization Interchange File Format) – 현지화를 위해 설계된 포맷으로, 원본과 번역 세그먼트를 분리하고 컨텍스트 정보를 유지하며 번역가를 위한 커스텀 노트를 삽입할 수 있습니다. 대부분의 최신 TMS가 XLIFF를 직접 import 할 수 있습니다.
  • HTML/XML with language attributes – 원본 문서가 웹 기반인 경우, 정제된 HTML(시맨틱 태그, lang 속성)로 내보내면 번역가가 친숙한 WYSIWYG 혹은 CAT 도구에서 작업하면서 구조 마크업을 그대로 유지할 수 있습니다.

변환 단계는 레이아웃 정보를 손실 없이 처리해야 합니다. 먼저 PDF/A 로 변환해 시각 디자인을 고정한 뒤, 레이아웃을 유지하면서 줄바꿈, 표, 임베디드 객체를 보존하는 도구를 이용해 텍스트를 XLIFF 또는 HTML 로 추출합니다. convertise.app 같은 서비스는 회원가입 없이 PDF/A 생성이 가능해 시각 기준선을 그대로 유지합니다.

스타일, 변수, 플레이스홀더 보존

현지화 과정에서 {{username}}, %1$s 와 같은 플레이스홀더는 변환 과정에서도 그대로 살아 있어야 합니다. 변환 시 이들이 번역되거나 깨지면 안 됩니다. XLIFF 로 내보낼 때는 <mrk> 태그에 type="x-placeholder" 속성을 사용해 비번역 세그먼트로 매핑합니다. HTML에서는 <span class="notranslate"> 로 감싸거나 translate="no" 속성을 사용합니다. 이러한 명시적 표시 덕분에 CAT 도구가 마크업을 건드리지 않아 최종 문서가 정상 작동합니다.

RTL(오른쪽‑왼쪽) 언어 관리

아랍어·히브리어와 같은 RTL 언어는 텍스트 방향 전환뿐 아니라 UI 컨트롤 미러링, 표 재배열, 방향성을 나타내는 아이콘 교체 등 레이아웃 조정도 필요합니다. 원본을 중간 포맷으로 변환한 뒤, 하드코딩된 text-align:left; 와 같은 속성을 검사하는 검증 스크립트를 실행합니다. 이를 text-align:start; 와 같은 논리적 속성으로 교체하면 동일한 스타일시트가 LTR·RTL 모두를 지원합니다. 이렇게 미리 준비하면 디자인 단계에서의 수작업을 크게 줄일 수 있습니다.

그래픽 및 이미지 처리

번역 전 이미지에서 텍스트 추출

많은 마케팅 자산이 텍스트를 레스터 이미지(JPEG, PNG) 혹은 벡터 그래픽(SVG, AI)에 직접 삽입합니다. 이런 자산을 번역하려면 전체 재디자인하거나, 원본 텍스트를 제거하고 교체하는 레이어 기반 워크플로가 필요합니다. 변환 프로세스는 다음과 같이 진행합니다.

  1. 이미지를 텍스트 레이어와 분리 – 레이어가 있는 파일(PSD, AI)을 레이어를 유지하는 포맷(예: 레이어 PDF)으로 내보냅니다. 평면 레스터만 있을 경우 OCR을 수행해 텍스트를 사이드카 파일로 추출합니다.
  2. 현지화용 플레이스홀더 생성 – 추출된 문자열을 메인 문서와 동일한 토큰 문법을 사용하는 플레이스홀더로 교체합니다.
  3. 현지화 준비 이미지 내보내기 – 디자인 팀을 위해 고품질 PNG 또는 WebP 로 저장하고, 번역된 텍스트는 동일 레이어 구조에 나중에 합성합니다.

원본 편집 가능한 소스(PSD, AI)를 보관하는 것이 필수입니다. 평평한 JPEG에서 텍스트를 제거하면 이미지를 처음부터 다시 만들 수밖에 없습니다.

색상 프로파일 및 DPI 보존

그래픽을 현지화용으로 변환할 때는 원본 ICC 프로파일과 DPI를 반드시 유지합니다. 색공간이 바뀌면 브랜드 색이 변조될 수 있는데, 이는 목표 시장의 엄격한 시각 가이드라인을 위반하게 됩니다. 원본 프로파일을 대상 파일에 그대로 임베드하는 무손실 변환 도구를 사용하고, 변환 후 색상‑관리 툴로 검증한 뒤 현지화 팀에 전달합니다.

멀티미디어 자산 적용

자막 및 캡션

영상 현지화는 정확한 자막 파일에 달려 있습니다. 권장 교환 포맷은 WebVTT 혹은 TTML 로, 두 포맷 모두 타임코드 정밀도, 스타일링, 언어 메타데이터를 지원합니다. SRT 파일을 WebVTT 로 변환할 때는 UTF‑8 인코딩 및 <c> 같은 마크업을 보존하는 무손실 스크립트를 사용합니다. 변환 과정에서 lang 속성을 삽입해 목표 언어를 명시하면 후속 도구가 파일 내부에서 언어가 섞이는 일을 방지합니다.

오디오 트랙 및 보이스오버

영상에 교체될 네이티브 오디오 트랙이 있다면, WAV 혹은 FLAC 같은 무손실 컨테이너로 추출합니다. 원본 샘플 레이트(보통 48 kHz)를 그대로 유지해 품질 손실을 막습니다. 현지화 공급업체에 타임스탬프, 화자 ID, 화면에 표시되는 프롬프트 등을 포함한 큐시트를 제공하십시오. 보이스오버 녹음이 끝난 뒤에는 AAC 같은 효율적인 코덱으로 재인코딩하되, 원본 품질에 맞는 비트레이트(예: 5.1 서라운드의 경우 256 kbps)를 유지합니다. 이 전략은 최종 제품이 전문성을 유지하면서도 과도한 저장 용량을 요구하지 않게 합니다.

자동화를 위한 메타데이터 유지

메타데이터는 워크플로 자동화의 핵심입니다. 버전 번호, 생성일, 작성자, 언어 태그 등은 프로젝트 매니저가 자산을 올바르게 라우팅하는 데 사용됩니다. 변환 시 많은 도구가 기본적으로 메타데이터를 제거하므로 다음을 실천하십시오.

  • 소스 메타데이터를 표준 필드에 매핑 – PDF의 경우 dc:title, dc:creator, xmp:Language 를 보존하고, 이미지의 경우 DateTimeOriginal, Software 와 같은 EXIF 필드를 유지합니다.
  • 메타데이터를 사이드카 JSON 파일로 내보내기 – 대상 포맷이 특정 커스텀 필드를 담지 못할 경우, JSON 매니페스트에 저장해 자산과 함께 전달합니다. 이 매니페스트는 CI 파이프라인이나 TMS API가 기록을 동기화하는 데 활용됩니다.
  • 변환 후 검증 – 소스와 매니페스트에 SHA‑256 체크섬을 계산하고, 변환 후 다시 계산해 예상치 못한 변형이 없음을 확인합니다.

재현 가능한 변환 파이프라인 구축

현지화 프로젝트는 수십에서 수백 개의 자산을 포함하는 경우가 많습니다. 수동 변환은 실수가 잦고 확장성이 떨어집니다. 스크립트 기반 워크플로로 자동화하면 시간 절감은 물론 일관성도 보장됩니다.

단계별 자동화 청사진

  1. Ingest – 버전 관리 저장소 혹은 클라우드 스토리지 버킷에서 원본 파일을 가져옵니다.
  2. Identify Asset Type – 파일 확장자와 매직넘버를 이용해 PDF, 이미지, 동영상 등을 적절한 변환 모듈로 라우팅합니다.
  3. Convert to Intermediary Format – 문서는 XLIFF, 이미지는 레이어 PDF, 동영상은 자막·오디오를 추출하는 형태로 변환합니다.
  4. Apply Pre‑processing Rules – 플레이스홀더 태깅, RTL 조정, 색상 프로파일 삽입 등을 수행합니다.
  5. Validate – 체크섬 확인, 필수 메타데이터 존재 여부, XLIFF/JSON 매니페스트 스키마 검증 등을 실행합니다.
  6. Publish – 변환 결과물을 구조화된 폴더(/localisation/{language}/{asset-type})에 저장하고, 웹훅을 통해 현지화 플랫폼에 알립니다.

이 파이프라인을 AWS Lambda, Azure Functions 같은 서버리스 환경에 구현하면 확장성이 높아지고, 처리 환경을 격리할 수 있어 개인정보 보호 원칙과도 부합합니다.

흔히 겪는 함정과 회피 방법

함정증상예방 조치
변환 후 텍스트가 이어 붙음번역 출력에서 공백 누락, 단어가 깨짐원본 줄바꿈 문자(\r\n vs \n)를 보존하고 Unicode 호환 인코딩을 사용
플레이스홀더 토큰이 번역됨최종 결과물에 깨진 플레이스홀더 텍스트XLIFF에서 <mrk type="x-placeholder"> 로 명시적으로 비번역 처리
이미지 색상 변동브랜드 색상이 목표 시장에서 다르게 표시원본 ICC 프로파일을 유지하고 자동 색공간 변환을 피함; 색상‑관리 툴로 검증
RTL 레이아웃 깨짐번역 후 UI 요소가 여전히 좌측 정렬margin-inline-start 등 논리적 CSS 속성을 사용하고 미러링을 지원하는 렌더링 엔진으로 테스트
메타데이터 손실변환된 PDF에서 버전 번호가 사라짐표준 XMP 필드에 매핑하고 필요 시 사이드카 매니페스트를 내보냄

이슈를 사전에 인식하고 변환 스크립트에 검증 로직을 삽입하면 재작업을 크게 줄이고 품질을 유지할 수 있습니다.

현지화된 자산에 대한 품질 보증(QA)

변환·번역이 끝난 뒤에는 시각·기능·오디오·메타데이터 모두에서 결함이 없는지 확인하는 체계적인 QA가 필요합니다.

  1. 시각 회귀 테스트 – 원본과 번역본 PDF를 나란히 렌더링하고 픽셀‑diff 를 수행합니다. 자산 유형에 따라 허용 오차가 다르지만, 텍스트 중심 문서는 언어별 줄바꿈을 감안해 1‑2 % 정도를 허용합니다.
  2. 인터랙티브 미디어 기능 테스트 – UI 목업의 경우 로컬라이즈된 HTML/CSS 를 헤드리스 브라우저에 로드해 모든 버튼·메뉴가 클릭 가능하고 lang 속성이 목표 언어와 일치하는지 검증합니다.
  3. 오디오/비디오 싱크 체크 – 현지화된 영상을 재생하면서 자막이 음성에 정확히 맞는지 확인합니다. 자동화 도구로 원본과 번역된 자막 파일 사이의 타임스탬프 차이를 비교할 수 있습니다.
  4. 메타데이터 감사 – 소스 매니페스트와 목적지 매니페스트를 비교하고 누락된 필드는 파이프라인에서 경고를 발생시킵니다.

QA는 변환을 실행하는 동일 CI 환경에 통합돼야 하며, 이렇게 하면 디자이너·개발자에게 전달하기 전에 문제를 즉시 포착할 수 있습니다.

속도·비용·품질의 균형 맞추기

대규모 현지화 프로그램에서는 속도와 비용이 품질과 충돌하기 마련입니다. 변환 전략이 균형을 잡아줍니다.

  • 배치 변환 – 비슷한 유형의 자산(예: 모든 제품 이미지)을 한 번에 처리해 변환 라이브러리 로드 오버헤드를 분산합니다.
  • 선택적 무손실 – 텍스트가 포함된 레스터 이미지는 무손실 포맷을 유지해 흐림을 방지하고, 장식용 그래픽은 AVIF·WebP 같은 고효율 압축을 적용합니다.
  • 병렬 처리 – 클라우드 워커를 이용해 파일을 동시에 변환하면 전체 소요 시간을 크게 줄이면서도 충실도는 유지됩니다.

자산 유형별 요구 사항에 맞춰 변환 방식을 조정하면 예산과 일정 모두를 최적화할 수 있습니다.

마무리

효과적인 현지화는 탄탄한 파일‑변환 기반 위에서 시작됩니다. 문서를 XLIFF 로 변환하고, 그래픽에서 번역 가능한 문자열을 추출하며, 색상 프로파일을 보존하고, 풍부한 메타데이터를 유지하는 일련의 단계는 전 세계 사용자에게 매끄럽고 높은 품질의 현지화 결과물을 제공하는 데 필수적입니다. 이러한 프로세스를 자동화·검증·전체 워크플로에 통합하면, 현지화 팀은 파일 파손이나 정보 누락에 쫓기지 않고 문화적 적응이라는 창의적 작업에 집중할 수 있습니다. 여기서 제시한 원칙은 사용 도구가 맞춤 스크립트이든, 클라우드 변환 서비스이든, 오픈소스 라이브러리이든 관계없이, 충실도·메타데이터 무결성·목표 시장의 뉘앙스를 존중하는 한 언제나 적용됩니다.