Giriş

Otomatik çeviri, deneysel laboratuvarlardan günlük iş süreçlerine taşındı. Ancak en yaygın engel, çeviri motorunun kendisi değil, kaynak materyalin biçimidir. Belgeler, e‑tablolar, sunumlar ve multimedya varlıkları, her birinin yazı tipleri, gömülü nesneler ve meta veriler etrafındaki farklı tuhaflıkları olan sayısız tescilli formatta gelir. Bir çeviri hattı, temiz bir şekilde ayrıştıramadığı bir dosya alırsa, motor ya başarısız olur ya da biçimlendirme hataları, kırık bağlantılar veya kayıp bağlamla dolu bir çıktı üretir. Çözüm, girdileri çeviri dostu bir formata normalleştiren, metni makine çevirisi modeli üzerinden taşıyan ve ardından son gözden geçiren için orijinal yerleşimi yeniden oluşturan disiplinli bir dosya‑dönüştürme aşamasıdır. Bu makale uçtan uca iş akışını adım adım anlatır, belirli ara formatların neden tercih edildiğini açıklar ve kalite, güvenlik ve marka tutarlılığını korumak için somut kontroller sunar.

Çeviri İçin Ara Format Seçimi

Çoğu çeviri motoru düz metin, XLIFF (XML Localization Interchange File Format) veya HTML üzerinde çalışır. Doğru aracı seçmek üç faktöre bağlıdır: yapısal bütünlük, meta veri korunumu ve aşağı akışta yeniden birleştirme karmaşıklığı.

  • Düz metin tüm görsel ipuçlarını ortadan kaldırır. Saf dil içerikleri (ör. altyazı dosyaları) için en güvenli seçimdir ancak tablolar, dipnotlar ve stil bilgilerini atar.
  • XLIFF, yerelleştirme için özel olarak tasarlanmıştır. Kaynak dizgileri, bağlamsal notlar ve biçimlendirme etiketleri için yer tutucular depolar. Kaynak belge karmaşık yerleşimler içerdiğinde—çok sütunlu broşürler, gömülü çizelgeler veya dipnotlar—XLIFF, daha sonra orijinal tasarıma geri haritalanabilecek yer tutucular tutabilir.
  • HTML, web‑odaklı içerikler ve zaten CSS stiline sahip belgeler için iyi çalışır. Modern çeviri API’leri, blok‑seviye etiketleri koruyarak HTML’i alabilir; bu da yeniden birleştirme adımını basit bir değiştirme işlemi haline getirir.

Çoğu iş belgesi (sözleşmeler, ürün kılavuzları, pazarlama broşürleri) için iki adımlı bir dönüşüm—önce XLIFF’ye, çeviri motoruna, ardından orijinal formata geri—fidelite ile otomasyon arasında en iyi uzlaşımı sunar. E‑tablo verileriyle çalışırken, CSV’yi XLIFF’ye özel bir eşleme katmanı ile dönüştürmek hücre koordinatları ve formülleri korur.

Kaynak Dosyaları Hazırlama: Temizleme, Normalleştirme ve Güvence

Bir dosya çeviri motoruna ulaşmadan önce, ön işleme aşaması üç risk kategorisini ele almalıdır: gürültü, tutarsız kodlama ve hassas veri sızdırma.

Gürültü kaldırma

Eski belgeler genellikle dönüşüm araçlarını şaşırtan gizli nesneler (su işaretleri, revizyon işaretleri, izlenen değişiklikler) içerir. Pratik bir yaklaşım:

  1. Kaynağı yerel editöründe açın.
  2. Tüm izlenen değişiklikleri kabul edin veya reddedin ve yorumları kaldırın.
  3. Görsellerdeki katmanları düzleştirin ve çeviri için gerekmeyen vektör öğelerini rasterleştirin.
  4. Dosyanın yalnızca okuma‑yetkili bir kopyasını dışa aktarın, yanlışlıkla düzenlenmesini önlemek için.

Kodlama normalleştirme

Metin dosyaları UTF‑8, UTF‑16, ISO‑8859‑1 veya diğer eski kodlamalarda kaydedilmiş olabilir. Yanlış algılama, dönüşüm sonrası bozuk karakterlere yol açar. İlk dönüşüm adımından önce UTF‑8’i tespit edip zorlayabilen bir araç kullanın. Örneğin, küçük bir betik her .txt veya .csv yükünü iconv ile çalıştırabilir; dönüşüm başarısız olursa manuel incelemeye geri döner.

Hassas veri işleme

Otomatik çeviri hizmetleri uzaktaki sunucularda çalışır; kaynakta kalan kişisel tanımlanabilir bilgi (PII) maskelelenmelidir. Pratik bir kontrol listesi:

  • E‑posta adresleri, telefon numaraları ve kredi kartı desenleri için regex‑tabanlı tarama çalıştırma.
  • Meta veri ayıklama yardımcı programı ile gömülü meta verileri (yazar, şirket adı) kaldırma veya karartma.
  • Orijinal değerleri ve yer tutucularını kaydeden güvenli bir eşleme dosyası tutma; gerekirse çeviriden sonra yeniden eklenebilir.

Çeviri‑Hazır Formata Dönüştürme

Kaynak temizlendikten sonra gerçek dönüşüm adımı gerçekleştirilebilir. İşte, dosyayı bellek içinde işleyen, diske hiç yazmayan ve ara formatı doğrudan çağıran betiğe döndüren, convertise.app gibi bulut‑tabanlı, gizlilik‑odaklı bir dönüştürücünün parladığı yer budur.

Adım‑adım iş akışı

  1. Kaynak dosyayı dönüşüm uç noktasına yükleyin, XLIFF çıktısı isteyin. Çoğu API, hedef şemayı (xliff-1.2 veya xliff-2.0 gibi) belirtmenize izin verir.
  2. XLIFF’i doğrulayın – her <source> öğesinin boş olmayan bir dize içerdiğini ve yer tutucuların (<ph>) orijinal biçimlendirme etiketlerine doğru eşlendiğini kontrol edin.
  3. Çeviri motorunu çalıştırın – XLIFF’i makine çevirisi servisine besleyin, isteğe bağlı olarak marka‑özel terminoloji zorlayan bir sözlük etkinleştirin.
  4. Çevrilmiş XLIFF’i son‑işleme yapın – çok uzun dizgileri, eksik yer tutucuları veya çevrilmemiş segmentleri işaretleyen bir kalite‑kontrol betiği çalıştırın.

Kaynak bir sunum ise, alternatif olarak PowerPoint (.pptx) dosyasını önce HTML’e dönüştürmek mantıklıdır; HTML, slayt başlıklarını, konuşmacı notlarını ve görsel alt‑metinlerini korur. Çeviriden sonra HTML, slayt yer tutucularına çevrilen metni geri haritalayan bir şablon motoru ile yeni bir PowerPoint’e yeniden birleştirilebilir.

Çevrilmiş İçeriği Yeniden Birleştirme

En hata‑eğilimli aşama, çevrilen dizgileri orijinal yerleşime geri dokumaktır. Kritik olan, eşleme tablosu tutarak her yer tutucu ile kaynak dosyadaki kapsayıcısı arasındaki ilişkiyi kaydetmektir.

XLIFF yer tutucularını kullanma

XLIFF’in <ph> etiketleri bir id niteliğine sahiptir. Orijinal belge dönüştürüldüğünde, dönüştürücü bu kimlikleri görünmez işaretçiler (ör. özel XML ad alanları veya gizli <span>ler) olarak ekler. Çeviriden sonra, bir post‑processor çevrilmiş XLIFF’i okur, her <target> öğesini bulur ve kaynak belgede karşılık gelen işaretçiyi değiştirir.

Metin‑dışı öğelerin işlenmesi

Görseller, çizelgeler ve gömülü videolar çeviri motoruna gönderilmemelidir. Bunun yerine statik varlıklar olarak korunur ve yer tutucular üzerinden referans verilir. Yeniden birleştirme sırasında betik yalnızca orijinal ikili veriyi uygun konuma kopyalar. PDF’ler için pdf-lib gibi araçlar, sayfa‑akışını bozmadan metin nesnelerini değiştirerek vektör grafikleri korur.

Son kalite doğrulaması

Kırık yerleşim riskini azaltan kapsamlı bir doğrulama adımı:

  • Yeniden birleştirilen belgeyi yerel görüntüleyicide (Word, Acrobat, PowerPoint) açın ve piksel‑karşılaştırma aracıyla görsel farkları orijinal ile karşılaştırın.
  • Çevrilen dilde otomatik bir imla kontrolü çalıştırarak herhangi bir çevrilmemiş yer tutucuyu yakalayın.
  • Tüm gömülü yazı tiplerinin hâlâ gömülü olduğundan emin olun; eksik yazı tipleri dosya farklı bir makinede açıldığında yerleşim kaymalarına neden olur.

Büyük‑Ölçekli Projeler İçin Otomasyon En İyi Uygulamaları

Çeviri ihtiyacı ölçeklendiğinde—yüzlerce kılavuz, binlerce ürün açıklaması—manuel orkestrasyon dayanıksız hale gelir. Aşağıdaki uygulamalar hatları güvenilir ve denetlenebilir tutar.

Konteynerleştirilmiş dönüşüm hizmetleri

Dönüşüm bileşenini, aynı dönüştürme motoru sürümünü (ör. başsız LibreOffice örneği veya bulut‑tabanlı API) çalıştıran bir Docker konteyneri olarak dağıtın. Böylece bugün oluşturulan bir .docx, gelecek ay aynı şekilde render edilir; “format kayması” ortadan kalkar.

İdempotent işleme

Her adımı yan etki olmadan tekrarlanabilir tasarlayın. Çeviri çalışması ortada başarısız olursa, yeniden çalıştırma tam olarak bırakılan yerden devam etmeli, aynı eşleme tablolarını kullanmalı ve çift yer tutucu üretmemelidir. Ara XLIFF dosyalarını net zaman damgalarıyla sürüm‑kontrollü bir bucket’da saklayın.

Günlükleme ve denetim izleri

İş akışı, nihai QA aşamasına kadar insan odaklı incelemeden kaçınsa da, düzenleyici ortamlar (ör. tıbbi cihaz dokümantasyonu) tam bir denetim günlüğü talep eder. Her kaynak dosyanın hash’ini, her ara XLIFF’in hash’ini ve nihai çevrilmiş varlığın hash’ini kaydedin. Bu, daha sonra doğrulanabilecek kriptografik bir zincir oluşturur.

Paralellik ve sınırlama

Çoğu bulut çeviri API’si oran sınırlamaları uygular. Dönüşüm isteklerini toplu hâle getirin, ancak çeviri çağrılarını kota içinde tutacak şekilde sınırlayın; böylece dönüşüm çalışanları meşgul kalır. Basit bir kuyruk sistemi (ör. RabbitMQ) akışı koordine edebilir: çalışanlar “çeviriye hazır” mesajını alır, XLIFF’i işler ve “yeniden birleştirmeye hazır” mesajı gönderir.

Çeviri Hatları İçin Güvenlik Hususları

Çeviri hatları genellikle organizasyon sınırlarını aşar: bir ülkedeki pazarlama ekibi, başka bir ülkedeki yerelleştirme satıcısı ve üçüncü bir ülkedeki bulut çeviri motoru. Gizliliği korumak müzakere edilemez bir gerekliliktir.

  • Uç‑uç şifreleme – kaynak dosyayı yüklemeden önce şifreleyin, şifreli veriyi TLS üzerinden iletin ve yalnızca güvenilir dönüşüm konteyneri içinde çözün.
  • Sıfır‑bilgi işleme – dosyayı işlem sonrası saklamayan bir dönüşüm hizmeti seçin. Convertise.app mimarisi, dosyaları bellek içinde işler ve yanıt sonrası hemen yok eder; bu da sıfır‑bilgi modeline uygundur.
  • Veri ikametgahı – düzenlemeler verinin belirli bir coğrafi bölgede kalmasını şart koşuyorsa, dönüşüm konteynerini uyumlu bir bölgede konuşlandırın ve çeviri isteklerini bölge‑spesifik uç noktalar sunan bir sağlayıcıya yönlendirin.
  • Erişim kontrolü – eşleme tablolarını ve yer tutucu şemalarını gizli‑yönetimli bir kasada (ör. HashiCorp Vault) saklayın ve yalnızca bu hizmetlere ihtiyaç duyan hat bileşenlerine okuma/yazma izni verin.

Sonuç

Otomatik çeviri, ona besleyen dosya‑dönüştürme iskeletinin kalitesi kadar iyidir. Kaynak dosyaları çeviri‑hazır formata normalleştirerek, içeriği titizlikle temizleyerek, yapısal yer tutucuları koruyarak ve nihai varlığı deterministik, denetlenebilir bir süreçle yeniden inşa ederek organizasyonlar, yerleşim bütünlüğü, marka tutarlılığı ve veri gizliliğinden ödün vermeden hızlı dönüş süreleri elde edebilir. Burada açıklanan iş akışı, açık kaynak araçlar, konteynerleştirilmiş hizmetler ve convertise.app gibi gizlilik‑öncelikli bir bulut dönüştürücüyle uygulanabilir; böylece ekipler birkaç sayfadan kurumsal düzeyde çok dilli varlık kütüphanelerine kadar yerelleştirme projelerini ölçeklendirebilir.