Eski WordPerfect Dosyalarını Modern Formatlara Dönüştürmek: Pratik Bir Rehber
WordPerfect bir zamanlar işletmeler, hukuk büroları ve akademik kurumlar için hâkim kelime işleme platformuydu. Program hâlâ var olsa da, çoğu organizasyon Microsoft Word, Google Docs ya da açık kaynak paketlere geçiş yaptı. Gerçek şu ki, sayısız eski .wpd dosyası paylaşımlı sürücülerde, arşiv kutularında ya da yedek bantlarda duruyor ve genellikle sözleşmeler, dava dosyaları veya araştırma makaleleri gibi yasal ya da tarihi açıdan önemli içerikler barındırıyor. Bu belgeleri biçimlendirme, gömülü nesneler ya da meta verileri kaybetmeden dönüştürmek basit bir iş değildir. Bu kılavuz, kaynak koleksiyonunun değerlendirilmesinden nihai çıktının doğrulanmasına kadar tam bir iş akışını, bütünlük korumaya ve uzun vadeli erişilebilirliği sağlamaya odaklanarak anlatıyor.
1. WordPerfect Dönüştürmenin Zorluklarını Anlamak
WordPerfect, DOCX’in kullandığı Office Open XML yapısından ve PDF spesifikasyonlarından belirgin şekilde farklı bir özel ikili düzen uygular. En yaygın engeller şunlardır:
- Yazı Tipi İkamesi – WordPerfect, yazı dosyalarını değil, font metriklerini gömer. Orijinal yazı tipleri dönüşüm sunucusunda eksik olduğunda, motor bunları varsayılanlarla değiştirerek satır sonları ve sayfalama üzerine etkide bulunabilir.
- Karmaşık Düzen Özellikleri – Başlık/alt bilgi bölgeleri, çok sütunlu bölümler, dipnotlar ve koşullu metin kuralları cahil dönüştürücüler tarafından yanlış yorumlanabilir ve içerik yer kayması yaşanabilir.
- Gömülü Nesneler – OLE nesneleri (örn. Excel grafikler, Visio diyagramları) ikili bloklar olarak saklanır. Bazı dönüşüm araçları bunları çıkaramaz veya render edemez, bu da bilgi kaybına yol açar.
- Makrolar ve Betikler – WordPerfect’in makro dili (WPM) yerel ortam dışında nadiren desteklenir. Makro‑tarafından oluşturulan içeriğe sahip bir belgeyi dönüştürmek ayrı bir strateji gerektirir.
- Meta Veri Boşlukları – WordPerfect’in eski sürümleri yazar, oluşturulma tarihi ve revizyon geçmişini özel alanlarda saklar. Dönüşüm sırasında araç bu alanları standart Dublin Core ya da Office Open XML özelliklerine eşlemezse, bu bilgiler atılabilir.
Bu tuzakları erken fark etmek, dönüşüm hattındaki maliyetli yeniden çalışmaları önler.
2. Dönüşüm İçin Kaynak Dosyaların Hazırlanması
Disiplinli bir hazırlık aşaması riski azaltır ve sonraki dönüşüm adımlarının tekrarlanabilir olmasını sağlar.
2.1 Envanter ve Kategorizasyon
Her .wpd dosyasını, boyutunu, son değiştirilme tarihini ve bilinen kullanım bağlamını (örn. hukuk sözleşmesi, pazarlama broşürü) listeleyen bir elektronik tablo oluşturun. Dosyaları önceliğe göre etiketlemek kaynak tahsisinde yardımcı olur: yüksek riskli hukuk belgeleri manuel inceleme gerektirirken, toplu bültenler toplu işlenebilir.
2.2 Yazı Tipi Konsolidasyonu
Belgelere eklenmiş orijinal font dosyalarını toplayın. Fontlar tescilli ise, görsel metrikle eşleşen lisanslı yedekler düşünün. Bu fontları dönüşüm workstations’una kurun; çoğu dönüştürücü bulduğu ilk eşleşen fontu kullanır.
2.3 Dönüşüm Öncesi Yedekleme
Orijinal arşivler üzerinde doğrudan çalışmayın. Tüm koleksiyonu ayrı bir dönüşüm sürücüsüne kopyalayın. Bu, beklenmedik bozulmalara karşı bir güvenlik ağı sağlar.
2.4 Gereksiz Dosyaların Temizlenmesi
Yinelenen veya kullanılmayan .wpd dosyalarını silin. Envanter üzerinde bir duplicate‑finder çalıştırmak iş yükünü %10‑20 azaltabilir ve depolama maliyetlerini düşürür.
3. Hedef Format(lar)ın Seçimi
En uygun çıktı formatı, sonraki kullanım senaryosuna bağlıdır.
- DOCX – Belgenin Office ya da Google Workspace’te düzenlenmeye devam edeceği durumlar için en iyisi. DOCX çoğu yapısal öğeyi (still, tablolar, yorumlar) korur ve izlenen değişiklikleri destekler.
- PDF/A‑2 – Arşivleme için ideal. PDF/A harici fontlara bağımlılığı ortadan kaldırır, gömülü fontları içerir ve aktif içerik yasaklayarak salt okunur bir temsili garanti eder.
- ODT – LibreOffice gibi açık kaynak ekosistemlerini tercih eden organizasyonlar için uygundur.
- HTML5 – İçerik bir web sitesinde ya da intranette yayımlanacaksa, temiz ve anlamsal HTML başlık hiyerarşisini korur, stil vermeyi kolaylaştırır.
Birçok projede çift‑çıktı yaklaşımı benimsenir: gelecekteki düzenlemeler için bir DOCX, uyumluluk ve uzun vadeli saklama için bir PDF/A.
4. Dönüşüm Motorunun Seçilmesi
Üç geniş araç kategorisi vardır:
| Kategori | Tipik Araçlar | Güçlü Yönler | Zayıf Yönler |
|---|---|---|---|
| Yerel WordPerfect Dışa Aktarım | WordPerfect 12‑14 ( .docx, .pdf olarak kaydet ) | Desteklenen özelliklerde %100 düzen bütünlüğü | Lisanslı Windows kopyası gerekir; otomasyon sınırlı |
| Özel Dönüştürme Yazılımları | Able2Extract, Zamzar Desktop, UniDOC | Toplu işleme, betiklenebilir API’ler, gömülü nesne desteği | Karmaşık düzenleri yanlış yorumlayabilir; lisans ücreti |
| Bulut‑Tabanlı Dönüştürücüler | convertise.app, CloudConvert, Zamzar (online) | Yerel kurulum yok, ölçeklenebilir, API erişimi | İnternet bant genişliğine bağımlı; gizlilik uyumluluğu kontrol edilmelidir |
Büyük ve gizlilik‑hassas bir arşiv için hibrit bir yaklaşım iyi çalışır: en karmaşık dosyalar için yerel bir WordPerfect örneği (veya lisanslı deneme) kullanın, geri kalan basit belgeler için convertise.app gibi bir bulut hizmetine dönün. Convertise, mümkün olduğunda dosyaları tamamen tarayıcıda işler ve kaynak dosya asla kullanıcının makinesinden çıkmaz – gizli hukuk sözleşmeleriyle çalışırken kritik bir faktördür.
5. Ayrıntılı Dönüştürme İş Akışı
Aşağıda, araçlar seçildikten sonra betiklenebilecek tekrar edilebilir bir adım‑adım süreç yer alıyor.
5.1 Otomatik Ön‑Kontrol Betiği (PowerShell örneği)
# Bir klasördeki .wpd dosyalarını tarar ve CSV raporu üretir
Get-ChildItem -Path "E:\LegacyWPD" -Recurse -Filter *.wpd |
Select-Object FullName, Length, LastWriteTime |
Export-Csv -Path "E:\ConversionReport\wpd_inventory.csv" -NoTypeInformation
Oluşan CSV, belirli bir boyutun üzerindeki dosyaları (>5 MB) manuel inceleme için işaretlemek amacıyla toplu motorun girdisi olarak kullanılabilir.
5.2 Convertise CLI ile Toplu Dönüştürme (varsayımsal)
# Convertise’in bir CLI sarmalayıcısı cs-cli olduğu varsayılıyor
cs-cli batch \
--input "E:/LegacyWPD/**/*.wpd" \
--output-format docx \
--output-dir "E:/Converted/DOCX" \
--log "E:/ConversionReport/batch_log.txt"
CLI, orijinal zaman damgalarını korur ve her çıktı dosyası için bir kontrol toplamı (SHA‑256) yazar. Bu hash’ler sonraki doğrulamanın temelini oluşturur.
5.3 PDF/A Oluşturma (LibreOffice headless modu ile)
libreoffice --headless --convert-to pdf:writer_pdf_Export --outdir "E:/Converted/PDF" "E:/Converted/DOCX/*.docx"
# Ghostscript ile PDF/A‑2 uyumluluğu sağlanır
for f in E:/Converted/PDF/*.pdf; do
gs -dPDFA -dBATCH -dNOPAUSE -sProcessColorModel=DeviceRGB \
-sDEVICE=pdfwrite -sOutputFile="${f%.pdf}_pdfa.pdf" "$f"
done
Bu iki aşamalı yaklaşım, ortaya çıkan PDF’lerin arşiv standartlarını karşılamasını garantiler.
5.4 Doğrulama ve Kalite Güvencesi
- Kontrol Toplamı Karşılaştırması – Kaynak dosyanın dönüştürme sırasında değiştirilmediğini, yan dosya meta verisi için üretilen kontrol toplamının ön‑dönüşüm hash’iyle eşleştiğini doğrulayın.
- Görsel Nokta‑Kontrol – Dönüştürülen belgelerin %5’ini rastgele seçin. Word/LibreOffice’da açıp sayfa sayısı, üst/alt bilgi tutarlılığı ve tablo hizalamasını karşılaştırın.
- Meta Veri Denetimi –
exiftoolya dapdfinfoile özellikleri çıkartın ve yazar, oluşturulma tarihi ve anahtar kelimelerin korunmuş olduğundan emin olun. Eksik alanlar varsa, bir betik orijinal envanter CSV’sinden doldurabilir.
6. Gömülü Nesneler ve Makrolarla Baş Etmek
6.1 OLE Nesnelerinin Çıkarılması
WordPerfect, OLE nesnelerini ikili akışlar olarak saklar. Ole2Extract gibi araçlar, dönüşümden önce bunları dışa çekebilir. Çıkarıldıktan sonra hedef belgeye manuel ya da bir makro aracılığıyla yeniden gömebilirsiniz.
6.2 WordPerfect Makrolarıyla Baş Etmek
WPM makroları taşınabilir olmadığından, en güvenli yol makroyu bir WordPerfect ortamında çalıştırıp çıkan içeriği statik bir belge (örn. PDF) olarak dışa aktarmaktır. Makro yalnızca metin üretiyorsa, aynı mantığı python‑wpd gibi bir kütüphane (varsa) kullanan basit bir Python betiğiyle yeniden oluşturabilirsiniz.
7. Meta Verinin Korunması ve Eşlenmesi
Dönüştürme sırasında ayakta kalan standart meta veri alanları şunlardır:
- Title →
dc:title(PDF) ya dacoreProperties.title(DOCX) - Author →
dc:creator/coreProperties.author - Subject/Keywords →
dc:description/coreProperties.subject - Creation/Modification Dates →
dcterms:created/dcterms:modified
Bir dönüşüm aracı bu alanları atıyorsa, sonradan bir işlemle yeniden eklenebilir. DOCX için python‑docx örneği:
from docx import Document
import csv, datetime
from pathlib import Path
metadata = {row['filename']: row for row in csv.DictReader(open('wpd_inventory.csv'))}
for file in Path('E:/Converted/DOCX').glob('*.docx'):
doc = Document(str(file))
meta = metadata.get(file.name, {})
doc.core_properties.title = meta.get('title', '')
doc.core_properties.author = meta.get('author', '')
if meta.get('created'):
doc.core_properties.created = datetime.datetime.fromisoformat(meta['created'])
doc.save(str(file))
8. Büyük Koleksiyonlar İçin Toplu Otomasyon
Arşiv on binlerce dosya içeriyorsa, RabbitMQ ya da AWS SQS gibi bir kuyruk temelli sistem, dönüşüm adımlarını asenkron bir şekilde yönlendirebilir. Her çalışan (worker) dosya yolunu içeren bir mesaj alır, dönüşüm hattını çalıştırır, sonucu bir çıktı kovasına yazar ve başarı/başarısızlık olayını yayınlar. Bu tasarım şunları sağlar:
- Ölçeklenebilirlik – Kuyruk dolduğunda ek çalışanları devreye alabilirsiniz.
- Hata Toleransı – Başarısız işler otomatik yeniden denenir.
- Denetim – Her mesaj benzersiz bir kimlik içerir; loglar uyumluluk raporları için merkezi hâle getirilir.
9. Gizlilik ve Uyumluluk Hususları
Birçok eski WordPerfect dosyası dahili olsa da, bazıları kişisel tanımlanabilir bilgi (PII) ya da korunmuş sağlık bilgisi (PHI) içerebilir. Herhangi bir dosyayı bir bulut hizmetine göndermeden önce şunları sağlayın:
- Veri Yerleşimi – Hizmet dosyaları, organizasyonunuzla aynı yargı bölgesinde işler.
- Uçtan Uça Şifreleme – Dosyalar aktarım sırasında (TLS) şifrelenir ve mümkün olduğunda işleme süresi boyunca da at‑rest şifrelenir.
- Kalıcı Depolama Yok – Sağlayıcı, dönüşüm tamamlandıktan sonra dosyaları saklamaz. Örneğin Convertise.app, dönüşüm bittiğinde dosyaları hemen siler.
Bu kriterleri karşılamayan bir dosya için dönüşümü yerel olarak tutun.
10. Dönüştürülmüş Varlıkların Arşivlenmesi
Başarılı dönüşüm sonrası sonuçları kayıt‑saklama politikanıza göre depolayın. Önerilen hiyerarşi:
ArchiveRoot/
├── Original_WPD/ # Salt‑okunur, değiştirilemez yedek
├── DOCX_Editable/ # Gelecek düzenlemeler için
├── PDF_A_Archive/ # Uzun vadeli, salt‑okunur
└── Metadata/ # CSV raporları, kontrol toplamları, denetim logları
PDF/A katmanı için WORM (Write‑Once‑Read‑Many) depolama katmanı kullanın, böylece kazara değişiklik önlenir. Alanı korurken kontrol toplamı bütünlüğünü korumak için eşsiz dosya silme (deduplication) uygulayın.
11. Yaygın Tuzaklar ve Çözüm Önerileri
| Belirti | Muhtemel Neden | Çözüm |
|---|---|---|
| Yazı tipi eksik, metin kaydı | Font yüklü değil ya da metrik uyumsuzluğu | Tam olarak aynı font sürümünü kurun ya da dönüştürücü ayarlarında bir font‑ikame haritası tanımlayın |
| Tablolar sadece düz metin hâline geliyor | Dönüştürücü WordPerfect tablo işaretlemesini tanımıyor | .wpd’yi önce “Export as RTF” ile dışa aktarın, ardından RTF’yi DOCX’e dönüştürün; tablo yapısı korunur |
| Dipnotlar kayboluyor | Hedef formatta dipnot stili desteklenmiyor | Dönüştürücüde “Dipnotları koru” seçeneğini etkinleştirin; alternatif olarak önce PDF’ye, sonra OCR‑tabanlı DOCX’e dönüştürüp dipnot metinlerini alabilirsiniz |
| Gömülü Excel grafiği statik bir resme dönüşüyor | OLE nesnesi işlenemiyor | OLE’yi ayrı olarak çıkartın, kaynak Excel dosyasını dönüştürün ve hedef belgede yeniden gömün |
| Dönüşüm sonrası kontrol toplamı eşleşmiyor | Dönüşüm sırasında (örn. satır sonu değişikliği) dosya değiştirildi | “Tam kopya” seçeneği sunan bir mod kullanın ya da yalnızca istenen dönüşümlerin gerçekleştiğini doğrulamak için ikili fark (binary diff) yapın |
12. Dönüştürülmüş Korpusu Geleceğe Hazırlamak
Belgeler açık, iyi belgelenmiş formatlarda (DOCX, PDF/A, ODT) yer aldığında, gelecekteki kıdemsizliğe maruz kalma riski büyük ölçüde azalır. Bunu pekiştirmek için:
- Standartlara karşı doğrulama – PDF/A doğrulama araçları (veraPDF) ve DOCX şema doğrulayıcıları çalıştırın.
- Depolama ortamını periyodik olarak yenileyin – 5‑7 yılda bir yeni depolama teknolojilerine geçiş yapın.
- Dönüşüm tarifini saklayın – Kullanılan komut satırı argümanlarını, araç sürümlerini ve font paketlerini belgeleyin. Bu tarif, bir alt sistem render motoru güncellendiğinde yeniden üretim sağlar.
Legacy WordPerfect dönüşümünü, envanter, kontrollü araç kullanımı, otomatik doğrulama ve sağlam arşivleme içeren disiplinli bir veri‑göç projesi olarak ele alarak, kuruluşlar içerik on yıllarını kayıpsız biçimde açığa çıkarabilir. İster tamamen yerel bir çözüm ister convertise.app gibi gizliliğe saygılı bulut araçları kullanın, burada özetlenen ilkeler süreci şeffaf, tekrarlanabilir ve denetlenebilir kılar.