Mengonversi Dokumen LaTeX untuk Publikasi Akademik

LaTeX tetap menjadi standar de‑facto untuk naskah ilmiah, makalah konferensi, dan disertasi. Kekuatan utamanya terletak pada penataan tipografi matematika, bibliografi, dan struktur yang kompleks dengan presisi. Namun, penerbit, repositori institusional, dan pembaca sering kali meminta materi yang sama dalam format alternatif — PDF/A untuk pengarsipan, HTML untuk pembacaan berbasis web, atau EPUB untuk e‑reader. Langkah konversi sarat dengan jebakan tersembunyi: font yang hilang, referensi silang yang rusak, atau spasi yang berubah yang dapat merusak catatan ilmiah.

Artikel ini membahas alur kerja sistematis yang menjaga niat penulis tetap utuh sambil menghasilkan berkas siap distribusi. Fokusnya pada keputusan praktis, pemilihan alat, dan metode verifikasi yang cocok untuk satu naskah atau sekumpulan pengajuan.


1. Pahami Format Target dan Kendala‑nya

Sebelum menjalankan konversi apa pun, tentukan persyaratan output yang tepat. Berbagai kanal distribusi memberlakukan kendala teknis yang berbeda:

  • PDF/A‑1b – standar ISO untuk preservasi jangka panjang. Tidak mengizinkan enkripsi, memerlukan font yang ter‑embed, dan melarang ruang warna yang tidak ter‑referensi.
  • PDF/UA – varian PDF yang memenuhi norma aksesibilitas (tag yang tepat, urutan baca, teks alternatif untuk gambar).
  • HTML5 – ideal untuk portal web; memerlukan markup semantik, gambar responsif, dan MathML atau gambar fallback untuk persamaan.
  • EPUB 3 – format e‑book yang mendukung teks reflowable, font ter‑embed, dan MathML; cocok untuk tablet dan e‑reader.

Setiap format menentukan flag kompilasi atau langkah pasca‑pemrosesan tertentu. Memetakan kendala‑nya di awal menghemat waktu dan menghindari pekerjaan ulang yang mahal.


2. Pilih Mesin LaTeX yang Handal

Mesin yang Anda panggil menentukan sejauh mana sumber dirender dengan setia dan berkas bantu apa yang dihasilkan.

MesinKekuatanKasus Penggunaan Umum
pdfLaTeXOutput PDF langsung, ekosistem matang, dukungan paket luas.Artikel sederhana, pengajuan konferensi di mana kepatuhan PDF/A dapat ditambahkan kemudian.
XeLaTeXPenanganan Unicode native, pemilihan font mudah via font sistem, cocok untuk teks multibahasa.Dokumen dengan skrip non‑Latin atau font OpenType khusus.
LuaLaTeXDapat diperluas lewat skrip Lua, kontrol halus atas font dan PDF.Tata letak kompleks, gaya bibliografi yang dapat diprogram, atau saat Anda membutuhkan kontrol metadata PDF yang ketat.

Untuk PDF arsip (PDF/A), pdfLaTeX dipadukan dengan paket pdfx merupakan landasan yang dapat diandalkan. Untuk HTML atau EPUB, Anda nantinya akan melewatkan sumber LaTeX melalui alat konversi yang mengharapkan PDF atau DVI antar­muka yang bersih.


3. Siapkan Sumber untuk Konversi

3.1 Pertahankan Paket Minimal dan Terdokumentasi Baik

Paket yang berlebih atau usang meningkatkan peluang terjadinya error saat Anda beralih mesin. Audit pernyataan \usepackage{} dan hapus yang tidak penting bagi tampilan akhir.

3.2 Embed Font Secara Eksplisit

Ketika PDF akhir harus menyertakan setiap glyph, deklarasikan keluarga font menggunakan \setmainfont{} (XeLaTeX/LuaLaTeX) atau mekanisme \pdfmapfile{} (pdfLaTeX). Pastikan font yang dipilih memiliki lisensi untuk distribusi; bila tidak, konversi akan secara diam‑diam mengganti dengan default, yang merusak konsistensi visual.

3.3 Gunakan Alat Bibliografi Standar

Pertahankan data bibliografi dalam satu berkas .bib dan gunakan biblatex dengan biber untuk gaya sitasi modern. Pendekatan ini menjaga kunci sitasi tetap sama di semua format, memudahkan pembuatan daftar referensi di HTML atau EPUB.


4. Membuat PDF Baseline Berkualitas Tinggi

PDF bersih adalah fondasi bagi sebagian besar konversi ke depan. Ikuti langkah‑langkah ini:

  1. Kompilasi dua kali untuk menyelesaikan referensi silang dan daftar isi.
  2. Jalankan biber (atau bibtex jika Anda tetap pada gaya lama) di antara kompilasi.
  3. Gunakan paket pdfx:
\usepackage[x-1a]{pdfx}

Paket ini menyuntikkan metadata PDF/A yang diperlukan dan memaksa embedding font. 4. Periksa log untuk peringatan Missing font. Jika muncul, tambahkan font yang hilang ke berkas peta atau beralih ke XeLaTeX.

Gunakan validator PDF (mis. veraPDF) untuk memastikan kepatuhan PDF/A sebelum melanjutkan.


5. Mengonversi PDF ke HTML dan EPUB

Ada dua strategi utama:

5.1 Alat LaTeX‑to‑HTML/EPUB Langsung

  • pandoc – konverter universal yang membaca LaTeX dan menghasilkan HTML5 atau EPUB. Ia menangani sitasi, gambar, dan persamaan sederhana lewat MathJax.
  • latex2html – lebih tua, ringan, tetapi kesulitan dengan paket modern dan matematika kompleks.

Alur kerja Pandoc:

pandoc manuscript.tex \
  --pdf-engine=xelatex \
  --citeproc \
  -s -o manuscript.html

pandoc manuscript.tex \
  --pdf-engine=xelatex \
  --citeproc \
  -s -o manuscript.epub

Opsi penting:

  • --pdf-engine memastikan font khusus dipertahankan.
  • --citeproc membuat pandoc memproses berkas .bib dan menampilkan bibliografi.
  • -s menghasilkan dokumen mandiri dengan CSS ter‑embed.

5.2 Pendekatan PDF‑First

Jika PDF sudah memenuhi standar PDF/A/UA, Anda dapat mengekstrak strukturnya dengan pdf2htmlEX (untuk HTML) atau Calibre (untuk EPUB). Metode ini mempertahankan paginasi dan rendering font yang persis tetapi mungkin menyertakan gambar raster besar untuk persamaan.

Keuntungan: Fidelitas visual hampir identik.
Kerugian: Ukuran output lebih besar, aksesibilitas terbatas karena teks sering direpresentasikan sebagai gambar.


6. Mempertahankan Matematika di Semua Format

Persamaan adalah elemen paling rapuh selama konversi.

  • MathML – dukungan native di browser modern dan EPUB 3. Pandoc dapat menghasilkan MathML dengan flag --mathml.
  • LaTeXML – pipeline khusus LaTeX‑to‑XML yang menghasilkan MathML dan XHTML berkualitas tinggi.
  • Fallback gambar – untuk lingkungan yang tidak dapat merender MathML, konfigurasikan pandoc menghasilkan gambar SVG (--webtex). SVG tetap skalabel tanpa rasterisasi formula.

Contoh perintah pandoc yang menyeimbangkan keduanya:

pandoc manuscript.tex \
  --webtex=https://latex.codecogs.com/svg.latex? \
  --mathml \
  -s -o manuscript.html

HTML yang dihasilkan berisi MathML untuk browser yang mendukung dan SVG untuk yang tidak.


7. Mengelola Gambar dan Media Eksternal

Gambar biasanya berasal dari berkas PDF, PNG, atau EPS terpisah. Untuk memastikan konsistensi:

  1. Embed gambar sebagai PDF saat menggunakan pdfLaTeX. Ini menjaga kualitas vektor di PDF akhir.
  2. Konversi gambar ke SVG untuk HTML/EPUB. Alat seperti Inkscape (inkscape -l fig.svg fig.pdf) mempertahankan ketajaman dan memungkinkan styling CSS.
  3. Sediakan teks alternatif dalam sumber LaTeX menggunakan \caption[Alt text]{Full caption}. Pandoc mengekstrak argumen opsional untuk aksesibilitas.

Hindari gambar raster besar kecuali gambar memang bersifat piksel (mis. foto mikroskop). Untuk itu, kompres dengan optipng atau jpegoptim sebelum dimasukkan.


8. Memvalidasi Output

8.1 Validasi PDF

  • veraPDF – memeriksa kepatuhan PDF/A.
  • PDF/UA‑Validator – memverifikasi tag aksesibilitas.

Jalankan keduanya pada PDF akhir dan perbaiki masalah yang terdeteksi (teks alt yang hilang, tabel yang tidak ditag, dll.).

8.2 Validasi HTML

  • W3C HTML validator – memastikan sintaks yang benar.
  • axe-core – memindai pelanggaran aksesibilitas (label ARIA yang hilang, urutan heading yang tidak tepat).

8.3 Validasi EPUB

  • epubcheck – validator referensi dari International Digital Publishing Forum (IDPF). Ia akan menandai metadata yang hilang, berkas navigasi tidak valid, atau MathML yang tidak terbentuk dengan benar.

Mengotomatiskan pemeriksaan ini dalam pipeline CI (mis. GitHub Actions) memastikan setiap revisi baru melewati gerbang kualitas sebelum dirilis.


9. Mengotomatiskan Alur Kerja untuk Banyak Naskah

Peneliti sering harus memproses puluhan tesis atau makalah konferensi tiap tahun. Skrip otomatisasi ringan dapat mengatur langkah‑langkah di atas.

#!/usr/bin/env bash
set -euo pipefail

DOCS=("paper1" "paper2" "paper3")
for d in "${DOCS[@]}"; do
  cd "$d"
  # 1. Bangun PDF/A
  latexmk -pdf -pdflatex='pdflatex -interaction=nonstopmode' -usepdfx
  # 2. Validasi PDF/A
  verapdf "${d}.pdf"
  # 3. Konversi ke HTML & EPUB dengan pandoc
  pandoc "${d}.tex" --pdf-engine=xelatex --citeproc -s -o "${d}.html"
  pandoc "${d}.tex" --pdf-engine=xelatex --citeproc -s -o "${d}.epub"
  # 4. Validasi HTML & EPUB
  html5validator "${d}.html"
  epubcheck "${d}.epub"
  cd ..
done

Skrip ini memakai latexmk untuk kompilasi inkremental dan menjalankan tiga validator setelah setiap konversi. Sesuaikan array DOCS sesuai struktur direktori Anda.


10. Kapan Menggunakan Layanan Konversi Daring

Alat berbasis cloud seperti convertise.app dapat berguna untuk konversi satu‑kali, terutama bila Anda tidak memiliki instalasi TeX lengkap di workstation. Layanan tersebut memproses sumber LaTeX dalam sandbox, mengembalikan PDF/A, HTML, atau EPUB, dan mematuhi prinsip privasi yang dijelaskan dalam dokumentasinya. Untuk data riset yang sensitif, lebih baik menggunakan pipeline yang di‑host sendiri atau menjalankan konversi secara lokal agar naskah tetap berada di bawah kendali Anda.


11. Jebakan Umum dan Cara Menghindarinya

JebakanGejalaSolusi
Font yang tidak ter‑embed di PDF/ATeks muncul sebagai Times generik atau muncul peringatan di validatorEmbed font secara eksplisit; gunakan \setmainfont{} dengan XeLaTeX atau paket pdfx dengan pdfLaTeX
Sitasi rusak setelah ekspor HTMLPlaceholder [?] muncul di HTML akhirPastikan berkas bibliografi dapat diakses dan gunakan --citeproc (pandoc) atau jalankan biber sebelum konversi
Persamaan hanya muncul sebagai gambarTidak ada teks yang dapat dipilih, ukuran berkas besarAktifkan output MathML (--mathml) dan sediakan fallback SVG (--webtex)
Caption gambar tanpa namaTeks alt hilang untuk pembaca layarBerikan caption pendek opsional (\caption[Alt]{Panjang}) yang diekstrak pandoc
Berkas EPUB terlalu besarUnduhan lambat, reader crashOptimasi gambar raster (jpegoptim/optipng) dan pilih vektor SVG bila memungkinkan

Dengan memeriksa masing‑masing item ini di awal, Anda mencegah rangkaian pekerjaan ulang di tahap publikasi.


12. Mengintegrasikan Proses ke dalam Repositori Institusional

Banyak universitas mengoperasikan repositori institusional yang menerima pengajuan dalam berbagai format. Untuk mempermudah ingest:

  1. Standarisasi pada PDF/A‑1b sebagai master arsip. Hasilkan langsung dari LaTeX sebagaimana dijelaskan pada bagian 4.
  2. Hasilkan abstrak HTML menggunakan sumber LaTeX yang sama; simpan sebagai bidang metadata terpisah untuk indeks mesin pencari.
  3. Sediakan EPUB sebagai unduhan tambahan bagi pembaca yang lebih suka e‑reader; jaga ukuran berkas di bawah 5 MB dengan mengompres gambar.
  4. Catat provenance konversi (versi mesin, daftar paket, hasil validator) dalam skema metadata repositori. Ini memenuhi persyaratan audit dan memudahkan reproduksibilitas di masa depan.

13. Ringkasan

Mengonversi naskah LaTeX ke banyak format distribusi bukan sekadar tugas “klik‑dan‑langsung”. Ia menuntut pemahaman yang jelas tentang standar target, persiapan sumber yang teliti, dan verifikasi ketat pada setiap output. Dengan memilih mesin yang tepat, meng‑embed font, memakai alur kerja PDF/A yang kuat, serta memanfaatkan alat seperti pandoc, LaTeXML, dan validator khusus, penulis dapat menerbitkan satu sumber yang aman sampai ke jurnal tradisional, portal web, dan e‑reader sekaligus. Skrip otomasi membuat proses dapat diulang, sementara penggunaan layanan daring yang menghormati privasi seperti convertise.app dapat menutup celah sesekali tanpa mengorbankan keamanan data. Terapkan praktik‑praktik ini, dan karya ilmiah Anda akan tetap setia, dapat diakses, dan terjaga sepanjang siklus hidup digitalnya.