Kami telah merangkum beberapa hambatan dan solusi paling umum yang dihadapi selama proses menyalin dan mengkloning situs web menggunakan WinHTTrack.
Hal ini biasanya disebabkan oleh salah satu dari dua alasan berikut:
1. Batasan Rendering Dinamis JavaScript: HTTrack adalah crawler web tradisional yang hanya menganalisis tautan statis dalam kode HTML dan stylesheet CSS. Jika situs web target adalah SPA (Aplikasi Satu Halaman), atau jika gambar dan tata letaknya dirender secara dinamis melalui JavaScript (seperti Ajax, Lazyload), crawler mungkin tidak dapat mendeteksi tautan tersebut.
2. Sumber Daya Domain Eksternal: Banyak situs web menyimpan gambar dan file CSS mereka di CDN khusus atau domain eksternal pihak ketiga. Secara default, WinHTTrack tidak mengunduh sumber daya apa pun dari domain luar demi alasan keamanan, sehingga gambar tersebut tidak dapat ditampilkan secara lokal.
💡 Solusi:
+*cdn.example.com* atau +*.example.com/*.Banyak situs web modern menerapkan kebijakan keamanan firewall atau WAF (Web Application Firewall). Jika Anda menggunakan koneksi paralel tinggi default untuk merayap, server akan menganggap IP Anda sebagai serangan berbahaya dan memblokirnya (sering kali muncul sebagai kesalahan 403 Forbidden atau 503 Service Unavailable).
💡 Solusi:
Buka Set options untuk membatasi kecepatan:
WinHTTrack menyediakan Aturan Pemindaian (Scan Rules) yang sangat kuat untuk mengontrol perilaku penyaringan. Ini memungkinkan Anda hanya mengunduh aset dengan ekstensi file tertentu tanpa mengunduh halaman tambahan yang tidak berguna.
💡 Langkah Operasi:
Klik Set options -> Scan Rules:
1. Jika Anda hanya ingin mengunduh file PDF: Masukkan -* terlebih dahulu untuk mengecualikan semua sumber daya, lalu tambahkan +*.pdf secara terpisah, yaitu:
-* +*.pdf
2. Jika Anda hanya ingin mengunduh gambar JPG dan PNG:
-* +*.jpg +*.png
Catatan: Gunakan spasi untuk memisahkan setiap aturan.
Tidak perlu. HTTrack memiliki fungsi Pembaruan Inkremental (Incremental Update) bawaan, yang merupakan salah satu keunggulan utamanya sebagai alat mirror.
💡 Langkah Operasi:
1. Jalankan WinHTTrack, pilih nama proyek yang sama dengan yang Anda atur sebelumnya pada langkah pertama wizard (sistem akan memuat konfigurasi riwayat secara otomatis).
2. Di menu drop-down Action pada langkah kedua, ubah tindakan dari default Download website(s) menjadi Update existing mirror (Perbarui mirror yang ada).
3. Klik berikutnya dan selesai. Program akan memeriksa file situs web berdasarkan cache, dan hanya mengunduh file yang diperbarui di server atau yang hilang secara lokal.
Ini menunjukkan bahwa halaman web yang ditunjuk oleh tautan tersebut berada di luar batas pengambilan Anda:
Dalam hal ini, mesin rekonstruksi pintar WinHTTrack mempertahankan alamat jaringan asli untuk memastikan bahwa tautan kloning tetap berguna saat terhubung ke internet.