English 中文 繁體 Español Português العربية Deutsch فارسی Français हिन्दी Bahasa Indonesia Italiano 日本語 한국어 Nederlands Русский
WinHTTrack it365 Kotak Alat

Pertanyaan Sering Diajukan (FAQ)

Kami telah merangkum beberapa hambatan dan solusi paling umum yang dihadapi selama proses menyalin dan mengkloning situs web menggunakan WinHTTrack.

Mengapa beberapa halaman yang dikloning memiliki layout yang berantakan, atau gambar yang tidak ditampilkan secara penuh?

Hal ini biasanya disebabkan oleh salah satu dari dua alasan berikut:

1. Batasan Rendering Dinamis JavaScript: HTTrack adalah crawler web tradisional yang hanya menganalisis tautan statis dalam kode HTML dan stylesheet CSS. Jika situs web target adalah SPA (Aplikasi Satu Halaman), atau jika gambar dan tata letaknya dirender secara dinamis melalui JavaScript (seperti Ajax, Lazyload), crawler mungkin tidak dapat mendeteksi tautan tersebut.

2. Sumber Daya Domain Eksternal: Banyak situs web menyimpan gambar dan file CSS mereka di CDN khusus atau domain eksternal pihak ketiga. Secara default, WinHTTrack tidak mengunduh sumber daya apa pun dari domain luar demi alasan keamanan, sehingga gambar tersebut tidak dapat ditampilkan secara lokal.

💡 Solusi:

  • Di Set options -> Scan Rules, Anda dapat menambahkan domain eksternal secara manual yang ingin disertakan. Misalnya: +*cdn.example.com* atau +*.example.com/*.
  • Jika itu adalah gambar pemuatan lambat (lazy-load), Anda dapat mencoba menyamar sebagai User-Agent mesin pencari umum lainnya dalam opsi.
Bagaimana jika kecepatan pengunduhan sangat lambat, atau situs web target "memblokir (Ban)" koneksi saya di tengah jalan?

Banyak situs web modern menerapkan kebijakan keamanan firewall atau WAF (Web Application Firewall). Jika Anda menggunakan koneksi paralel tinggi default untuk merayap, server akan menganggap IP Anda sebagai serangan berbahaya dan memblokirnya (sering kali muncul sebagai kesalahan 403 Forbidden atau 503 Service Unavailable).

💡 Solusi:

Buka Set options untuk membatasi kecepatan:

  • Panel Limits: Turunkan jumlah koneksi bersamaan maksimum (Max connections) (misalnya batas ke 2-4).
  • Panel Flow Control: Atur interval penundaan antara setiap permintaan (misalnya tunggu beberapa detik).
  • Panel Browser ID: Ubah identitas User-Agent default menjadi browser standar (seperti string Chrome atau Edge) untuk mengurangi kemungkinan terdeteksi sebagai robot crawler.
Saya hanya ingin mengunduh jenis file tertentu (seperti PDF, MP4, atau gambar JPG) dari situs web, bagaimana cara mengaturnya?

WinHTTrack menyediakan Aturan Pemindaian (Scan Rules) yang sangat kuat untuk mengontrol perilaku penyaringan. Ini memungkinkan Anda hanya mengunduh aset dengan ekstensi file tertentu tanpa mengunduh halaman tambahan yang tidak berguna.

💡 Langkah Operasi:

Klik Set options -> Scan Rules:

1. Jika Anda hanya ingin mengunduh file PDF: Masukkan -* terlebih dahulu untuk mengecualikan semua sumber daya, lalu tambahkan +*.pdf secara terpisah, yaitu:

-* +*.pdf

2. Jika Anda hanya ingin mengunduh gambar JPG dan PNG:

-* +*.jpg +*.png

Catatan: Gunakan spasi untuk memisahkan setiap aturan.

Konten situs web telah diperbarui, apakah saya perlu mengunduhnya kembali secara penuh?

Tidak perlu. HTTrack memiliki fungsi Pembaruan Inkremental (Incremental Update) bawaan, yang merupakan salah satu keunggulan utamanya sebagai alat mirror.

💡 Langkah Operasi:

1. Jalankan WinHTTrack, pilih nama proyek yang sama dengan yang Anda atur sebelumnya pada langkah pertama wizard (sistem akan memuat konfigurasi riwayat secara otomatis).
2. Di menu drop-down Action pada langkah kedua, ubah tindakan dari default Download website(s) menjadi Update existing mirror (Perbarui mirror yang ada).
3. Klik berikutnya dan selesai. Program akan memeriksa file situs web berdasarkan cache, dan hanya mengunduh file yang diperbarui di server atau yang hilang secara lokal.

Mengapa beberapa tautan pada halaman kloning langsung dialihkan ke URL asli di internet saat diklik?

Ini menunjukkan bahwa halaman web yang ditunjuk oleh tautan tersebut berada di luar batas pengambilan Anda:

  • Tautan tersebut milik domain lain, dan tidak ada konfigurasi untuk mengizinkan pengambilan lintas domain dalam opsi Anda.
  • Kedalaman tautan (jumlah klik yang diperlukan) melebihi batas maksimum yang Anda tetapkan di Limits -> Max depth.

Dalam hal ini, mesin rekonstruksi pintar WinHTTrack mempertahankan alamat jaringan asli untuk memastikan bahwa tautan kloning tetap berguna saat terhubung ke internet.