Abbiamo raccolto i problemi più comuni incontrati durante la copia e clonazione dei siti web con WinHTTrack e le relative soluzioni.
Questo accade solitamente per due motivi principali :
1. Limitazioni di rendering dinamico JavaScript : HTTrack è un crawler web tradizionale che analizza esclusivamente i link statici contenuti nel codice HTML e nei fogli di stile CSS. Se il sito di destinazione è una SPA (Single Page Application) o visualizza immagini e layout in modo dinamico tramite JS (come ad esempio Lazyload), l'applicazione potrebbe non rilevare questi collegamenti.
2. Risorse su domini esterni : Molti siti memorizzano immagini e file CSS su server CDN esterni o domini di terze parti. Per motivi di sicurezza, WinHTTrack non scarica per impostazione predefinita le risorse appartenenti a domini esterni, impedendone la visualizzazione locale.
💡 Soluzione :
+*cdn.example.com* o +*.example.com/*.Molti server web implementano sistemi di sicurezza e firewall applicativi (WAF). Se si utilizza l'impostazione predefinita con un numero elevato di connessioni simultanee, il server potrebbe rilevare il tuo indirizzo IP come dannoso e bloccarlo (generando errori 403 Forbidden o 503 Service Unavailable).
💡 Soluzione :
Apri Set options per limitare la velocità :
WinHTTrack offre un motore di filtri estremamente potente chiamato Scan Rules (Regole di scansione), che consente di ignorare tutte le pagine del sito tranne quelle con estensioni mirate.
💡 Soluzione :
Fai clic su Set options -> Scan Rules :
1. Per ottenere solo file PDF : inserisci prima -* per escludere tutte le risorse, quindi aggiungi +*.pdf per abilitare i PDF. In questo modo :
-* +*.pdf
2. Per scaricare solo immagini JPG e PNG :
-* +*.jpg +*.png
Nota : separa ogni regola con uno spazio.
No. HTTrack dispone di una funzione di Aggiornamento incrementale (Incremental Update) integrata, che rappresenta uno dei suoi principali vantaggi.
💡 Soluzione :
1. Avvia WinHTTrack, seleziona lo stesso nome di progetto utilizzato in precedenza (il sistema caricherà automaticamente le impostazioni storiche).
2. Al passo successivo, sostituisci l'azione predefinita Download website(s) con Update existing mirror (Aggiorna mirror esistente).
3. Fai clic su avanti e completa. Il programma controllerà i file esistenti e scaricherà solo le novità o i file modificati sul server.
Questo significa che la pagina web di destinazione del collegamento è al di fuori delle impostazioni di clonazione :
In questi casi, HTTrack mantiene l'URL assoluto originale per evitare di interrompere il funzionamento dei collegamenti, garantendo l'accesso se si dispone di una connessione a Internet.