We hebben de meest voorkomende problemen en oplossingen verzameld die optreden tijdens het kopiëren en klonen van websites met WinHTTrack.
Dit wordt meestal veroorzaakt door een van de volgende twee redenen:
1. Beperkingen van JavaScript dynamische rendering: HTTrack is een traditionele webcrawler die alleen statische links in HTML-code en CSS-stylesheets analyseert. Als de doelwebsite een SPA (Single Page Application) is, of als de afbeeldingen en lay-out dynamisch worden geladen via JavaScript (zoals Ajax of Lazyload), kan de crawler de verborgen links in de scripts mogelijk niet detecteren.
2. Externe domeinbronnen: Veel websites slaan hun afbeeldingen en CSS-bestanden op externe CDN's of domeinen van derden op. WinHTTrack downloadt standaard geen bronnen van externe domeinen om veiligheidsredenen, waardoor deze afbeeldingen lokaal niet kunnen worden weergegeven.
💡 Oplossing:
+*cdn.example.com* of +*.example.com/*.Veel moderne websites maken gebruik van firewalls of WAF (Web Application Firewall) beveiligingsbeleid. Als u downloadt met het standaard hoge aantal gelijktijdige verbindingen, kan de server uw IP-adres als kwaadaardig beschouwen en blokkeren (vaak resulterend in een 403 Forbidden of 503 Service Unavailable fout).
💡 Oplossing:
Ga naar Set options om de downloadsnelheid te beperken:
WinHTTrack biedt zeer krachtige Scanregels (Scan Rules) om filtergedrag te regelen. Hiermee kunt u alleen bestanden met specifieke extensies downloaden zonder onnodige extra pagina's op te halen.
💡 Stappen:
Klik op Set options -> Scan Rules:
1. Als u alleen PDF-bestanden wilt downloaden: Voer eerst -* in om alle bronnen uit te sluiten, en voeg vervolgens apart +*.pdf toe, dus:
-* +*.pdf
2. Als u alleen JPG- en PNG-afbeeldingen wilt downloaden:
-* +*.jpg +*.png
Opmerking: Gebruik spaties om de verschillende regels te scheiden.
Nee, dat is niet nodig. HTTrack heeft een ingebouwd mechanisme voor incrementele updates (Incremental Update), wat een van de grote voordelen is van deze tool.
💡 Stappen:
1. Start WinHTTrack, kies in de eerste stap van de wizard dezelfde projectnaam als u voorheen heeft ingesteld (het systeem laadt automatisch de eerdere configuratie).
2. Wijzig in de tweede stap bij Action de actie van het standaard Download website(s) naar Update existing mirror (Bestaande mirror bijwerken).
3. Klik op volgende en voltooi. Het programma controleert de bestanden op basis van de cache en downloadt alleen de bestanden die op de server zijn bijgewerkt of lokaal ontbreken.
Dit geeft aan dat de webpagina waarnaar de link verwijst buiten de grenzen van uw downloadconfiguratie valt:
In dit geval behoudt de slimme reconstructie-engine van WinHTTrack het originele absolute internetadres om ervoor te zorgen dat de hyperlinks op de gekloonde site bruikbaar blijven wanneer er een internetverbinding is.