Voici une liste des problèmes les plus courants rencontrés lors de l'utilisation de WinHTTrack et leurs solutions correspondantes.
Cela est généralement dû à l'une des deux raisons suivantes :
1. Rendu dynamique JavaScript : HTTrack est un robot d'indexation traditionnel qui analyse le code HTML et les feuilles de style CSS à la recherche de liens statiques. Si le site cible est une application monopage (SPA) ou charge ses images de manière dynamique via JS (Lazyload), HTTrack risque de ne pas détecter ces fichiers.
2. Ressources hébergées sur des domaines externes : De nombreux sites stockent leurs images et feuilles de style sur des serveurs CDN externes ou des sous-domaines tiers. Par défaut, WinHTTrack ne télécharge pas les fichiers hors du domaine d'origine pour des raisons de sécurité.
💡 Solution :
+*cdn.example.com* ou +*.example.com/*.De nombreux serveurs web modernes intègrent des pare-feu applicatifs (WAF). Si vous tentez de cloner un site avec un grand nombre de connexions simultanées, votre adresse IP sera détectée comme suspecte et bloquée (généralement avec des erreurs 403 Forbidden ou 503 Service Unavailable).
💡 Solution :
Ouvrez Set options pour limiter le débit :
WinHTTrack intègre un moteur de filtres très puissant appelé Scan Rules (Règles de scan). Cela vous permet d'ignorer tout le contenu du site sauf les types de fichiers ciblés.
💡 Solution :
Accédez à Set options -> Scan Rules :
1. Pour obtenir uniquement des documents PDF : Indiquez -* pour exclure toutes les ressources, puis +*.pdf pour réactiver les PDF. Soit :
-* +*.pdf
2. Pour télécharger uniquement des images JPG et PNG :
-* +*.jpg +*.png
Note : Séparez chaque règle par un espace.
Non, ce n'est pas nécessaire. HTTrack intègre une fonction de Mise à jour incrémentielle (Incremental Update) très efficace.
💡 Solution :
1. Ouvrez WinHTTrack et sélectionnez le même nom de projet que lors de votre premier téléchargement (l'outil chargera vos anciens réglages).
2. À l'étape suivante, remplacez l'action par défaut Download website(s) par Update existing mirror (Mettre à jour le miroir existant).
3. Lancez le processus. Le logiciel comparera les fichiers existants avec ceux du serveur et ne téléchargera que les nouveautés ou les fichiers modifiés.
Cela signifie que la page visée par le lien est en dehors des limites de votre configuration de clonage :
Dans ces situations, HTTrack conserve l'URL absolue d'origine pour éviter de casser la navigation, vous permettant d'accéder au contenu en ligne si vous disposez d'une connexion internet.