Reunimos os problemas e resoluções mais comuns ao copiar e clonar sites com o WinHTTrack.
Isso geralmente ocorre devido a dois motivos principais:
1. Restrição de renderização dinâmica em JavaScript: O HTTrack é um crawler tradicional. Ele apenas analisa links estáticos nos códigos HTML e folhas de estilo CSS. Se o site alvo for uma SPA (Single Page Application), ou se suas imagens e layouts forem carregados dinamicamente via JS (como scripts Ajax ou Lazyload), o crawler não identificará esses links ocultos em scripts JS.
2. Recursos em domínios externos: Muitos sites hospedam suas imagens e arquivos CSS em CDNs externas ou servidores de terceiros. Por padrão, o WinHTTrack não baixa recursos de domínios externos para segurança, deixando de carregar essas imagens localmente.
💡 Soluções:
+*cdn.example.com* ou +*.example.com/*.Muitos sites modernos usam firewalls WAF ou políticas de segurança anti-bot. Se você clonar com configurações padrão de conexões simultâneas altas, o servidor bloqueará seu IP (retornando erros 403 Forbidden ou 503 Service Unavailable).
💡 Soluções:
Configure a velocidade sob Set options:
O WinHTTrack tem um sistema chamado Scan Rules (Regras de escaneamento) para filtrar a varredura. Isso permite pular páginas HTML desnecessárias.
💡 Passo a passo:
Vá em Set options -> Scan Rules:
1. Se quiser baixar apenas arquivos PDF: exclua todos os arquivos adicionando -*, e em seguida adicione +*.pdf especificamente:
-* +*.pdf
2. Se quiser baixar apenas imagens JPG e PNG:
-* +*.jpg +*.png
Nota: Separe múltiplas regras usando espaços simples.
Não. O HTTrack inclui suporte para Atualização Incremental (Incremental Update), que é uma função fantástica.
💡 Passo a passo:
1. Abra o WinHTTrack, use o mesmo nome do projeto anterior na primeira tela do assistente para carregar o histórico.
2. Na segunda tela, altere o campo Action de Download website(s) para Update existing mirror.
3. Clique em avançar e conclua. O programa analisará o cache local e baixará apenas recursos novos, modificados ou ausentes.
Isso ocorre quando a página de destino desse link está fora dos limites de download definidos:
Nesse caso, a engine do HTTrack preserva o endereço absoluto original da web em vez de criar um atalho quebrado local vazio, garantindo que o link funcione se você estiver conectado.