لقد قمنا بتجميع المشكلات والحلول الأكثر شيوعًا عند نسخ واستنساخ المواقع باستخدام WinHTTrack.
يرجع هذا عادةً إلى أحد السببين التاليين:
1. قيود ديناميكية جافا سكريبت: HTTrack هو زاحف ويب تقليدي. يقوم فقط بتحليل الروابط الثابتة في أكواد HTML وملفات أوراق الأنماط CSS. إذا كان الموقع المستهدف عبارة عن تطبيق صفحة واحدة (SPA)، أو إذا تم تحميل صوره وتخطيطاته ديناميكيًا عبر JS (مثل البرامج النصية Ajax أو Lazyload)، فقد لا يتعرف الزاحف على هذه الروابط المخفية.
2. موارد النطاق الخارجي: تستضيف العديد من مواقع الويب صورها وملفات CSS الخاصة بها على شبكات CDN مخصصة أو خوادم تابعة لجهات خارجية. بشكل افتراضي، ولأسباب أمنية، لا يقوم WinHTTrack بتنزيل موارد من خوادم خارجية أخرى، مما يؤدي إلى عدم تحميل هذه الصور محليًا.
💡 الحلول:
+*cdn.example.com* أو +*.example.com/*.تستخدم العديد من مواقع الويب الحديثة جدران حماية WAF أو سياسات أمان لمكافحة برامج البوت. إذا قمت بالاستنساخ باستخدام إعدادات الاتصال المتزامن المرتفعة الافتراضية، فسيقوم الخادم بحظر عنوان IP الخاص بك (مما يرجع أخطاء 403 Forbidden أو 503 Service Unavailable).
💡 الحلول:
قم بتهيئة قيود السرعة ضمن Set options:
يحتوي WinHTTrack على نظام يسمى Scan Rules (قواعد المسح) لتصفية عملية الفحص، مما يتيح لك تنزيل صيغ محددة وتجاوز صفحات HTML غير الضرورية.
💡 الخطوات بالتفصيل:
انتقل إلى Set options -> Scan Rules:
1. إذا كنت تريد تنزيل ملفات PDF فقط: استبعد جميع الملفات بإضافة -*، ثم أضف +*.pdf تحديدًا كما يلي:
-* +*.pdf
2. إذا كنت تريد تنزيل صور JPG و PNG فقط:
-* +*.jpg +*.png
ملاحظة: افصل بين القواعد المتعددة باستخدام مسافات بسيطة.
لا. يشتمل HTTrack على دعم لـ التحديث التدريجي (Incremental Update)، وهي ميزة رائعة تجعله خيارًا ممتازًا كبرنامج استنساخ مواقع.
💡 الخطوات بالتفصيل:
1. افتح WinHTTrack، واستخدم نفس اسم المشروع السابق في الشاشة الأولى للمعالج لتحميل السجل.
2. في الشاشة الثانية، قم بتغيير خيار Action من Download website(s) إلى Update existing mirror.
3. انقر فوق التالي وانتهى. سيقوم البرنامج بفحص الذاكرة المؤقتة المحلية وتنزيل الموارد الجديدة أو المعدلة أو المفقودة فقط.
يحدث هذا عندما تكون الصفحة المستهدفة لهذا الرابط خارج حدود التنزيل المحددة:
في هذه الحالة، يحتفظ محرك HTTrack بالعنوان المطلق الأصلي على الويب بدلاً من إنشاء ملف محلي فارغ معطل، مما يضمن عمل الرابط إذا كنت متصلاً بالإنترنت.