本指南将详细讲解如何使用 Windows 图形界面客户端 (WinHTTrack) 一步步完成网站克隆与备份。WinHTTrack 是一款非技术人员、普通人也能轻松上手使用的网站爬虫和网站蜘蛛软件。
启动 WinHTTrack 软件,并在向导欢迎界面点击“下一步(Next)”。接下来,您需要:
1. 在 New project name 中输入项目名称,方便日后管理。
2. Project category 可选填项目分类。
3. 在 Base path 中选择用于存放克隆网站的本地文件夹目录。
在接下来的界面中,配置需要执行的抓取动作和网址:
1. 在 Action 菜单中选择克隆方式。一般默认选择 Download website(s)(下载整个网站)。
2. 在 Web Addresses (URL) 文本框中输入想要抓取的源网站主页链接(可以输入多行来同时克隆多个网站)。
为防止下载不需要的巨型文件或外部多余链接,可点击 Set options 按钮进入高级参数控制页面:
1. Limits(限制):可以设置最大深度(Max depth)、最大传输大小或速率上限。
2. Scan Rules(扫描规则):利用通配符(如 -* 排除全部,+*.jpg 仅下载图片,或 -*.zip 排除压缩包)来精细控制抓取的后缀范围。
完成所有设置后,点击“下一步”直到出现启动确认界面。点击 Finish(完成) 即可正式开始网站克隆任务。
此时,控制台将展示实时下载数据包传输状态:包含正在请求的链接、当前的连接总数、已下载字节数和预计剩余时间。
当页面显示 Mirror finished 时,代表克隆已经完成。您将可以在无网环境下完全顺畅地浏览这个网站:
1. 直接在 WinHTTrack 界面中点击 Browse Mirrored Website(浏览已镜像的网站) 按钮。
2. 或者打开您在第一步设置的本地文件夹,双击运行 index.html 文件,系统将使用默认浏览器打开离线版本。
http://example.com/about.html 重写为 about.html 或者是 ../../about.html),在本地脱机点击导航条可以像在线访问一样流畅。