网页整站下载 Offline Explorer 8.4
正文:
这个是免费版本,免费版本一次只能下载2000个文件,还有不能把文件作为某些特殊格式导出,除了这两点,好像就没其他限制了,
至于这软件的解锁版本,网上也多得是,可自行寻找。
Offline Explorer是一个整站下载工具,即可以把整个网站下载下来,我主要用于下载小说,因此不建议用于太复杂的网站,太复杂的网站下载下来也没啥用,还不如手写爬虫。
软件支持中文,在View-Language中选择Simplified Chinese即可,软件使用不复杂,只有几个设置值得说说。看下面的图片,
第1个,Level为下载层数,要下载的起始网页为0层,如果起始网页中存在一个链接A,那么链接A对应的网页为1层,如果在链接A网页中还存在一个链接B,
那么链接B对应的网页为2层,以此类推。
第2个是URL Filters中的Servers设置,假设要下载的起始网页是 abc.com,
选择”服务器”,那么只能下载 abc.com/.* (.*表示通配符)这个形式的网页,xx.abc.com 这个形式的网页不能下载;
选择”域名”,那么只要二级域名是 abc.com 的网页都可以下载,即 xxx.abc.com 这个形式的网页可以下载。
第3个是URL Filters中的Directories设置,假设要下载的起始网页是 abc.com,
如果勾选了”仅从开始目录内以及以下目录下载文件”,并且在”Included keywords”填入一个关键字”lib”,
那么就只能下载 abc.com/.*lib.* 或者 abc.com/lib/.* 这个形式的网页,不能下载 abc.com/xyz 这种形式的网页,因为目录xyz与目录lib不同。
以 www.jinyongshuku.com/book 为例,下载《连城诀》的3个版本,3个版本的链接都有”lian”这个关键字,
勾选”仅载入下列开始范围内的文件”,勾选”仅从开始目录内以及以下目录下载文件”,Included keywords填入”lian”,
下载层数Level设置为2层,这样就会把所有 www.jinyongshuku.com/book/.* 和 www.jinyongshuku.com/.*lian.*/.*
的网页都下载下来,下载完后,找到下载文件夹,把index.html拖入calibre,calibre会自动遍历,然后转换成epub等格式即可。
本文结束