HTTrack,一个相当容易使用的脱机阅览软件,能将网站传送到计算机目录里,并且会将所有相关链结重新组织,以方便更顺利的脱机浏览。
HTTrack是一个免费并易于使用的线下浏览器工具,它能够让你从互联网上下载整个网站进行线下浏览。浏览线下站点和线上并没有什么不同。HTTrack同样可以进行线下线上站点同步,支持断点续传。HTTrack是一个可全面配置并包括全面的帮助系统的工具。
HTTrack是一个网站镜像工具,本来是用来抓取网站做离线浏览用的。但是我发现它的爬虫特性和搜索引擎爬虫非常的像,逐渐应用到了自己的SEO工作中。其实这两种看似不同的爬虫做的都是同样的工作,就是复制网站并存储下来(搜索引擎的网页快照就是被存储下来的内容)。
网站镜像,通过复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为。这既是为什么有的网站注明禁止未授权不得做网站镜像的原因了,两个网站的内容完全一样,相似度过高必然会导致自己的网站受到影响。