利用七牛镜像扒网站的源代码,操作视频讲解。
首先这是一个很easy
的功能,平常我们都是Ctrl + S
保存页面即可。但是往往保存下来的页面多多少少有点问题。并且目录,命名要么不是和原来的一样,要么是目录结构不一致。
那么今天利用七牛云存储的一个功能来解决这个问题。比如看上了某个页面的特效,或者看上了某个网站的排版,我们可以利用这个功能来实现我们想要的。
局限性:
1.但是这个功能也有局限性,首先页面( HTML )拔下来,这个是100%的没问题,另外网站的 CSS 、 Javascript 、Image
如果是相对路径,那么就好说了,一次性全解决,如果不是相对路径,那么操作就要繁琐一点。
2.这个功能只是拔取页面的静态内容,如果是采用异步做处理的的功能,比如 Ajax 访问后拼接的页面,那么这个是爬取不到的,因为涉及到2个问题,
一、当前域名下请求对方的链接,这是跨域的。
二、相对路径是请求不到的,因为当前系统下没有这个路径,除非是 jsonp 的。
....看视频吧。
版权所属:SO JSON在线解析
原文地址:https://www.sojson.com/blog/161.html
转载时必须以链接形式注明原始出处及本声明。
如果本文对你有帮助,那么请你赞助我,让我更有激情的写下去,帮助更多的人。