python网页分析-白红宇

python网页分析

阅读量：6487 次

发布时间：2019-06-24

本文共 399 字，大约阅读时间需要 1 分钟。

像是那种爬去图片的网站，一般在总的页面哪里就能拿到原图的链接，虽然你查看网页源码之后，可能看到的还是只有压缩后的图片地址，但是原图的地址其实会在压缩地址的后面给你，但是他一般不会直接给你，他会隐藏性的给出来，这就考究你的连接怕拼接还有观察能力了。

举例：

当你在网页源码当中只能找到这样的链接而已：

在这个链接当中，你打开看到的会是一个缩略图，但是你点开之后，你会发现他居然跳到了/ 这个链接，而这个链接就是原图，那么你就成功的得到了原图的链接，接下来就差解决翻页的问题而已了。翻页问题一般可以通过观察网页结构获得，但是那些链接特别复杂的网页，你可以通过找网页源码的方式获得，一般都能找到，除非是那种设计很差的辣鸡网站。

转载于:https://www.cnblogs.com/myxdashuaige/p/9547282.html

你可能感兴趣的文章

JBoss 系列五十：使用Apache httpd(mod_jk)和JBoss构架高可用集群环境