专栏名称: Python编程
人生苦短,我用 Python !关注 Python 编程技术和运用。分享 Python 相关技术文章、开发工具资源、热门信息等。
今天看啥  ›  专栏  ›  Python编程

我去!爬虫遇到字体反爬,哭了

Python编程  · 公众号  ·  · 2021-07-29 09:36
来自公众号:Python研究者大家好,我是辰哥今天准备爬取某某点评店铺信息时,遇到了『字体』反爬。比如这样的:还有这样的:可以看到这些字体已经被加密(反爬)竟然遇到这种情况,那辰哥就带大家如何去解决这类反爬(字体反爬类)01网页分析在开始分析反爬之前,先简单的介绍一下背景(爬取的网页)辰哥爬取的某某点评的店铺信息。一开始查看网页源码是这样的这种什么也看不到,咱们换另一种方式:通过程序直接把整个网页源代码保存下来获取到的网页源码如下:比如这里看到评论数(4位数)都有对应着一个编号(相同的数字编号相同),应该是对应着网站的字体库。下一步,我们需要找到这个网站的字体库。02获取字体库这里的字体库建议在目标网站 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照