文章预览
摄影:产品经理 金枪鱼刺身 前两天,有同学在微信群里面问怎么识别下图所示的验证码: 一般爬虫验证码我会使用 ddddocr 来解析,在大模型出来之前,这个工具基本上是 Python 下面效果最好的免费验证码识别工具了。但是这次它翻车了。 这个提问的同学也试过了很多个大模型,发现都提取不出来。 甚至连 GPT-4o 也失败了: GPT-4o 都失败了,还能怎么办呢?难道要使用付费的商业方案了?这个时候,突然有个同学发出来了一张截图: ChatGLM,也就是智谱 AI,竟然识别对了!这个同学接着又发了一张图,另一个验证码识别又对了! 这下整个群里面做爬虫的人都热闹了起来: 于是就有了今天这篇文章。 上面的截图是使用智谱 AI 网页版识别的,但是我们写代码时肯定需要使用 API。智谱 AI 的大模型叫做 GLM,也提供开放 API 服务。于是我到 智谱 AI BigModel
………………………………