专栏名称: 未闻Code
博主喜欢Python和爬虫,已经出了两本书。这里是他灵感的发源地。关注这个公众号,你的生产效率在三天内就会得到提高。P.S.: 这个公众号日更。
目录
相关文章推荐
今天看啥  ›  专栏  ›  未闻Code

爬虫“拥抱大模型”,有没有搞头?

未闻Code  · 公众号  ·  · 2024-07-22 21:00

文章预览

验证码坐标识别 数据采集过程中,可能会碰到各种风控策略。其中,验证码人机验证是较为常见的,点选类验证码需要识别出相应的坐标,碰到这种情况,一般要么自己训练模型,要么对接打码平台。现在也可以将识别工作交给大模型,我们来看看,相同的问法,各家大模型,在识别验证码坐标上的表现。 GPT-4o 问题,选出相似的,并给出坐标: 问题,找出鸟的位置: 通义千问 问题,选出相似的,并给出坐标: 问题,找出鸟的位置: Kimi Kimi 暂时还不能分析图片文件: 文心一言 问题,选出相似的,并给出坐标(说了一堆,不知道在说什么): 问题,找出鸟的位置: 腾讯元宝 问题,选出相似的,并给出坐标: 问题,找出鸟的位置: 综上所述,在图片识别方面,GPT 还是有着明显的优势,测试结果:GPT-4o > 腾讯元宝 > 通义千问 = 文心一言 > Kimi ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览