文章预览
【kimol君的无聊小发明】—用python识别滑块中的缺口
前言
某个夜深人静的夜晚,夜微凉风微扬,月光照进我的书房~
当我打开文件夹以回顾往事之余,惊现许多看似杂乱的无聊代码。我拍腿正坐,一个想法油然而生:“生活已然很无聊,不如再无聊些叭”。
于是,我决定开一个专题,便称之为
kimol君的无聊小发明
。
妙…啊~~~
验证码往往是爬虫路上的一只拦路虎,而其花样也是层出不穷:图片验证、滑块验证、交互式验证、行为验证等。随着OCR技术的成熟,图片验证已经渐渐淡出主流,而
滑块验证
越来越多地出现在大众视野。
“这么厉害,这小子长啥样呢?”没错,它就长这损sai:
解决它的方法也很直观,首先找到缺口的位置(通常只需要X轴的位置),然后拖动滑块即可。
今天kimol君将带领大家用python识别出滑块验证中的缺口位置。
一、缺口识别
识别图片中的缺口,主要是利用python中的图像处理库cv2,其安装方法如下:
pip install opencv-python
注:
这里并不是“pip install cv2”哦~
1.读取图片
滑块验证的图片分为两部分,一个是背景图片:
另一个是缺口图片:
利用imread函数将其读取:
bg_img = cv2.imread('bg.jpg')
tp_img = cv2.imread('tp.png')
2.识别图片边缘
为了更好地将缺口与背景匹配,我们首先得识别出图片的边缘:
bg_edge = cv2.Canny(bg_img, 100, 200)
tp_edge = cv2.Canny(tp_img, 100, 200)
这一步很关键!否则缺口匹配将不准确。
这里得到了图片边缘的灰度图,进一步将其图片格式转为RGB格式:
bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)
tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)
转换后的背景图为:
转换后的缺口图为:
3.缺口匹配
利用cv2中的matchTemplate函数,可以在背景图片中搜索对应的缺口,具体代码如下:
res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)
res为每个位置的匹配结果,代表了匹配的概率,选出其中
概率最高
的点,即为缺口匹配的位置:
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
min_val,max_val,min_loc,max_loc分别为匹配的最小值、匹配的最大值、最小值的位置、最大值的位置。
ps.当然,这里完全可以自己写一个循环来实现,但是有现成的函数为什么不用呢?
至此,我们已经有了缺口的位置,其X轴坐标为:
X = max_loc[0]
为了更直观地展示缺口的位置,我们将缺口用矩形框标注出来:
th, tw = tp_pic.shape[:2]
tl = max_loc
br = (tl[0]+tw,tl[1]+th)
cv2.rectangle(bg_img, tl, br, (0, 0, 255), 2)
cv2.imwrite('out.jpg', bg_img)
结果如下:
完美~ 收工!!!
二、完整代码
为了在实际应用中更方便的使用,我们将代码封装为一个函数:
def identify_gap(bg,tp,out):
'''
bg: 背景图片
tp: 缺口图片
out:输出图片
'''
bg_img = cv2.imread(bg)
tp_img = cv2.imread(tp)
bg_edge = cv2.Canny(bg_img, 100, 200)
tp_edge = cv2.Canny(tp_img, 100, 200)
bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)
tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)
res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
th, tw = tp_pic.shape[:2]
tl = max_loc
br = (tl[0]+tw,tl[1]+th)
cv2.rectangle(bg_img, tl, br, (0, 0, 255), 2)
cv2.imwrite(out, bg_img)
return tl[0]
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
这里选择了读取本地图片文件,在爬虫过程中其实不是特别方便。如果有感兴趣的小伙伴,可以自己改动一下,将输入改为图片流即可。
写在最后
最后,感谢各位大大的耐心阅读,咋们下次再会~
创作不易,大侠请留步… 动起可爱的双手,来个赞再走呗 (๑◕ܫ←๑)
………………………………