来自公众号:Python技术
下载
https://github.com/sml2h3/ddddocr
安装
将自动安装符合自己电脑环境的最新 ddddocr。Python 环境需要小于等于 3.9。
pip install ddddocr
使用
带带弟弟 OCR 可以识别三种验证码,小编就用这三种来实验一下。
滑块验证码
滑块验证码这里用的是豆瓣的滑块验证。下滑块是单独的透明背景图 hycdn.png。
背景图是带小滑块坑位的 background.jpg。
import ddddocr
det = ddddocr.DdddOcr(det=False, ocr=False)
with open('hycdn.png', 'rb') as f:
target_bytes = f.read()
with open('background.jpg', 'rb') as f:
background_bytes = f.read()
res = det.slide_match(target_bytes, background_bytes, simple_target=True)
print(res)
识别结果
{'target_y': 0, 'target': [486, 126, 622, 262]}
target 属性的前两个值正好和豆瓣验证滑块 url 中提交的 ans 差不多。
点选类验证码
点选类验证码用的是网易登录
det = ddddocr.DdddOcr(det=True)
with open("eb.jpg", 'rb') as f:
image = f.read()
poses = det.detection(image)
im = cv2.imread("eb.jpg")
for box in poses:
x1, y1, x2, y2 = box
im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)
cv2.imwrite("result.jpg", im)
识别结果
字母数字验证码
字母数字验证码的图片来自于 google 搜索
ocr = ddddocr.DdddOcr(old=True)
with open("z1.jpg", 'rb') as f:
image = f.read()
res = ocr.classification(image)
print(res)
识别结果
3n3d
8342
总结
ddddocr 让验证码变得如此简单与易用,,让不会用 opencv, pytorch, tensorflow 的小伙伴也能快速的破解网站的登录验证码。小伙伴们如果有其他好的 ocr 识别也可以在留言中分享出来。
原文始发于微信公众号(Python编程):傻瓜式 Python OCR 识别库 -- ddddocr
免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论