识别验证码继续爆破后台（三）

admin

140350
文章

117
评论

2022年4月14日07:13:45评论64 views字数 1027阅读3分25秒阅读模式

前言

前戏回顾（点击可直接访问）

识别验证码继续爆破后台

识别验证码继续爆破后台（二）

正文

有的时候，并不是说所有验证码用api或者tesseract都可以正确识别出来的，还是需要经过相关训练，让tesseract知道你想让它识别出来的验证码。

首先安装tesseract和其训练工具

brew install tesseract --with-training-tools

直接用命令识别验证码

tesseract 1.jpg 1

发现识别还是有点问题

识别验证码继续爆破后台（三）

我们利用jTessBoxEditor进行训练

首先我们先下载点图片下来

识别验证码继续爆破后台（三）

然后把要训练的图片合为tif格式

识别验证码继续爆破后台（三）

保存文件名为[lang].[fontname].exp[num].tif，如yuyan.ziti.exp0.tif

使用命令生成box文件

tesseract yuyan.ziti.exp0.tif yuyan.ziti.exp0 batch.nochop makeboxbox文件为各个分割出来的内容的坐标

识别验证码继续爆破后台（三）

利用jTessBoxEditor打开tif文件来对内容进行纠正并保存。

识别验证码继续爆破后台（三）

PS：x往左右移动大小不变， y上下移动大小不变，w往左右扩张，h上下扩张。

使用命令训练生成tr文件

tesseract yuyan.ziti.exp0.tif yuyan.ziti.exp0 nobatch box.train

使用命令输出字符集

unicharset_extractor yuyan.ziti.exp0.box

创建font_properties文件来表示字体样式信息。

内容为

ziti 0 0 0 0 0

使用命令创建聚类

shapeclustering -F font_properties -U unicharset –O yuyan.unicharset yuyan.ziti.exp0.tr

使用命令创建特征

mftraining -F font_properties -U unicharset yuyan.ziti.exp0.tr

使用命令输出数据文件

cntraining yuyan.ziti.exp0.tr

把unicharset, inttemp, normproto, pffmtable,shapetable这四个文件加上前缀"ziti"

使用命令生成语言包

combine_tessdata ziti.

识别验证码继续爆破后台（三）

复制traineddata文件到tesseract-OCR字体目录

先不用我们的字体识别一下试试

识别验证码继续爆破后台（三）

使用-l指定我们的字体包试试

识别验证码继续爆破后台（三）

后续

完。

原文始发于微信公众号（中国白客联盟）：识别验证码继续爆破后台（三）

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

识别验证码继续爆破后台（三）

Clash Verge rev提权与命令执行分析

【实战】手把手学习写一个MCP服务，获取热榜文章

借助pikachu和DVWA靶场带你走进跨站请求伪造CSRF攻击

揭露导致组织论坛崩溃的简单错误

深度学习基础架构革新？通过梯度近似寻找Normalization的替代品

栈溢出从复现到挖掘-CVE-2018-18708漏洞复现详解

windows rookit防护-权限提升

通过手机和邮箱查真实姓名-币安

常见的信息泄露漏洞挖掘（第二部分）

实战中踩过的坑：我是如何用Ingram搞定摄像头漏洞扫描的

发表评论

在线咨询

微信