大家好,我是十一姐,b站时一十一姐啦,知识星球时光漫漫
提示!本文章仅供学习交流,严禁用于非法用途,文章如有不当可联系本人删除!
一、ddddocr环境配置安装
二、字符集验证码训练
三、ocr_api_server服务搭建
上一篇:3、深度学习环境安装
下一篇:5、ddddocr识别字符/滑块/点选验证码
一、ddddocr环境配置
fire
loguru
pyyaml
tqdm
numpy
pillow==9.5.0
onnx
ddddocr-py311
-
conda create -n dd python=3.11 -
conda activate dd -
pip install -r requirements.txt -
N卡gpu训练:conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 pytorch-cuda=11.7 -c nvidia -
只cpu训练:conda install pytorch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 cpuonly
二、字符集验证码训练
Model:
CharSet: [] # 字符集,不要动,会自动生成
ImageChannel: 1 # 图片通道数,如果你想以灰度图进行训练,则设置为1,彩图,则设置为3。如果设置为1,数据集是彩图,项目会在训练的过程中自动在内存中将读取到的彩图转为灰度图,并不需要提前自己修改并且该设置不会修改本地图片
ImageHeight: 64 # 图片自动缩放后的高度,单位为px,高度必须为16的倍数,会自动缩放图像
ImageWidth: -1 # 图片自动缩放后的宽度,单位为px,本项若设置为-1,将自动根据情况调整
Word: false # 是否为CNN模型,这里在创建项目的时候通过参数控制,不要自己修改
System:
Allow_Ext: [jpg, jpeg, png, bmp] # 支持的图片后缀,不满足的图片将会被自动忽略
GPU: true # 是否启用GPU去训练,使用GPU训练需要参考步骤一安装好环境
GPU_ID: 0 # GPU设备号,0为第一张显卡
Path: '' # 数据集根目录,在缓存图片步骤会自动生成,不需要自己改,除非数据集地址改了
Project: test # 项目名称 也就是{project_name}
Val: 0.03 # 验证集的数据量比例,0.03就是3%,在缓存数据时,会自动选则3%的图片用作训练过程中的数据验证,修改本值之后需要重新缓存数据
Train:
BATCH_SIZE: 32 # 训练时每一个batch_size的大小,主要取决于你的显存或内存大小,可以根据自己的情况,多测试,一般为16的倍数,如16,32,64,128
CNN: {NAME: ddddocr} # 特征提取的模型,目前支持的值为ddddocr,effnetv2_l,effnetv2_m,effnetv2_xl,effnetv2_s,mobilenetv2,mobilenetv3_s,mobilenetv3_l
DROPOUT: 0.3 # 非专业人员不要动
LR: 0.01 # 初始学习率
OPTIMIZER: SGD # 优化器,不要动
SAVE_CHECKPOINTS_STEP: 2000 # 每多少step保存一次模型
TARGET: {Accuracy: 0.97, Cost: 0.05, Epoch: 20} # 训练结束的目标,同时满足时自动结束训练并保存onnx模型,Accuracy为需要满足的最小准确率,Cost为需要满足的最小损失,Epoch为需要满足的最小训练轮数
TEST_BATCH_SIZE: 32 # 测试时每一个batch_size的大小,主要取决于你的显存或内存大小,可以根据自己的情况,多测试,一般为16的倍数,如16,32,64,128
TEST_STEP: 1000 # 每多少step进行一次测试
import ddddocr
ocr = ddddocr.DdddOcr(det=False, ocr=False, show_ad=False, import_onnx_path="charprj_1.0_23_6000_2023-10-26-23-47-08.onnx", charsets_path="charsets.json")
with open(r"D:Yzmtrainimg_other1CBH_1578451419953.png", 'rb') as f:
image_bytes = f.read()
print(ocr.classification(image_bytes))
三、ocr_api_server服务搭建
The End~ 更多交流加vx
原文始发于微信公众号(逆向OneByOne):训练验证码-4、ddddocr训练字符验证码
免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论