使用CNN卷积神经网络模型训练mnist数据集

admin

145605
文章

119
评论

2021年2月7日13:23:54评论244 views字数 1890阅读6分18秒阅读模式

使用CNN卷积神经网络模型训练mnist数据集

卷积操作就是卷积核（kernal）跟输入数据每个值相乘再加起来得到的一个值作为输出

使用CNN卷积神经网络模型训练mnist数据集

图源：https://flat2010.github.io/2018/06/15/手算CNN中的参数

数据预处理

在数据预处理上需要注意不再是一维的了，而要保持数组样式，是 28*28*1 的，其他的没差别

train_image_matric = train_image.reshape(60000, 28, 28, 1).astype(float)
test_image_matric = test_image.reshape(10000, 28, 28, 1).astype(float)
train_image_4D_normalize = train_image_4D / 255
test_image_4D_normalize = test_image_4D / 255
train_label_onehotencoding = np_utils.to_categorical(train_label)
test_label_onehotencoding = np_utils.to_categorical(test_label)

数据预处理之后开始建立模型

from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import Conv2D, MaxPooling2D, Flatten #卷积层、池化层、平坦层
model = Sequential()

添加卷积层

filters=16 表示有 16 个卷积核（也叫滤镜）

kernel_size=(5,5) 表示卷积核的尺寸

padding='same' 表示对原图片进行填充，使得输出能够保持和输入尺寸一致

input_shape=(28,28,1) 输入的尺寸

activation='relu' 激活函数

model.add(Conv2D(filters=16, kernel_size=(5,5), padding='same', input_shape=(28,28,1), activation='relu'))

使用CNN卷积神经网络模型训练mnist数据集

从这幅图中可以看到，周围添加了一圈之后，经过卷积核再输出的还是原来的尺寸大小

添加池化层

池化层也有一个池化核，但池化运算分为几种：

最大池化核，取池化数据的最大值；

平均池化核，取池化数据的平均值；

最小池化核，取池化数据的最小值；

L2池化核，取池化数据的L2范数；

图示是最大池化过程

使用CNN卷积神经网络模型训练mnist数据集

model.add(MaxPooling2D(pool_size = (2, 2)))
#沿(垂直,水平)方向缩小比例的因数
#(2,2)会把输入张量的两个维度都缩小一半

使用CNN卷积神经网络模型训练mnist数据集

添加平坦层

平坦层的作用是将输入“压平”，即把多维的输入一维化，常用在从卷积层到全连接层的过渡

model.add(Flatten())

添加隐藏层

model.add(Dense(units=128, kernel_initializer='normal', activation='relu'))
model.add(Dropout(0.5))

添加隐藏层与输出层之间的关系

model.add(Dense(units=10, kernel_initializer='normal', activation='softmax'))

配置训练模型

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

训练模型

train_history = model.fit(train_image_4D_normalize, train_label_onehotencoding, validation_split=0.2, epochs=10, batch_size=200, verbose=2)

使用CNN卷积神经网络模型训练mnist数据集

验证模型准确率

模型准确率是 0.9916

使用CNN卷积神经网络模型训练mnist数据集

可以看到 CNN 比 MLP 不仅准确率提高了，在不加 Dropout 的情况下过度拟合现象也比 MLP 要小一些

导入训练好的模型进行预测

还是先用之前的方法导出模型

model.save('CNN_MNIST_model.h5')

导入模型

load_model('CNN_MNIST_model.h5')

处理好数据之后调用 predict 函数就可以啦

使用CNN卷积神经网络模型训练mnist数据集

本文始发于微信公众号（陈冠男的游戏人生）：使用CNN卷积神经网络模型训练mnist数据集

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

使用CNN卷积神经网络模型训练mnist数据集

戴姆勒 | 车联网安全面经分享

夏威夷航空报告网络安全攻击

报告：非洲网络犯罪日益严峻，2024年约发现5万起勒索攻击事件

网络安全简史（四）：计算机病毒的商业化和武器化

25岁英国黑客 IntelBroker 落网！窃取超40家机构数据致2500万美元损失

美国冻结价值15亿美元涉黑客攻击的加密货币

跨域人脸伪造识别

折腾一周，还是放弃了

FBI紧急预警：散蛛黑客如何用一通电话，数小时瓦解一家公司？

特朗普暗示美国正在对东大进行黑客攻击

发表评论

在线咨询

微信