Keras保存模型并载入模型继续训练
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Keras保存模型并载⼊模型继续训练我们以MNIST⼿写数字识别为例
import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from yers import Dense
from keras.optimizers import SGD
# 载⼊数据
(x_train,y_train),(x_test,y_test) = mnist.load_data()
# (60000,28,28)
print('x_shape:',x_train.shape)
# (60000)
print('y_shape:',y_train.shape)
# (60000,28,28)->(60000,784)
x_train = x_train.reshape(x_train.shape[0],-1)/255.0
x_test = x_test.reshape(x_test.shape[0],-1)/255.0
# 换one hot格式
y_train = np_utils.to_categorical(y_train,num_classes=10)
y_test = np_utils.to_categorical(y_test,num_classes=10)
# 创建模型,输⼊784个神经元,输出10个神经元
model = Sequential([
Dense(units=10,input_dim=784,bias_initializer='one',activation='softmax')
])
# 定义优化器
sgd = SGD(lr=0.2)
# 定义优化器,loss function,训练过程中计算准确率
pile(
optimizer = sgd,
loss = 'mse',
metrics=['accuracy'],
)
# 训练模型
model.fit(x_train,y_train,batch_size=64,epochs=5)
# 评估模型
loss,accuracy = model.evaluate(x_test,y_test)
print('\ntest loss',loss)
print('accuracy',accuracy)
# 保存模型
model.save('model.h5') # HDF5⽂件,pip install h5py
载⼊初次训练的模型,再训练
import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from yers import Dense
from keras.optimizers import SGD
from keras.models import load_model
# 载⼊数据
(x_train,y_train),(x_test,y_test) = mnist.load_data()
# (60000,28,28)
print('x_shape:',x_train.shape)
# (60000)
print('y_shape:',y_train.shape)
# (60000,28,28)->(60000,784)
x_train = x_train.reshape(x_train.shape[0],-1)/255.0
x_test = x_test.reshape(x_test.shape[0],-1)/255.0
# 换one hot格式
y_train = np_utils.to_categorical(y_train,num_classes=10)
y_test = np_utils.to_categorical(y_test,num_classes=10)
# 载⼊模型
model = load_model('model.h5')
# 评估模型
loss,accuracy = model.evaluate(x_test,y_test)
print('\ntest loss',loss)
print('accuracy',accuracy)
# 训练模型
model.fit(x_train,y_train,batch_size=64,epochs=2)
# 评估模型
loss,accuracy = model.evaluate(x_test,y_test)
print('\ntest loss',loss)
print('accuracy',accuracy)
# 保存参数,载⼊参数
model.save_weights('my_model_weights.h5')
model.load_weights('my_model_weights.h5')
# 保存⽹络结构,载⼊⽹络结构
from keras.models import model_from_json
json_string = model.to_json()
model = model_from_json(json_string)
print(json_string)
关于compile和load_model()的使⽤顺序
这⼀段落主要是为了解决我们fit、evaluate、predict之前还是之后使⽤compile。
想要弄明⽩,⾸先我们要清楚compile在程序中是做什么的?都做了什么?
compile做什么?
compile定义了loss function损失函数、optimizer优化器和metrics度量。
它与权重⽆关,也就是说compile并不会影响权重,不会影响之前训练的问题。
如果我们要训练模型或者评估模型evaluate,则需要compile,因为训练要使⽤损失函数和优化器,评估要使⽤度量⽅法;如果我们要预测,则没有必要compile模型。
是否需要多次编译?
除⾮我们要更改其中之⼀:损失函数、优化器 / 学习率、度量
⼜或者我们加载了尚未编译的模型。
或者您的加载/保存⽅法没有考虑以前的编译。
再次compile的后果?
如果再次编译模型,将会丢失优化器状态.
这意味着您的训练在开始时会受到⼀点影响,直到调整学习率,动量等为⽌。
但是绝对不会对重量造成损害(除⾮您的初始学习率如此之⼤,以⾄于第⼀次训练步骤疯狂地更改微调的权重)。