2023-05-01 21:51 Java 发布于江西

关注

迁移学习-预训练模型的保存与加载

1，模型保存和读取：

# 如果要保存最好的参数，使用: best_model_state = deepcopy(model.state_dict())
model_save_path = os.path.join('', 'model.pt')
torch.save(model.state_dict(), model_save_path)

# 模型参数读取
model = LeNet5()
model_save_path = os.path.join(model_save_dir, 'model.pt')
if os.path.exists(model_save_path):
    loaded_paras = torch.load(model_save_path)
    model.load_state_dict(loaded_paras)
    
# 也可以保存优化器等：
# model_save_path = os.path.join(model_save_dir, 'model.pt')
# torch.save({
# 'epoch': epoch,
# 'model_state_dict': model.state_dict(),
# 'optimizer_state_dict': optimizer.state_dict(),
# 'loss': loss,
# }, model_save_path)

# 读取：
checkpoint = torch.load(model_save_path) 
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict']) 
epoch = checkpoint['epoch'] 5 loss = checkpoint['loss']

2，迁移学习

按照上面的方法对模型进行保存和读取，当迁移的模型部分不同时，可以根据参数名称和大小，选择性的保留读取进来的参数：

def para_state_dict(model, model_save_dir): 
state_dict = deepcopy(model.state_dict()) 
model_save_path = os.path.join(model_save_dir, 'model.pt') 
if os.path.exists(model_save_path): 
    loaded_paras = torch.load(model_save_path) 
    for key in state_dict: # 在新的网络模型中遍历对应参数 
        if key in loaded_paras and state_dict[key].size() == loaded_paras[key].size(): 
        print("成功初始化参数:", key) 
        state_dict[key] = loaded_paras[key] 
return state_dict

全部评论

推荐最新楼层

05-23 23:48

已编辑

门头沟学院化工与制药类

ps：有没有哥们会那个sql题

美团一面900人在聊

查看1道真题和解析

点赞评论收藏

转发

05-24 10:15

已编辑

门头沟学院计算机类

25届软件开发方向，秋招应该如何准备

现在应届生找工作的时间不断的提前，从最开始的春招，到秋招，再到春招提前批。现在找工作时间正正比毕业早了一年半之多。现如今25届要开始准备秋招了，秋招是至关重要的，各厂的招聘时间提前，很多厂到春招时HC已所剩无几，秋招还可以是给你一个熟悉公司的机会，也给公司一个熟悉你的机会。那么应该怎么准备秋招呢，我总结为以下三步？第一步：确定好自己的方向 作为一名码农，我们可以选择的方向有很多，前端、后端、移动端、客户端、算法等等等，但是我们要从一而终，确定好自己要工作的方向。就像道德经一样，先有“道”，先有方向。第二步：准备八股文和算法题不管选择什么方向都要好好学习八股文，有些人可能对八股文嗤之以鼻，但是我...

校招过来人的经验分享 25届如何提前做秋招准备？

点赞评论收藏

转发

04-27 18:14

复旦大学计算机类

双9但简历抽象，不知道该不该转go

研一，目前还在和组里搞科研，混了几个二作，预计还能继续混几个。此外简历上几乎是空着的，0实习0开发经历，有一些看起来还可以的国外lab，但不知道怎么优化简历。现在行情不好，想转开发写golang，但周围的朋友推荐我这个简历去搞嵌入式，大佬们觉得该怎么转方向呢？如果转golang有什么推荐的项目吗？在上海找实习到处碰壁，不知道怎么开始

点赞评论收藏

转发

04-10 11:11

已编辑

重庆邮电大学计算机类

C++求求了。给个实习吧

学校一般。投简历没回应啊。怎么改简历啊。听劝

点赞评论收藏

转发

爱吃老白薯

05-23 11:53

北京体育大学体育学类

58同城测试实习一面

http和https的区别get和post的区别对一个信息流的推送进行相关的测试实习中遇到的测试中的一些问题有哪些？遇到的bug，可能会是什么原因？如何去定位这里指出了我的问题，是不是单台设备的问题，兼容性考虑一下，是偶现还是必现，是前端还是后端的问题，做一个定位编写测试用例是根据什么去编写的你了解还有哪些专项测试，根据这些专项测试还可以对你设计的用例进行补充吗如何去看推送的信息与你个人的用户画像是否是匹配的反问：具体的业务场景（面试通过再分配到具体的组）会有专项测试和开发的工作吗（基于公司内部完善的测试平台进行测试，都比较成熟了，你愿意进行功能的修修补补啥的也可以）是在东五环的总部吗（是的，...

查看9道真题和解析

点赞评论收藏

转发

点赞收藏评论

全站热榜

正在热议

# 和牛牛一起刷题打卡 #

4593次浏览 434人参与

# 机械制造薪资爆料 #

341082次浏览 4044人参与

# 牛客帮帮团来啦！有问必答 #

984564次浏览 15262人参与

# 通信硬件薪资爆料 #

242130次浏览 2282人参与

# 腾讯工作体验 #

146432次浏览 1408人参与

# 如何写一份好简历 #

300952次浏览 4326人参与

# 实习必须要去大厂吗？ #

18136次浏览 265人参与

# 你的简历改到第几版了 #

323238次浏览 4857人参与

# 晒一晒我的offer #

3651829次浏览 56933人参与

# 2022毕业生求职现身说法 #

20513次浏览 310人参与

# 毕业租房也有小确幸 #

32058次浏览 1854人参与

# 产品人专业大盘点 #

15085次浏览 120人参与

# 浅聊一下我实习的辛苦费 #

93401次浏览 916人参与

# 为什么国企只招应届生 #

56120次浏览 411人参与

# 视觉/交互/设计岗位评价 #

3359次浏览 59人参与

# 产品人求职现状 #

54932次浏览 795人参与

# 你觉得机械有必要实习吗 #

10165次浏览 138人参与

# 为什么那么多公司毁约 #

54936次浏览 486人参与

# 在国企工作的人，躺平了吗？ #

105454次浏览 1335人参与

# 找工作时遇到的神仙HR #

196195次浏览 1841人参与

牛客网
牛客企业服务