2020-12-29 10:52 北京邮电大学算法工程师

关注

【八股文-机器学习】数据增强/early stopping

1.数据增强

假设我们训练神经网络来完成图片分类任务，希望通过扩增训练数据来解决过拟合的问题，但是扩增数据代价很高，有时候无法扩增数据。那么我们可以通过添加这类图片来增加训练集[1]，例如

水平翻转图片
裁剪图片
旋转、扭曲图片数字等

在计算机图像处理领域，由于图像输入维数非常高，导致很难找到对应那么多的图像，因此data augmentation在CV领域应用极为广泛。

2. early stopping

early stopping的思路是，在训练过程中，我们通过观察dev set的误差来判断训练过程是否逐渐过拟合。dev set error通常会先呈下降趋势，然后再某个节点处开始上升，early stopping的作用是在梯度出现上升势头的时候停止训练来放置过拟合，如下图所示。

图片说明

蓝色曲线表示随着训练次数增加，训练集的训练误差逐渐降低；紫色曲线表示在验证集上的误差，在中间点的时候，应该停止训练。

early stoping的缺点在于：它希望能够同时解决

优化损失函数
reduce overfitting

两个问题，如果过早结束训练，导致第一个问题loss较大，这样用一个方法同时解决两个问题会导致相互掣肘，需要考虑的情况比较复杂。

但优点在于，只需要运行一次训练，就可以找到中间的较好的参数集合。

如果不用early stopping，另一种方法就是L2正则化，训练神经网络的时间就可能很长。我发现，这导致超级参数搜索空间更容易分解，也更容易搜索，但是缺点在于，你必须尝试很多正则化参数 $图片说明$ 的值，这也导致搜索大量值的计算代价太高。

全部评论

推荐最新楼层

06-05 14:55

中国矿业大学用户运营

有时候真佩服计算机专业的人

我python都学不明白，他们要学习c、c++、java还有go好难，甚至有的还要学习python，五种编程语言

认真搞学习：等你往深学学就知道不是语言的事了

穿越回高考你还会选现在的专业吗

点赞评论收藏

今天 16:51

已编辑

中国传媒大学硬件开发

去大厂实习了，感觉跟上高中没区别啊

大厂像高中的几个原因：1. 都有比较严格的打卡制度，高中迟到要罚站，现在迟到要罚钱2. 都有午休时间，大部分同学都只能趴在桌子上睡觉，但卷的同学仍然在刷题（干活）3. 都有“晚自习”，大厂工作延续了高中晚自习十点下课的传统4. 大厂同事之间互相称同学，布置的任务也被叫做作业，还能被毕业5. 大部分大厂都有自己的食堂，大家到点就去吃饭，排队打饭的日子怎么不是回到了高中食堂6. 工卡其实就是校卡，不刷卡进不了工区就像忘带校卡7. 一个工区就像一个教室，里面密密麻麻都是桌挨着桌的工位，大部分时候大家都在盯着电脑苦干，偶尔交流一下，噼里啪啦的键盘声代替了高中时的翻卷声8. 大厂工作间隙的放松完全就是高...

卡卡西：我觉得还不如高中呢

实习吐槽大会

点赞评论收藏

05-29 20:34

门头沟学院 C++

学院本还有未来么。。。

已经面了好多家了，但是都没后文了，有没有大佬给我指点一下迷津，我现在还找实习来得及吗，或者再搞个项目备战秋招？

KarlAllen_直通春招版：得做好直接春招的准备。学历差的话，一是面试要求会比学历好的严格不少，二是就算面试通过了也会被排序。总之暑期和秋招对于学历差的就是及其不友好

无实习如何秋招上岸

点赞评论收藏

05-06 18:21

南京理工大学 golang

我确实不会git

因为没有实习过，我并非反串。我打算回学校再学，。

买蜜雪也用卷：我觉得应该没有哪个人敢说自己熟练使用git，代码分支一复杂还是得慢慢寻思一下的，不过基本的拉代码提交代码还有分支什么的是应该会

点赞评论收藏

06-05 04:36

长亭科技_安全研究_安全研究员

Golang 并发编程高频面试题 Top 10 💻

Golang 并发编程高频面试题 Top 10 💻  记录下，部分是面试中没回答出来的  1. Goroutine 是什么？它和线程有什么区别？   解读： 这是考察对 Go 并发核心概念的理解。   思路：  解释 Goroutine 是 Go 语言实现的轻量级并发执行单元。 对比线程：Goroutine 由 Go 运行时管理，切换成本远低于内核线程；Goroutine 初始栈空间小（通常2KB），可按需增长；更多 Goroutine 可以运行在更少的线程上（M:N 模型）。    Code package main import ( "fmt" "time&...

面试问题记录

点赞评论收藏

全站热榜

华为开奖进度👉

热聊中

创作者周榜

正在热议