深度学习训练多少轮？迭代多少次？

深度学习是当今最火的研究方向之一。它以其卓越的学习能力，实现了AI的关键功能。一般来说，深度学习一次肯定是不够的，那么深度学习训练多少轮？迭代多少次？大家所关心的问题，解答来了。深度学习训练迭代多少次？翻了翻各位大牛的研究成果，有训练10个迭代的，有30个，甚至也有1万个以上的。这就让小白迷茫了，到底训练多少次合适?训练的检验标准是什么?有一些大牛上来直接就说训练多少次，也不解释为什么，就说是凭经

程序媛珂珂

21555人浏览 · 2022-06-11 17:51:02

程序媛珂珂 · 2022-06-11 17:51:02 发布

深度学习是当今最火的研究方向之一。它以其卓越的学习能力，实现了AI的关键功能。一般来说，深度学习一次肯定是不够的，那么深度学习训练多少轮？迭代多少次？大家所关心的问题，解答来了。

深度学习训练迭代多少次？

翻了翻各位大牛的研究成果，有训练10个迭代的，有30个，甚至也有1万个以上的。这就让小白迷茫了，到底训练多少次合适?训练的检验标准是什么?

有一些大牛上来直接就说训练多少次，也不解释为什么，就说是凭经验，这种我们学不来。还有一些专家给出了一些理由，我们来总结一下。

01 当loss值收敛时结束迭代

深度学习的一个关键原理就是比较学习结果和样本标签之间的差距。理论上差距越小，表明学习的效果越好。这个差距就是loss值。

Loss值不可能变为0，只能无限逼近0。所以通过脚趾都能想到，当loss值无法变小的时候，这称为收敛，就是学习结束之时。比如像下图这样的：

02 使用验证集来检验训练成果

你以为就靠一个收敛就能解决一切问题吗?没那么简单。

深度学习常常会遇到一个问题——过拟合。训练的时候学习效果很好，但是拿到其它地方测试发现效果就不行了。

就是说，并不一定是学习效果最好的时候才停止。那如何来判断停止的时机呢?

有学者提出了验证集。

就是说，把训练集分为2部分，比如70%用来训练，30%用来验证。就像下面的代码。

X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.33, random_state=seed)

然后在训练时加入验证的参数，就像这样：

autoencoder.fit(train_data, train_data,

epochs=50,

batch_size=128,

shuffle=True,

validation_data=(noisy_imgs, data_test)

)

然后就是观察验证曲线，什么时候验证的loss值最小，就选那一次的训练模型进行测试应用。

比如下图，上面是训练曲线，下面是验证曲线。学习15次的效果就已经比较好了。

03 使用测试集来检验训练成果

随着研究的广泛开展和对学习效果的极致追求，我们渐渐发现了一个问题——有时候从验证曲线看到的最优值并不是真实预测过程的最好效果。比如这种情况：对大尺度数据进行深度学习去噪。

先说结论：最优方法是通过测试效果来决定迭代的次数。

具体怎样做的呢?比如这样的案例：一张大的二维数据，比如300*300，像这样的：

免费分享一些我整理的人工智能学习资料给大家，包括一些AI常用框架实战视频、图像识别、OpenCV、NLQ、机器学习、pytorch、计算机视觉、深度学习与神经网络等视频、课件源码、国内外知名精华资源、AI热门论文、行业报告等。

为了更好的系统学习AI，推荐大家收藏一份。

下面是部分截图，点击文末名片关注我的公众号【AI技术星球】发送暗号 321 领取（一定要发暗号 321）

一、人工智能课程及项目

二、国内外知名精华资源

三、人工智能论文合集

四、人工智能行业报告

学好人工智能，要多看书，多动手，多实践，要想提高自己的水平，一定要学会沉下心来慢慢的系统学习，最终才能有所收获。

点击下方名片，扫码关注公众号【AI技术星球】发送暗号 321 免费领取文中资料

尧米AI

尧米是由西云算力与CSDN联合运营的AI算力和模型开源社区品牌，为基于DaModel智算平台的AI应用企业和泛AI开发者提供技术交流与成果转化平台。

更多推荐

一文熟悉新版llama.cpp使用并本地部署LLAMA

尧米AI

Jxls异常 Cannot load XLS transformer. Please make sure a Transformer impleme

错误：Cannot load XLS transformer. Please make sure a Transformer implementation is in classpath原因：这是 jxls 的版本升级2.4后需要额外导入其他依赖<dependency><groupId>org.jxls</groupId><artifactId>j