在知乎上有这样一个问题:

acc很高,但预测正确的样本占比又很低,怎么回事? - 知乎

        关于这个问题,在这个问题的回答中,有许多大佬从数据的分布、模型的结构、数据集的划分,以及验证指标等层面进行了解答。

        在这里按照我的理解,简单描述一下这个问题:模型训练正常,模型测试效果很差,甚至在训练集上的测试效果都很差。简单分析一下大概有以下几个方面的原因可以排查:

        1、检查模型训练和模型测试的数据处理pipeline是否一致,比如训练时做了Normalize,测试时也要做Normalize,这一点至关重要,我遇到的这类问题基本上都是因为数据预处理不一致导致的

        2、检查模型在测试时有没有切换到推理模式,如pytorch中的eval()转换

        3、检查输入的数据维度是否正确,比如训练时使用[N, C, H, W],测试时也要使用同样的数据维度顺序,现在好多分类模型在后面会添加AdaptiveAvgPool层,即使输入的数据尺寸和训练时不一样也不会报错

        4、检查模型参数加载是否正确,还是以pytorch框架为例,pytorch在加载模型时如果设置完全匹配的参数为False,在加载过程中即使参数和模型不匹配也不会报错,但是会使用默认的随机参数

        以上就是目前在实际工作中遇到的一些可能原因分析,如果还有其他可能原因,欢迎随时指导。

Logo

尧米是由西云算力与CSDN联合运营的AI算力和模型开源社区品牌,为基于DaModel智算平台的AI应用企业和泛AI开发者提供技术交流与成果转化平台。

更多推荐