分析
这篇文章提出了一个关于深度神经网络泛化能力的基本问题,考虑到它们拥有大量的参数和可能完美的训练误差。它强调了深度学习中过拟合的常见担忧。
引用
“由于一个典型的深度神经网络有如此多的参数,并且训练误差很容易达到完美,它肯定会遭受严重的过拟合。它怎么可能泛化到样本外的数据点呢?”
这篇文章提出了一个关于深度神经网络泛化能力的基本问题,考虑到它们拥有大量的参数和可能完美的训练误差。它强调了深度学习中过拟合的常见担忧。
“由于一个典型的深度神经网络有如此多的参数,并且训练误差很容易达到完美,它肯定会遭受严重的过拟合。它怎么可能泛化到样本外的数据点呢?”