IT资讯

抛弃归一化,深度学习模型准确率却达到了前所未有的水平

作者:admin 2021-04-26 我要评论

我们知道,在传递给机器学习模型的数据中,我们需要对数据进行归一化(normalization)处理。 在数据归一化之后,数据被「拍扁」到统一的区间内,输出范围被缩小...

在说正事之前,我要推荐一个福利:你还在原价购买阿里云、腾讯云、华为云服务器吗?那太亏啦!来这里,新购、升级、续费都打折,能够为您省60%的钱呢!2核4G企业级云服务器低至69元/年,点击进去看看吧>>>)

我们知道,在传递给机器学习模型的数据中,我们需要对数据进行归一化(normalization)处理。

在数据归一化之后,数据被「拍扁」到统一的区间内,输出范围被缩小至 0 到 1 之间。人们通常认为经过如此的操作,最优解的寻找过程明显会变得平缓,模型更容易正确的收敛到最佳水平。

然而这样的「刻板印象」最近受到了挑战,DeepMind 的研究人员提出了一种不需要归一化的深度学习模型 NFNet,其在大型图像分类任务上却又实现了业内最佳水平(SOTA)。

抛弃归一化,深度学习模型准确率却达到了<span><span><span><i pgc-img抛弃归一化,深度学习模型准确率却达到了<span><span><span><i pgc-img抛弃归一化,深度学习模型准确率却达到了<span><span><span><i pgc-img抛弃归一化,深度学习模型准确率却达到了<span><span><span><i pgc-img抛弃归一化,深度学习模型准确率却达到了<span><span><span><i pgc-img抛弃归一化,深度学习模型准确率却达到了<span><span><span><i pgc-img抛弃归一化,深度学习模型准确率却达到了<span><span><span><i text-align: center;表 5:使用额外数据进行大规模预训练后,ImageNet 模型迁移性能对比。

Andrew Brock 表示,虽然我们对于神经网络信号传递、训练规律的理解还有很多需要探索的方向,但无归一化的方法已经为人们提供了一个强有力的参考,并证明了发展这种深度理解能力可以有效地在生产环境中提升效率。


本文转载自网络,原文链接:https://www.toutiao.com/i6928647087244739085/

版权声明:本文转载自网络,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本站转载出于传播更多优秀技术知识之目的,如有侵权请联系QQ/微信:153890879删除

相关文章
  • 华人博士生首次尝试用两个Transformer

    华人博士生首次尝试用两个Transformer

  • 4G 登顶,5G 发力:2025 年 4G 占中国

    4G 登顶,5G 发力:2025 年 4G 占中国

  • 模型压缩6倍,无需重训练:数学家团队

    模型压缩6倍,无需重训练:数学家团队

  • 留意2021年比较热门的5种AI工作技能

    留意2021年比较热门的5种AI工作技能