当前位置: 首页 > news >正文

专业的手机网站开发今日热搜前十名

专业的手机网站开发,今日热搜前十名,模块网站开发合同,需要注册的网站建设【学而不思则罔,思维不学则怠】 本文总结一下常见的一些算法训练超参数调优思路(陆续总结更新),包括: batchsize学习率epochsdropout(待添加) Batch_size 2023.9.29 简单来说,较…

【学而不思则罔,思维不学则怠】

本文总结一下常见的一些算法训练超参数调优思路(陆续总结更新),包括:

  • batchsize
  • 学习率
  • epochs
  • dropout(待添加)

在这里插入图片描述

Batch_size

2023.9.29

  • 简单来说,较大的bz可以加快训练速度,特别是基于GPU进行模型训练时,应该在显存允许范围内,尽量使用较大的bz。
  • 两个极端:假设内存/显存足够大,每次都是使用全量数据进行梯度计算,此时训练效率最高,但训练极容易陷入鞍点(局部最优)而无法跳出,表现出来就是loss还比较高,但是已经开始收敛了。
  • 但bz不是说越大越好,越大bz意味着用更多的数据来计算梯度,越容易陷入鞍点,但若batch数量较多,则当一个batch的数据使算法陷入鞍点了,另一个batch的数据有机会使算法跳出鞍点。
  • 因此bz尽可能选大一些,同时保证batch数量不太少,最简单的方法就是从GPU显存或CPU内存运行的最大值开始实验,若发现出现了loss过早收敛且比较高时(陷入鞍点),此时则放弃充分利用GPU,而应考虑减少bz,使loss能够继续下降。
  • 结论:从显存/内容利用率角度和防止陷入鞍点两个角度来思考bz。

学习率

2024.1.16

  • lr若太大,则会导致训练波动,不容易收敛,表现出来就是算法的loss在下降一段时间后,又突然增加,然后又下降,然后有增加,就像乒乓球落地上,弹弹弹。loss曲线并不光滑,如锯齿版的下降(就像下图的样子)。甚至始终无法收敛。
  • lr若太小,最大的问题就是需要更长的时间来进行收敛。
  • 对lr的设置除了经验值外,就是观看loss收敛情况。
    在这里插入图片描述

epochs

2024.1.16

  • 它就很简单了,先推荐设置一个较大的值,然后观察能收敛的epoch即可

dropout

待添加

http://www.khdw.cn/news/34706.html

相关文章:

  • 襄阳哪里做网站东莞网站推广技巧
  • 怎么做捕鱼网站四川seo快速排名
  • 做个商城网站怎么做便宜百度seo推广优化
  • 做医疗的网站怎么网上推广自己的产品
  • 湖南省重点建设项目办公室网站百度网址大全网站
  • python做网站赚钱国内销售平台有哪些
  • 企业做网站需要租服务器吗百度推广天天打骚扰电话
  • 烟台福山网站建设链接推广平台
  • 效果图网站都有哪些?怎么建立企业网站
  • 哪个网站可以免费学做美甲hao123网址之家官网
  • 公司组网梅州seo
  • 虎门专业做网站搜索引擎营销的优势
  • 企业网站的建立费用宁波网站建设公司哪家好
  • 平台网站建设协议长沙整合推广
  • 手机网站前端开发布局技巧seo服务公司上海
  • 做爰全过程免费的视频网站有声音百度客户管理系统登录
  • 北京汇云世纪网络科技有限公司做网站怎么样公司网络推广排名定制
  • 网站如何做分享建立一个网站需要多少钱
  • 成都网络建站网站代发外链
  • 网站党组织规范化建设开展情况三亚百度推广开户
  • 网站为何突然不收录了杭州网站seo价格
  • 做家具网站要多少钱百度搜索引擎广告位的投放
  • 200M电信宽带做网站接单平台app
  • 东莞连衣裙 东莞网站建设重庆关键词自然排名
  • 怎么做社交网站引流到亚马逊网络营销推广难做吗
  • 博兴网站建设网站推广模式
  • 免费做电子请帖的网站seo资源网站 排名
  • 电商网站 开发周期珠海企业网站建设
  • pc网站 公众号数据互通百度推广怎么做免费
  • 网站建设 东营远见网络公司成都百度百科