当前位置: 首页 > news >正文

上海市企业服务云简介济源新站seo关键词排名推广

上海市企业服务云简介,济源新站seo关键词排名推广,织梦做淘宝客网站视频教程,做的比较好看的国内网站1 有监督学习的损失函数 1.1 分类问题 对二分类问题, Y{1,−1}, 我们希望sign f(xi,θ)yi, 最自然的损失函数是0-1损失, 函数定义特点0-1损失函数非凸、非光滑,很难直接对该函数进行优化Hinge损失函数当fy≥1时&…

1 有监督学习的损失函数

1.1 分类问题

对二分类问题, Y={1,−1}, 我们希望sign f(xi,θ)=yi, 最自然的损失函数是0-1损失,

函数定义特点
0-1损失函数函数定义非凸、非光滑,很难直接对该函数进行优化
Hinge损失函数当fy≥1时, 该函数不对其做任何惩罚。 Hinge损失在fy=1处不可导, 因此不能用梯度下降法进行优化, 而是用次梯度下降法
Logistic损失函数该损失函数对所有的样本点都有所惩罚, 因此对异常值相对更敏感一些
交叉熵损失函数在这里插入图片描述

损失函数曲线

1.2回归问题

希望 在这里插入图片描述, 最常用的损失函数是平方损失函数

函数定义特点
平方损失函数在这里插入图片描述对异常点比较敏感
绝对损失函数在这里插入图片描述在f=y处无法求导数
Huber损失函数在这里插入图片描述

在这里插入图片描述

2 梯度下降法

梯度下降算法发展过程

3 L1正则化与稀疏性

稀疏性,就是模型中的很多参数为0,相当于对模型进行了特征选择,只留下了重要的特征。提高了模型的泛化能力,降低了过拟合的可能。
为什么L1正则化能让模型具有稀疏性?

3.1 从解空间形状来看

在这里插入图片描述
黄色的部分是L2和L1正则项约束后的解空间, 绿色的等高线是凸优化问题中目标函数的等高线,L2正则项约束后的解空间是圆形, 而L1正则项约束的解空间是多边形。显然, 多边形的解空间更容易在尖角处与等高线碰撞出稀疏解。

3.2 从函数叠加来看

在这里插入图片描述
首先, 考虑加上L2正则化项, 目标函数变成L(w)+Cw2, 其函数曲线为黄色。此时, 最小值点在黄点处, 对应的w*的绝对值减小了, 但仍然非0。
然后, 考虑加上L1正则化项, 目标函数变成L(w)+C|w|, 其函数曲线为绿色。此时, 最小值点在红点处, 对应的w是0, 产生了稀疏性。

在一些在线梯度下降算法中, 往往会采用截断梯度法来产生稀疏性, 这同L1正则项产生稀疏性的原理是类似的。

3.3从贝叶斯实验来看

从贝叶斯的角度来理解L1正则化和L2正则化, 简单的解释是, L1正则化相当于对模型参数w引入了拉普拉斯先验, L2正则化相当于引入了高斯先验, 而拉普拉斯先验使参数为0的可能性更大。

http://www.khdw.cn/news/50594.html

相关文章:

  • 百度引擎提交入口长沙seo关键词排名优化
  • 公司企业建站宣传软文范例
  • 福永自适应网站建设网页优化公司
  • 余姚做网站的公司品牌推广百度seo
  • 小型的电商网站有哪些地推app推广赚佣金
  • 住房和城乡建设部网站主页帮别人发广告赚钱平台
  • 外贸公司网站如何做网上推广怎么注册域名网址
  • 网站漏扫宁波网络推广优化方案
  • 鄂州市 网站建设新闻头条最新消息今日头条
  • 网站建设及发展什么是网络软文营销
  • 校园微网站建设信阳网络推广公司
  • 网站开发 发送邮件功能青岛网站建设推广公司
  • 网站未备案被阻断怎么做火星时代教育培训机构官网
  • 北京网站改版深圳网站建设服务
  • 展示类网站管理员58同城推广效果怎么样
  • 深圳做网站建设球队积分排名
  • 网站建设与技术团队关键词查询爱站网
  • 公司小程序制作青岛网站seo优化
  • 中信建发公司简介seox
  • 能够做物理题的网站腾讯朋友圈广告投放价格
  • 鹤峰网站制作网络营销优化推广
  • 镇江网站建设平台广告公司网站制作
  • 惠州市住房和城乡规划建设局网站百度推广seo优化
  • 百度海外视频网站建设上海最新新闻
  • 阿里巴巴网站做销售方案广州网站优化服务
  • 陕西建设厅证件查询网站品牌网络营销成功案例
  • 如果做网站需要多少钱百度站长工具抓取诊断
  • 舟山公司网站制作深圳网络推广培训中心
  • 大连网站建设谁家好济南seo优化
  • 网站推广的英文content高清视频线和音频线的接口类型