当前位置: 首页 > news >正文

妈妈做愛网站杭州百家号优化

妈妈做愛网站,杭州百家号优化,教育系统网站备案,学校网站建设意义一、自注意力 1、给定一个由词元组成的输入序列x1,…,xn, 其中任意xi∈R^d(1≤i≤n)。 该序列的自注意力输出为一个长度相同的序列 y1,…,yn,其中: 2、自注意力池化层将xi当作key,value,query来…

一、自注意力

1、给定一个由词元组成的输入序列x1,…,xn, 其中任意xi∈R^d(1≤i≤n)。 该序列的自注意力输出为一个长度相同的序列 y1,…,yn,其中:

2、自注意力池化层将xi当作key,value,query来对序列抽取特征得到y1,…,yn

二、跟CNN、RNN对比(目标都是将由n个词元组成的序列映射到另一个长度相等的序列,其中的每个输入词元或输出词元都由d维向量表示)(不是很明白,有空问问老师)

1、CNN:序列长度是n,输入和输出的通道数量都是d, 所以卷积层的计算复杂度为O(knd^2);卷积神经网络是分层的,因此为有O(1)个顺序操作, 最大路径长度为O(n/k)。

2、RNN:当更新循环神经网络的隐状态时, d×d权重矩阵和d维隐状态的乘法计算复杂度为O(d2)。 由于序列长度为n,因此循环神经网络层的计算复杂度为O(nd2);有O(n)个顺序操作无法并行化,最大路径长度也是O(n)。

3、在自注意力中,查询、键和值都是n×d矩阵。 考虑缩放的”点-积“注意力, 其中n×d矩阵乘以d×n矩阵。 之后输出的n×n矩阵乘以n×d矩阵。 因此,自注意力具有O(n2d)计算复杂性。 每个词元都通过自注意力直接连接到任何其他词元,有O(1)个顺序操作可以并行计算, 最大路径长度也是O(1)。

三、位置编码

1、自注意力则因为并行计算而放弃了顺序操作。 为了使用序列的顺序信息,通过在输入表示中添加 位置编码(positional encoding)来注入绝对的或相对的位置信息。

2、输入表示X∈R^(n×d)包含一个序列中n个词元的d维嵌入表示。 位置编码使用相同形状的位置嵌入矩阵 P∈R^(n×d)输出X+P

3、位置编码矩阵

4、绝对位置信息

        竖着看,有三维,第一维00001111变化很慢,第二位00110011变化中等,第三维01010101变化最快,大概是这样子叭。。。。

5、相对位置信息

        除了捕获绝对位置信息之外,位置编码还允许模型学习得到输入序列中相对位置信息。 这是因为对于任何确定的位置偏移δ,位置i+δ处 的位置编码可以线性投影位置i处的位置编码来表示。也就是:

        位于i+δ处的位置编码可以线性投影位置i处的位置编码来表示

        令ωj=1/100002^(j/d), 对于任何确定的位置偏移δ中,任何一对 (p^(i,2j),p^(i,2j+1))都可以线性投影到 (p^(i+δ,2j),p^(i+δ,2j+1))

6、代码

#@save
class PositionalEncoding(nn.Module):"""位置编码"""def __init__(self, num_hiddens, dropout, max_len=1000):super(PositionalEncoding, self).__init__()self.dropout = nn.Dropout(dropout)# 创建一个足够长的Pself.P = torch.zeros((1, max_len, num_hiddens))X = torch.arange(max_len, dtype=torch.float32).reshape(-1, 1) / torch.pow(10000, torch.arange(0, num_hiddens, 2, dtype=torch.float32) / num_hiddens)self.P[:, :, 0::2] = torch.sin(X)self.P[:, :, 1::2] = torch.cos(X)def forward(self, X):X = X + self.P[:, :X.shape[1], :].to(X.device)return self.dropout(X)

四、总结

1、在自注意力中,查询、键和值都来自同一组输入。

2、卷积神经网络和自注意力都拥有并行计算的优势,而且自注意力的最大路径长度最短。但是因为其计算复杂度是关于序列长度的二次方,所以在很长的序列中计算会非常慢。

3、为了使用序列的顺序信息,可以通过在输入表示中添加位置编码,来注入绝对的或相对的位置信息

http://www.khdw.cn/news/8299.html

相关文章:

  • 做网站的技术smat网络推广员的工作内容
  • 东莞网站建设托管除了百度指数还有哪些指数
  • 百度网站关键字搜索怎么做站长素材官网
  • ssm实战项目网站开发网页制作公司排名
  • 类似游侠客网站建设网页优化
  • 百度云可以做网站吗网上营销方式和方法
  • 新型新冠病毒最新消息长沙seo步骤
  • 一个服务器上有两个网站 要备案两次吗百度搜索排行seo
  • 轻淘客 轻网站怎么做怎么优化百度关键词
  • 做私服网站电话网络推广优化
  • 专业网站建设需要多少钱怎样做引流推广
  • 免费外贸网站制作口碑好的设计培训机构
  • 网站制作维护站长工具官网
  • 做外包哪个网站好一些aso优化技术
  • 做网站开发服务商上海推广外包
  • 最牛的手机视频网站建设网页广告调词平台
  • wordpress全站301北京网站推广营销服务电话
  • 青岛网站建设莫道网络江苏建站
  • 安徽合肥网站建设小红书sem是什么意思
  • 化妆培训学校网站源码 下载深圳网络营销推广
  • 上海公司网站建设多少钱优化推广联盟
  • wordpress get_commentsseo网站排名后退
  • 常州网站建设百科营销软件
  • 怎么设置网页版浏览器站长工具seo综合查询问题
  • 做碳循环的网站青岛网站权重提升
  • 洛阳市建设厅网站佛山网站建设公司
  • 深圳市门户网站建设营销策略范文
  • 长网页网站知名seo公司
  • 网站建设的步骤百度云官网
  • 最新免费网站收录提交入口seo自动发布外链工具