当前位置: 首页 > news >正文

丰台网站建设公司四川seo排名

丰台网站建设公司,四川seo排名,长春哪里做网站好,wordpress admin init这里写自定义目录标题 介绍模型推理的输出过程方案原始Token输出RM输出(回归任务) 介绍 奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练&#xff0c…

这里写自定义目录标题

  • 介绍
  • 模型推理的输出过程方案
    • 原始Token输出
    • RM输出(回归任务)

介绍

奖励函数模型 (Reward Model) 是人工智能 (AI) 中的一种方法,模型因其对给定提示的响应而获得奖励或分数。现在的文章清一色的讲解RM的训练,但是没有讲解RM是如何输出一个分数的。本文只讲RM的输出,以补充资料的缺乏。RM通常采用Llama-7B模型,本文也沿用这一模型,同时模型的推理计算过程作为已知的知识,只讲解推理最后的输出部分。本文章先介绍传统Llama模型原始Token输出过程,再讲解RM的输出。以作为对比更好的学习。

模型推理的输出过程方案

  1. 原始Token输出

预训练语言模型(如LLaMA、GPT等)的默认任务是语言建模,它们的输出是针对每个token的概率分布(即词汇表中的每个词的概率)
在这里插入图片描述在这里插入图片描述
注,W矩阵在llama-7b中是lm_head.weight

  1. RM输出(回归任务)

写在前面:回归任务就不需要原始Token输出中的logits矩阵的计算(即图中H*W+B的部分)和softmax的计算。

  • 处理每个token的隐藏状态以生成全局表示
    隐藏状态的介绍:
    在这里插入图片描述
    1) 平均池化(Mean Pooling)
    在这里插入图片描述
    2) 最大池化(Max Pooling)在这里插入图片描述
  • 回归任务输出分数:

在这里插入图片描述

http://www.khdw.cn/news/12124.html

相关文章:

  • 翔安区建设局网站品牌线上推广方案
  • 毕业设计代做网站58精准推广点击器
  • 网站制作 网站西安疫情最新消息
  • 企业网站seo优化公司东莞搜索引擎推广
  • 潍坊网站建设招聘怎么学seo基础
  • 盐城网站优化方案茂名百度seo公司
  • 网站建设制作流程网络营销推广方案
  • 详情页设计流程南京百度快照优化排名
  • 利用网络媒体营销来做电商网站论文佛山网络排名优化
  • 巴音郭楞网站建设成年学校培训班
  • 扁平化设计网站建设软文推广多少钱
  • 网络及建设公司网站推广软文发稿
  • 网站产品链接怎么做的免费个人网站制作
  • 网站开发和网站建设高德北斗导航
  • 合肥哪家做网站不错重庆seo优化
  • 网站更改公司需要重新备案吗山东百度推广代理
  • 建设自己的网站步骤百度如何发布作品
  • 网站快速优化杭州seo网
  • 常州网站建设郑州网站优化顾问
  • 在线做qq空间的网站申请一个网站
  • 做家常菜的网站哪个好哈尔滨seo和网络推广
  • 电子商务网站建设系统功能网站竞价推广
  • 网站实施建设流程李守洪
  • 教学网站开发背景国际新闻 军事
  • 阀门网站建设网络优化培训
  • 网站建设要点seo关键词推广方式
  • 什么app推广佣金多优化大师免费下载
  • 网站自助建设推广短期的技能培训有哪些
  • 做动画在线观看网站免费引流推广工具
  • 网站建设及网络推广樱桃电视剧西瓜视频在线观看