当前位置: 首页 > news >正文

人才招聘网站怎么做山东泰安网络推广

人才招聘网站怎么做,山东泰安网络推广,做网站编辑,互联网网站备案表示的基本原理: 机器无法理解文字,却能进行复杂的数学运算——神经网络只要够深、够复杂,就能拟合足够复杂的数学模式。把文字嵌入(embed)到一个向量空间中去。 词表示(Word Representation)…

表示的基本原理:

机器无法理解文字,却能进行复杂的数学运算——神经网络只要够深、够复杂,就能拟合足够复杂的数学模式。把文字嵌入(embed)到一个向量空间中去。

词表示(Word Representation)分为4代

1.独热(One hot)编码

基本原理:

假设中文字典有n个词元,那么第i(i=1,2,3,...,n)个词元的编码为一个长度为n的向量,它的第i位为1,其他为0。独热编码实现了对文本的向量化嵌入。

问题:

第一,向量的维度太长了,文本的表示过于稀疏;

第二,词向量与词向量之间完全正交,不具有相关性。

2.词频-逆文档词频(Term Frequency-Inverse Term Frequency, TF-IDF)

根据Zipf's Law,在给定的自然语言语料库中,任何一个词的频率与它在频率表中的排名成反比。

3.语境无关(Context-free/Non-contextual)的词表示:Word2vec

它对每一个词生成一个相同的词表示,不考虑同一个词在不同语境下含义的差别。

连续词袋法:

用一个浅层神经网络,依次遮住句子中的每一个词,然后用它的上下文来预测它

跳元法:

我们用一个k元词组来预测它的上下文

自监督预训练:

通过“破坏”句子的一部分,让模型预测它,从而实现对词的更精确的表示.

4.语境相关(Context-dependent/Contextual)的词表示:BERT

语言的多义性是人类自然语言的重要特点。

BERT考虑了三层嵌入:词嵌入、位置嵌入(词在句子中的位置)和句子嵌入,并把它们加起来作为最后的嵌入表示。

BERT使用WordPiece分词器(tokenizer),借鉴了自监督训练的思想,在两个任务上进行预训练:下句预测(Next Sentence Prediction)和掩码语言建模(Masked Language Modeling)。

下句预测是一个二分类任务:给定一个句子,判定另一个句子是否是它的下一句;

掩码语言建模任务随机掩盖其中15%的单词,并训练模型来预测被掩盖的单词,为了预测被掩盖的单词,模型从两个方向阅读该句并进行预测。

http://www.khdw.cn/news/13131.html

相关文章:

  • 英文网站制作费用搜索引擎优化的对比
  • 网站设计价格大概是爱站网关键词
  • 网站做管制户外刀具专业培训seo的机构
  • 软件营销之群排名优化教程优化推广公司哪家好
  • wordpress 360字体插件百度seo关键词排名查询工具
  • 成都设计公司招聘ios aso优化工具
  • 阜阳水建公司官网中山网站seo优化
  • flash视频网站源码关键字排名软件官网
  • wordpress id获取图片地址重庆seo杨洋
  • 威海制作网站windows优化大师电脑版
  • 设计网站推荐ps百度运营怎么做
  • 个人备案网站名称云搜索引擎入口
  • 管理网站开发教程网易疫情实时最新数据
  • 对网站建设的意见广州网络营销推广公司
  • 如何在阿里网站做外单app推广活动策划方案
  • vue开发自适应网站百度推广效果不好怎么办
  • iis服务器网站301重定向怎么做百度网站下载
  • 网站的备案号查询域名注册入口
  • 小米发布会在哪看广州百度快速排名优化
  • 免费qq空间访客网站搜索引擎优化关键词
  • 凡科在线制作网站2022年最新新闻播报稿件
  • 党政机关网站建设怎么搜索网站
  • 网站建设类发票税率多少钱微博推广费用
  • 微信公众网站开发微信引流主动被加软件
  • 做网站app要注册哪类商标谷歌浏览器app
  • 如何做网站链接写文案接单平台
  • 给百度做网站的公司百度公司在哪
  • wordpress多合一seo包微信搜一搜seo优化
  • 电子商务网站建设网上商城营销推广app
  • 手机上可以做网站吗网站建设深圳公司