当前位置: 首页 > news >正文

公司网站建设工作通知网店推广联盟

公司网站建设工作通知,网店推广联盟,建设和优化网站的步骤,网站制作 西安文章目录知识点状态Flink容错恢复周期性的 Checkpoint错误检测 Failure Detected重新调度 Re-scheduling状态恢复 State Recovery通用增量Checkpoint知识点 状态 算子需要记录之前数据处理的中间结果,把中间结果暂时缓存在算子的内部,这就是算子的状态…

文章目录

    • 知识点
      • 状态
      • Flink容错恢复
        • 周期性的 Checkpoint
        • 错误检测 Failure Detected
        • 重新调度 Re-scheduling
        • 状态恢复 State Recovery
      • 通用增量Checkpoint

知识点

状态

算子需要记录之前数据处理的中间结果,把中间结果暂时缓存在算子的内部,这就是算子的状态。

为了避免算子挂掉,状态丢失,就需要重头开始进行Flink作业,这样效率太差,为了解决算子挂掉导致状态丢失无法恢复算子、算子状态的问题,周期性的对算子状态进行snapshot,这就是Flink的CheckPoint机制

Flink容错恢复

因为Checkpoint是频发的,所以Checkpoint过程要尽可能轻量、稳定且能够保证成功。

容错恢复过程有以下几个方面

周期性的 Checkpoint

错误检测 Failure Detected

如果某个节点挂了,就需要快速的发现这个失败节点,并完成相应的清理工作

重新调度 Re-scheduling

生成新的作业并重新调度,最后完成部署

状态恢复 State Recovery

作业重新调度起来以后,就需要从最新的快照中把算子的中间状态恢复起来

通用增量Checkpoint

Generic Log-based Incremental Checkpoints

算子在更新自身状态时,会将状态更新结果记录到状态表中

快照异步上传到DFS的时间和状态表的大小正相关,时间非常长并且不可控

为了解决这个问题引入了通用增量Checkpoint机制

解耦状态表和增量日志上传过程

在维护原有状态表的同时,记录一份增量状态更新日志(Change Log)

原有的算子状态快照的过程有两个部分
第一个部分是同步对算子进行快照,这个过程中内存的数据会刷写到磁盘,准备好上传到DFS的文件

第二个部分就是异步上传快照文件

存在的问题

  1. 异步上传的文件大小严重依赖StateBackend的实现
  2. 在同步快照结束前,是无法开始异步上传过程的,整个异步上传过程要等到同步过程结束后才能进行

对于第一个问题,以RocksDB为例,虽然说RocksDB支持增量快照,但是RocksDB因为自身的实现机制,需要对文件Compaction,每次Compaction都会产生新的比较大的文件,这种情况下即使是增量的Checkpoint也会时不时的使需要上传的Checkpoints文件变得比较大,如果并发比较大的情况下,上传文件时不时变大导致的问题就会很严重,因为只有等所有并发上传的文件都上传完毕,一个完整的算子状态才算是快照完成。

对于第二个问题,状态同步快照结束前无法开始异步上传过程,会导致较大的作业延迟

针对以上两个问题新的通用增量Checkpoint机制
算子状态更新时不仅会更新状态表,还会记录状态更新日志,这样的话状态表还是会周期性的刷新到DFS中,但是这个周期可以变得比较大,比如10分钟,状态表在后台慢慢的进行上传,这个过程称之为物化过程物化过程。同时这个状态更新日志也会不断的上传到远端DFS,并且在Checkpointing的时候Flush剩余的全部日志。

通过将状态快照过程和物化过程完全的独立开来,可以让异步上传的文件大小变得很稳定,同时因为状态更新是持续的,可以在快照之前就一直持续的上传、更新,所以在快照的时候实际上需要上传的数据量就会变得很小。物化过程结束后,相对应的更新日志可以被删除。

Change Log Storage ,DSTL(Durable Short-term Log)

DSTL的几个特性:
持久化
高频写
写延迟
一致性

待定…

资料:

Flink 1.15 新功能架构解析:高效稳定的通用增量 Checkpoint

http://www.khdw.cn/news/40760.html

相关文章:

  • 网站图片怎样做seo优化深圳全网推广方案
  • 彩票网站为啥链接做两次跳转百度云资源搜索入口
  • 做数学ppt工具的网站知道百度
  • 电子商务公司网站怎么建网络舆情报告
  • 广州网站建设开发公司百度免费安装下载
  • 有什么网上做c 的网站下载百度语音导航地图安装
  • 怎样做自己可以发布消息的网站百度自媒体平台
  • 怎么做简单的网站首页文员短期电脑培训
  • 做照明出口的网站推广服务商
  • 郑州外贸网站建设商家潍坊seo外包平台
  • 网站建设用哪种语言最好网络推广培训去哪里好
  • 门户网站建设工作讲话网络推广营销方案100例
  • 大型网站开发 书籍在线一键生成网页
  • wordpress博客案例信息如何优化上百度首页
  • 建立企业网站的详细步骤最新seo教程
  • 花都建站电商网站分析
  • 晚上做设计挣钱的网站自己怎么建网站
  • 查看网站域名建站系统
  • 台州网站排名优化公司品牌推广工作内容
  • 服务器怎么做网站教程企业网络的组网方案
  • asp.net做网站野狼seo团队
  • wordpress 自动相册seo软件视频教程
  • wordpress 卡密关键词优化软件有哪些
  • 做pc端网站公司b站推广有用吗
  • 给客户做网站需要提供百度小说排行榜第一名
  • 手机域名网站怎么做怎么去推广自己的公司
  • 松江做公司网站谷歌paypal官网入口
  • 企业网站建设顾问宁波seo推广定制
  • 如何申请做网站windows优化大师有哪些功能
  • 网站url优化关键词优化报价