当前位置: 首页 > news >正文

武汉老牌网站建设公司深圳优化公司样高粱seo

武汉老牌网站建设公司,深圳优化公司样高粱seo,学做网站论,网站服务合同用交印花税吗一、RDD持久化 1、不采用持久化操作 查看要操作的HDFS文件 以集群模式启动Spark Shell 按照图示进行操作,得RDD4和RDD5 查看RDD4内容,会从RDD1到RDD2到RDD3到RDD4跑一趟 显示RDD5内容,也会从RDD1到RDD2到RDD3到RDD5跑一趟 2、采用持久化…

一、RDD持久化

1、不采用持久化操作
查看要操作的HDFS文件
在这里插入图片描述
以集群模式启动Spark Shell
在这里插入图片描述
按照图示进行操作,得RDD4和RDD5
在这里插入图片描述
查看RDD4内容,会从RDD1到RDD2到RDD3到RDD4跑一趟
在这里插入图片描述
显示RDD5内容,也会从RDD1到RDD2到RDD3到RDD5跑一趟

在这里插入图片描述
2、采用持久化操作
在这里插入图片描述
计算RDD4,就是基于RDD3缓存的数据开始计算,不用从头到尾跑一趟
在这里插入图片描述
计算RDD5,就是基于RDD3缓存的数据开始计算,不用从头到尾跑一趟
在这里插入图片描述

二、存储级别

案例演示设置存储级别
在这里插入图片描述

package net.cxf.rdd.day05import org.apache.log4j.{Level, Logger}
import org.apache.spark.storage.StorageLevel
import org.apache.spark.{SparkConf, SparkContext}import java.awt.SystemTray/*** 功能:* 作者:cxf* 日期:2023年05月06日*/
object SetStorageLevel {def main(args: Array[String]): Unit = {//创建Spark配置对象val conf = new SparkConf().setAppName("SetStorageLevel") //设置应用名称.setMaster("local[*]") //设置主节点位置(本地调试>// 基于Spark配置对象创建Spark容器val sc = new SparkContext(conf)//去除Spark运行信息Logger.getLogger("org").setLevel(Level.OFF)Logger.getLogger("com").setLevel(Level.OFF)System.setProperty("spark.ui.showConsoleProgress", "false")Logger.getRootLogger().setLevel(Level.OFF)//创建RDDval rdd = sc.textFile("hdfs://master:9000/park/words.txt")//将rdd标记为持久化,采用默认存储级别- StorageLevel.MEMORY_ONLYrdd.persist() //无参持久化方法//对rdd做扁平映射,得到rdd1val rdd1 = rdd.flatMap(_.split(" "))//将rdd1持久化都磁盘rdd1.persist(StorageLevel.DISK_ONLY)//将rdd1映射成二元组,得到rdd2val rdd2 = rdd1.map((_, 1))//将rdd2持久化到内存,溢出的数据持久化到磁盘rdd2.persist(StorageLevel.MEMORY_AND_DISK)//第一次行动算子,对标记为持久化的RDD进行不同级别的持久化曹println("元素个数:" + rdd2.count)//第二次行动算子,直接利用rdd2的持久化数据进行操作,无须从头进行计算rdd2.collect.foreach(println)}}

运行程序,查看结果

在这里插入图片描述

三、利用Spark WebUI查看缓存

最好重启Spark Shell
在这里插入图片描述
(一)创建RDD并标记为持久化
在这里插入图片描述
(二)Spark WebUI查看RDD存储信息
在这里插入图片描述
收集RDD数据
在这里插入图片描述
刷新WebUI,发现出现了一个ParallelCollectionRDD的存储信息,该RDD的存储级别为MEMORY,持久化的分区为8,完全存储于内存中。
在这里插入图片描述
单击ParallelCollectionRDD超链接,可以查看该RDD的详细存储信息
在这里插入图片描述
执行以下命令,创建rdd2,并将rdd2持久化到磁盘
在这里插入图片描述
刷新上述WebUI,发现多了一个MapPartitionsRDD的存储信息,该RDD的存储级别为DISK,持久化的分区为8,完全存储于磁盘中。
在这里插入图片描述
(三)将RDD从缓存中删除
在这里插入图片描述
刷新上述WebUI,发现只剩下了MapPartitionsRDD,ParallelCollectionRDD已被移除。
在这里插入图片描述

http://www.khdw.cn/news/36257.html

相关文章:

  • 嘉兴网站建设服务关键词排名优化技巧
  • 企业网站的建设手游cpa推广平台
  • 建筑专业网站有哪些seo关键词排名点击工具
  • 沈阳做网站客户多吗搜索引擎关键词优化有哪些技巧
  • 给企业做网站推广好么网络服务商主要包括
  • 做团购网站的心得直播:韩国vs加纳直播
  • 贵州省网站节约化建设通知百度热门关键词排名
  • 主机托管服务seo网站推广工作内容
  • 狗铺子做网页在那个网站seo好学吗
  • 注册城乡规划师考试时间2024株洲企业seo优化
  • 哈尔滨网页制作淘宝seo排名优化软件
  • 网络推广方案撰写苏州网站seo服务
  • 花钱推广的网络平台南京seo优化推广
  • 上海网站开发建设价格1688精品货源网站入口
  • 下做图软件在哪个网站下载竞价推广网络推广运营
  • 常州辉煌网络网站建设产品网络营销分析
  • 网站开发工程师职业道德今日头条号官网
  • 网站做多个单页链接网络策划书范文
  • 网站开发seo要求上海公关公司
  • 工商网企业信息查询系统上海百度搜索引擎优化案例
  • 自己公司的网站怎么编辑器100条经典广告语
  • 无锡建网站2022近期重大新闻事件10条
  • 保定网站建设推广seo技术服务外包公司
  • 重庆网站建设 观音桥百度热榜实时热点
  • vs做网站出现显示bug网站百度百科
  • 2018年做网站赚钱吗郑州seo顾问阿亮
  • 学会了vue 能搭建一个网站平台上海seo网站排名优化公司
  • 徐州做网站需要多少钱优秀软文范例
  • 沈阳建设工程招标信息网苏州seo优化
  • 深圳app开发网站建设推广网站软文