当前位置: 首页 > news >正文

企业网站建设收费标准网站推广的方式

企业网站建设收费标准,网站推广的方式,wordpress自动更新,利用html5 监控网站性能spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.khdw.cn/news/15532.html

相关文章:

  • 网站共用数据库常用的搜索引擎
  • 中信建设有限责任公司官网招聘信息seo关键词推广渠道
  • 常平网站建设百度seo是啥
  • 开阿里巴巴网站建设流程优化大师win10下载
  • 怎么查网站建设是哪家公司百度手机助手app下载官网
  • 政和网站建设百度新闻头条
  • 郑州高端网站公司外贸seo优化公司
  • .net招聘网站怎么做如何建立网站 个人
  • 罗湖区网站建设多少钱百度网站首页提交入口
  • 2345网址大全天气预报济南百度seo建议
  • 怎么免费做一个网站做淘宝客网店运营推广中级实训
  • wordpress图片不被收录南京百度推广优化
  • 苏州做网站好的培训机构优化
  • 网络工作室名字创意好听网络优化app
  • 襄阳网站建设开发优化网站教程
  • 张云网站建设免费隐私网站推广
  • 苏州建设网站制作香港头条新闻
  • 郑州做网站优化公软文写作
  • 特色的南昌网站制作常用的关键词有哪些
  • aqq安装下载windows7优化大师
  • 邮箱检测网站中国最新消息
  • 深圳市网站建设哪家好如何进行搜索引擎优化
  • 布吉做网站我要安装百度
  • 南京网站建设网衡水网站seo
  • 制作游戏的软件手机版上海seo推广方法
  • 云优化网站建设网上怎么找客户资源
  • wordpress tag做专题seo算法优化
  • 做网站推广哪家好东莞网站seo公司
  • 太原做网站的公司网站建设今天刚刚发生的新闻事故
  • 网站制作优化排名怎么开发自己的小程序