当前位置: 首页 > news >正文

能够做一镜到底的网站资源搜索神器

能够做一镜到底的网站,资源搜索神器,公司网站可以自己做,360建筑网真假前言 在跑调度任务时候,有时候子任务需要依赖前置任务的输出,但类似读取 Parquet 或者 Orc 文件时,如果不判断目录是否为空,在输出为空时会报错,所以需要 check 一下,此外Hadoop通常在写入数据时会在目录中…

前言

在跑调度任务时候,有时候子任务需要依赖前置任务的输出,但类似读取 Parquet 或者 Orc 文件时,如果不判断目录是否为空,在输出为空时会报错,所以需要 check 一下,此外Hadoop通常在写入数据时会在目录中生成一个名为_SUCCESS的文件来表示写入操作已成功完成,我们在检测时要排除这个文件

HDFS API 判断

from py4j.java_gateway import java_import
from pyspark.sql import SparkSession# 初始化SparkSession
spark = SparkSession.builder.appName("Example").getOrCreate()# 导入Hadoop FileSystem类
java_import(spark._jvm, 'org.apache.hadoop.fs.Path')
java_import(spark._jvm, 'org.apache.hadoop.fs.FileSystem')# 定义要检查的路径
FEATURE_OUTPUT_PATH = "your_path_here"# 获取Hadoop Configuration
hadoop_conf = spark._jsc.hadoopConfiguration()# 获取FileSystem对象
fs = spark._jvm.FileSystem.get(hadoop_conf)# 检查路径是否存在
path = spark._jvm.Path(FEATURE_OUTPUT_PATH)if fs.exists(path):# 获取目录下所有的文件和子目录status_list = fs.listStatus(path)non_success_files = [file_status.getPath().getName() for file_status in status_list iffile_status.getPath().getName() != "_SUCCESS"]# 检查除_SUCCESS文件外是否还有其他文件if non_success_files:# 读取Parquet文件table = spark.read.format('parquet').option('header', 'true').load(FEATURE_OUTPUT_PATH)else:print("The directory is empty or only contains a _SUCCESS file.")
else:print("The path does not exist.")

本地 Shell 判断

注意这段脚本能使用的前提是,执行的机器上已经安装和配置了 HDFS 的 shell 命令

import subprocessout=subprocess.check_output("hadoop fs -ls /tmp/file.txt",shell=True)out=out.strip()out=out.split("\n")for l in out:if l.endswith(".txt"):print "file exit"else:print "file not exit"
http://www.khdw.cn/news/23269.html

相关文章:

  • 个人网站怎么备案可以做哪些成人零基础学电脑培训班
  • 郑州小程序开发公司排名百度有专做优化的没
  • 提供企业网站建设定制站长工具大全
  • wordpress RSS怎么用网站seo博客
  • 网站开发一般用什么技术seo什么意思简单来说
  • 佛山有那几家做网站淘宝付费推广有几种方式
  • 网站建设及优化重要性百度账号怎么注销
  • 南京制作网站速成班百度灰色关键词代发
  • 济南自助建站系统百度云网盘资源分享网站
  • 网站建设用户调查建站之星官方网站
  • 网站开发的技术支持360竞价推广客服电话
  • 外贸网站如何做推广搜索引擎技术基础
  • 望都网站建设网络服务提供者收集和使用个人信息应当符合的条件有
  • 网站上动画视频怎么做西昌seo快速排名
  • 阿里巴巴怎么做不花钱的网站自有品牌如何推广
  • 四川铁科建设监理有限公司官方网站百度网盘电脑版下载
  • wordpress 标签添加 图标的方法网站seo入门基础教程书籍
  • 营销神器官方网站网络推广有多少种方法
  • 专做定制旅游网站有哪些谷歌收录查询工具
  • 网站全面推广方案seo技术快速网站排名
  • 邢台做网站费用关键词智能调词工具
  • 怎么做优惠卷网站网页设计软件
  • 正规网站设计制作公司2023年8月疫情爆发
  • php网站开发都需要什么软件品牌营销活动策划方案
  • 如何做网站网页免费公司网站建设要多少钱
  • 商业网站模板下载高端网站定制设计
  • 佛山专业的做网站的品牌推广的渠道有哪些
  • php框架做网站营销推广方案怎么写
  • 规划排版网站怎样制作免费网页
  • 服装企业 北京 网站建设北京seoqq群