当前位置: 首页 > news >正文

网站开发 视频存在哪网站的seo 如何优化

网站开发 视频存在哪,网站的seo 如何优化,做ar网站,微信电脑版官方下载查找满足指定条件的app_id查询条件: 表名、时间、节点名时间限定: 最好适当放大, 不知道什么原因有点不准eventLog的存放路径: spark.history.fs.logDirectory 1. spark-sql 先限定时间段;数据是逐行读入的, 但 app_id要按整个文件过滤, 按每个条件打标;按app_id粒度聚合, 查…
  1. 查找满足指定条件的app_id
  2. 查询条件: 表名、时间、节点名
  3. 时间限定: 最好适当放大, 不知道什么原因有点不准
  4. eventLog的存放路径: spark.history.fs.logDirectory

1. spark-sql 

  • 先限定时间段;
  • 数据是逐行读入的, 但 app_id要按整个文件过滤, 按每个条件打标;
  • 按app_id粒度聚合, 查找符合条件的数据;
-- 设定时区
set spark.sql.session.timeZone=GMT+8;-- 创建数据源视图
create temporary view view_name using text options ('path'='hdfs://hdfs-cluster/spark-history/*', 'modifiedAfter'='2023-08-21T08:00:00', 'modifiedBefore'='2023-08-21T14:00:00' );with tmp as ( -- 打标数据selectinput_file_name() as file_name,if( value like '%tbl_name%', 1, 0) as table_name,if( value like '%core-1-7%', 1, 0) as host_01,if( value like '%core-1-10%', 1, 0) as host_02fromview_name
),
tmp2 as ( -- 汇总到app_id粒度selectfile_name,sum(table_name) as table_name,sum(host_01) as host_01,sum(host_02) as host_02fromtmpgroup byfile_name
)
select*
fromtmp2
wheretable_name > 0
order byfile_name
;

2. 整文件读取

  • 先初步过滤app_id;
  • 整个文件读取成一行;
  • 按条件进行过滤;
import spark.implicits._// 寻找可能的APP_ID
val sql_create_view ="""|create temporary view view_name using text options ('path'='hdfs://hdfs-cluster/spark-history/*', 'modifiedAfter'='2023-08-21T00:00:00', 'modifiedBefore'='2023-08-21T23:00:00' )|""".stripMargin
val sql_filter_app_id ="""|select|   split( input_file_name(), 'history/')[1]  as file_name|from|    view_name|where|    value like '%trandw.dwd_log_app_open_di%'|group by|    split( input_file_name(), 'history/')[1]|""".stripMargin
spark.sql(sql_create_view)
val df_app_ids = spark.sql(sql_filter_app_id)
val app_ids = df_app_ids.collect().map(_.getString(0)).mkString(",")// 整个文件读取成一行
val rdd = spark.sparkContext.wholeTextFiles(s"hdfs://hdfs-cluster/spark-history/{${app_ids}}",20).repartition(12)
val df = rdd.toDF("file_name", "value")
df.createOrReplaceTempView("tmp")// 过滤数据
val sql_str ="""|select|   file_name|from|    tmp|where|    value like '%tbl_name%'|    and value like '%core-1-7%'|    and  value like '%core-1-10%'|""".stripMarginspark.sql(sql_str).show(1)

http://www.khdw.cn/news/32419.html

相关文章:

  • aspnet动态网页设计搜狗seo查询
  • 找南昌网站开发公司电话国外b站浏览器
  • 软慧网站建设宣传推广的十种方式
  • hyperapp wordpress佛山优化推广
  • 做3d效果的网站网络营销的50种方法
  • 上海网站开发公司2023年6月疫情情况
  • 信誉好的大良网站建设百度入口官网
  • 两岸统一最新消息网站推广优化排名
  • 中国煤炭建设协会网站qcseo优化快速排名
  • 慈利县建设局网站广州推动优化防控措施落地
  • 网站开发用什么字体营销推广平台
  • 怎样做卡盟网站aso优化师主要是干嘛的
  • wordpress 建企业网站电商卖货平台有哪些
  • 设计专业知名企业网站semen
  • 那个网站专门做幽默视频的seo优化前景
  • 华人汇和科技园建设有限公司网站百度怎么做自己的网页
  • 怎么做提高网站排名国内最近发生的重大新闻
  • 网站前置审批办理流程百度云服务器官网
  • 聊城网站建设信息宣传推广
  • 全国政府网站建设排名网站seo优化多少钱
  • 企业网站域名注册查询搜索引擎培训班
  • 自媒体多平台发布工具免费seo网站推荐一下
  • 我贷款网站如何做西安网站优化培训
  • 网络推广方案下拉管家xiala11成都市seo网站公司
  • 网站做伪静态潍坊百度seo公司
  • 北京 科技网站建设强力搜索引擎
  • 网站建设很简单深圳公司网络推广该怎么做
  • 泉州app网站开发做seo要投入什么
  • wordpress自定义右键优化培训学校
  • 帝国cms做淘宝客网站线上营销推广渠道