当前位置: 首页 > news >正文

大网站设计seo与网络推广的区别和联系

大网站设计,seo与网络推广的区别和联系,asp网站域名授权,worldpress英文网站建设背景:Flink数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,Flink之间以orc格式写入到hive 问题:单表日800亿数据量,产生过多的小文件,影响Impala查询 解决:对hive小文件进行合并, ALTER TABLE lt_ipsy_xdr_temp PARTITION (day20230829, hour9,type…

背景:Flink数据写入到stage层,然后再入ods层,中间导致hive数据实时性不强,随后做优化,Flink之间以orc格式写入到hive

问题:单表日800亿数据量,产生过多的小文件,影响Impala查询

解决:对hive小文件进行合并,

ALTER TABLE lt_ipsy_xdr_temp PARTITION (day=20230829, hour=9,type=4) CONCATENATE;

目前大数据平台hdfs数据存储情况:

数据仓库中的表:
1.stg层是把flink应用程序写入的数据load进入的;
2.ods层表名称中包含ai的表是从mysql导入的; 
/_SCRATCH0 这些目录是sqoop 把mysql数据导入hive时生成的临时目录,可以删除。
3.stg 和 ods 的 tb_bu_dc_monitor_day 是外部表,其他层的表都是内部表;
4.stg层是原始数据,没有经过压缩处理,ods及以后其他各层都是orc格式
 

使用hive concatenate (外部表不可用,内部表可用,orc可用,分桶表不可用)
使用方式:

#1.设置文件最小大小(需要设置,否则合并操作可能会不理想):
SET mapreduce.input.fileinputformat.split.maxsize=256
#对于非分区表
alter table A concatenate;
#2.对于分区表
ALTER TABLE lt_ipsy_xdr_temp PARTITION (day=20230829, hour=9,type=4) CONCATENATE;

因为分桶表不适用,所以可以采用覆写的方式

INSERT OVERWRITE TABLE table 

PARTITION (day=20230908,hour=9,datatype=4)
SELECT 
a,b,c,d,e
FROM table 
where day=20230908 and hour=9 and datatype=4;

http://www.khdw.cn/news/48525.html

相关文章:

  • 举例行业门户网站网络营销专业大学排名
  • 怎么通过所有的网站推广广告海外营销
  • 网站访问量数据百度权重4网站值多少钱
  • 网站用静态域名解析最新seo操作
  • 专门做奢侈品的网站有哪些口碑营销名词解释
  • 自己做网站有哪些方法呢网络营销推广机构
  • 网站开发费用计入科目什么是网络营销?
  • 提供网站建设制作seo有哪些经典的案例
  • 做网站付款方式登录百度app
  • 全能网站建设百度总部客服电话
  • 宁波网站建设方案报价超级seo工具
  • 做阿里巴巴网站多少钱百度入口提交
  • 大学生做网站怎么赚钱属于网络营销特点的是
  • 网站建设胶州家园网络营销推广培训机构
  • 网站外包如何报价竞价推广怎么做
  • 成立公司需要什么条件seo搜索引擎优化试题
  • 网站建设推广邮件优化教程网站推广排名
  • 大兴网站建设公司谷歌seo是指什么意思
  • 柳州做网站哪家好seo咨询服务
  • 新乡做企业网站的公司seo精灵
  • 网站同时做竞价和优化可以网址查询域名
  • 如何看客户网站开发客户企业做推广有用吗
  • 展示产品的网站 个人备案还是企业买域名要多少钱一个
  • 厦门u 网站建设网站免费制作
  • 沈阳市网站设计公司大全百度搜索指数排行榜
  • wordpress伪装插件sem优化是什么
  • 金融网站建设方案ppt模板seo如何快速排名
  • 橙云网站建设竞价推广和信息流推广
  • 丽江市住房与城乡建设局网站全球疫情最新数据统计
  • 深鑫辉网站建设品牌宣传方式