当前位置: 首页 > news >正文

网站建设的条件分析爱站关键词

网站建设的条件分析,爱站关键词,高校移动门户网站建设,wordpress注册收不到邮件目录前言优化策略推荐使用group by代替distinct去重前言 优化策略 推荐使用group by代替distinct去重 参考: hive中groupby和distinct区别以及性能比较 - cnblogs数据倾斜之count(distinct) - cnblogs 重要结论: 两者都会在map阶段count&#xff0c…

目录

  • 前言
  • 优化策略
    • 推荐使用group by代替distinct去重

前言

优化策略

推荐使用group by代替distinct去重

参考:

  • hive中groupby和distinct区别以及性能比较 - cnblogs
  • 数据倾斜之count(distinct) - cnblogs

重要结论: 两者都会在map阶段count,但reduce阶段,distinct只有一个, group by 可以有多个进行并行聚合,所以group by会快。

distinct 只生成一个reducer任务,所有的id都聚集到同一个reducer任务进行去重然后在聚合,非常容易造成数据倾斜。distinct耗费内存,可能产生OOM,但效率高。
group by 将数据分组到了多个reducer上进行处理,所以较快。groupby排序消耗时间更多,在时间复杂度允许下,空间复杂度更低。

例子:
在一个具有5,563,985,064个记录的hive表中,对其中的两个字段进行查询,耗时如下:

-- 耗时00:11:17
select col1,col2
from 库名xxx.表名xxx
where ds=20230224
group by col1,col2;-- 耗时00:25:07
select distinct col1,col2
from 库名xxx.表名xxx where ds=20230224;

【其他优化策略待更新】

http://www.khdw.cn/news/19469.html

相关文章:

  • 有域名和空间怎么做网站湖北seo服务
  • 网站设计源代码广州白云区今天的消息
  • 滕州建网站中国十大营销策划机构
  • 织梦网站301跳转怎么做网络营销服务平台
  • axure网站整站优化推广方案
  • 企业网站建设的征求意见哪里有免费的网站推广软件
  • 福州网站建设公司哪家好网络推广的具体方式
  • 温州营销网站制作联系电话好的seo公司营销网
  • 怎么查看网站是否做百度排名网络营销企业网站优化
  • 如何用手机建设一个网站站长工具综合查询系统
  • 潍坊网站制作网络科技搜索引擎优化的流程
  • 怎么做点图片连接网站企业邮箱如何申请注册
  • 百度网页打不开其他网页都能打开百度搜索关键词排名人工优化
  • 通辽网站建设百度竞价推广代理
  • 灵璧做网站公司友链价格
  • 怎么做一款网站长沙百度首页排名
  • 有哪些网站设计比较好的公司如何制作百度网页
  • 工作室网站制作中央下令全国各地核酸检测
  • 做网站宣传图片必应搜索引擎网址
  • wordpress z西安seo网站关键词
  • 沈阳网站制作公司哪家好百度知道免费提问
  • 政府网站旅游栏目建设适合发表个人文章的平台
  • 网站怎么做排名朋友圈软文
  • 网站管理模板百度学术论文查重免费
  • 网站开发学什么语言好百度官网认证
  • 17一起广州做网站重庆疫情最新情况
  • 上海建筑建材业网站迁移uc推广登录入口
  • 网站的备案流程宁波外贸网站推广优化
  • 冒用他人公司做网站网络产品运营与推广
  • 做设计_素材网站有哪网络营销做得好的公司