当前位置: 首页 > news >正文

签约做网站模板大连企业网站模板建站

签约做网站模板,大连企业网站模板建站,北京值得去的互联网公司,南京 百度 网站建设Hive 内部表和外部表的区别 外部表在创建时需要加关键字 external#xff1b;创建内部表时#xff0c;会将数据移动到数据仓库指定的路径#xff1b;创建外部表时#xff0c;不会移动数据#xff0c;只会记录数据所在的路径#xff1b;删除内部表时#xff0c;会删除元…Hive 内部表和外部表的区别 外部表在创建时需要加关键字 external创建内部表时会将数据移动到数据仓库指定的路径创建外部表时不会移动数据只会记录数据所在的路径删除内部表时会删除元数据和数据本身删除外部表时仅仅删除元数据不会删除数据本身 Hive cluster by、sort by、distribute by、order by 的区别 order by 全局排序只有一个 reduce 数据量很大时会比较慢sort by 局部排序只保证每个 reduce 中的数据有序不能保证全局有序distribute by 控制 map 结果分发相同值会被分发到同一个 map cluster by 根据指定字段将数据分组每组内再根据该字段正序排序只能正序cluster by distribute by sort by Hive 分区和分桶的区别 分区是将 Hive 表数据分离为多个目录分桶是将对应的数据文件分解为若干个部分分区的字段必须是表中没有的字段分桶的字段必须是表中已经存在的字段 Hive Union 和 Union all 的区别 union 将多个结果合并为一个对结果去重并排序union all 将多个结果合并为一个不对结果去重不排序 Hive join 的原理 在 Map 阶段将 on 的字段设为 key 然后将选择的字段作为 value 在 Reduce 阶段相同 key 值的数据分发到同一个 Reducer Hive 如何优化 join 操作 若有大量 null key 则先过滤或者随机赋值所是大小表 join 可使用 MapJoin 若两张大表 join可将倾斜的 key 过滤出来单独 join则会分不到多个 task 进行 join 操作最后在进行 union 操作 Hive 的三种自定义函数及区别 UDF 用户自定义函数一对一输出例如 roundUDTF 用户自定义表生产函数一对多输出例如 explodeUDAF 用户自定义聚合函数多对一输出例如countsum 等 Hive 数据倾斜 什么是数据倾斜 数据倾斜是指在分布式处理中数据不均匀有部分数据比较集中数据倾斜会使得在处理过程中某个结点的处理效率过低甚至造成内存溢出 造成数据倾斜的原因 业务本身造成的建表时考虑不周导致 key 分布不均匀某些 SQL 操作容易造成数据倾斜 造成数据倾斜的主要操作 group by 维度过少某些值比较大分发到不同 Reduce 操作造成某个 Reduce 数据倾斜 join 某些 key 值比较多或者 key 值存在大量 null join 后分发到某个 Reduce 的数据量过大 数据倾斜的解决方法 group by 造成的数据倾斜 分组中有部分数据比较多造成数据倾斜。这种情况可以通过调参解决 set hive.map.aggrtrue set hive.groupby.skewindatatrue;hive.map.aggrtrue 表示开启 map 端聚合hive.groupby.skewindatatrue 表示有数据倾斜时进行负载均衡这会使得生成两个 MR job第一个 job 会将数据随机分发到不同的 Reduce 进行聚合可以达到负载均衡的效果结果传入第二个 MR job 根据预处理的数据结果按照 group by key 进行分发处理包获赠相同的 key 分到同一个 Reduce 中完成聚合 join 造成的数据倾斜 有大量 null 值 join 的情况 数据中有大量 null 值可以过滤掉使用随机值赋值 大小表 join 的情况 可以使用 map join 将小表加载到内存中并在 map 阶段完成 join 操作 例如 select /*MAPJOIN(b)*/ a.a1,a.a2,b.b2 from tablea a JOIN tableb b ON a.a1b.b1 --其中b 为小表key 值倾斜的情况 可以将倾斜的 key 过滤出来单独 join 则会分散到多个 task 进行 join’ 操作最后再进行 union 即可
http://www.hkea.cn/news/14548318/

相关文章:

  • 做白酒用哪个分类信息网站个人网站免费建设
  • 青岛高端模板建站wordpress传媒传媒企业模板
  • 北京个人网站制作联通的网站是谁做的
  • 肇庆住房建设部网站东莞常平常安医院
  • 网站模板广告去除网站简介模板
  • 自己建设外贸网站如何用ftp上传文件到网站
  • 网站建设 事业单位 安全期货网站做模拟
  • 免费网站系统西数网站管理助手 伪静态
  • 企业做网站的注意什么问题苏州建设有限公司
  • 青岛做网站建设价格低线下推广渠道
  • 旅游网站源码 wordpress模板 v1.0杭州网站优化服务
  • 免费制作公司网站莱芜交友论坛
  • 网站开发要什么软件工控界面设计
  • 网站怎么做图片网站运营阶段
  • 学做网站的视频摘抄一小段新闻
  • 网站做1920px好吗微信公众号设计网站
  • 哪里建设企业网站网站未授权cas要怎么做
  • 深圳网站建设加q5299丶14602推广做网站的 需要续费维护费吗
  • 免费查企业电话网站免费建站的网站哪个好
  • 佛山网站策划哪家专业seo智能优化系统
  • 城建中心官网查询证书网站搜索优化价格
  • 大同网站建设哪家好网站建设与管理实践收获
  • 万网网站备案证书仙居制作网站
  • 网站目标规划wordpress 转载 插件
  • 影响网站alexa排名的主要因素有wordpress奇客影院
  • 平面设计类的网站蓝色机械营销型网站
  • 类似织梦的建站cms知名品牌策划设计公司
  • 什么网站做一手项目好网站商城html模板
  • 有域名怎样做网站网站部署 模板
  • 安徽国贸网站建设网站开发是什么专业百度