当前位置: 首页 > news >正文

专注于网站营销服务哔哩哔哩网站

专注于网站营销服务,哔哩哔哩网站,网站维护工作方案,网站的建设服务一、目的 经过6个月的奋斗#xff0c;项目的离线数仓部分终于可以上线了#xff0c;因此整理一下离线数仓的整个流程#xff0c;既是大家提供一个案例经验#xff0c;也是对自己近半年的工作进行一个总结。 二、数仓实施步骤 #xff08;五#xff09;步骤五、在Hive的…一、目的 经过6个月的奋斗项目的离线数仓部分终于可以上线了因此整理一下离线数仓的整个流程既是大家提供一个案例经验也是对自己近半年的工作进行一个总结。 二、数仓实施步骤 五步骤五、在Hive的DWS层建动态分区表并动态加载数据 1、Hive的DWS层建库建表语句 --如果不存在则创建hurys_dc_dws数据库 create database if not exists hurys_dc_dws; --使用hurys_dc_dws数据库 use hurys_dc_dws; --1.1、转向比数据内部表——动态分区——转向流量——5分钟周期  dws_turnratio_volume_5min create  table  if not exists dws_turnratio_volume_5min(     device_no       string       comment 设备编号,     create_time     timestamp    comment 创建时间,     start_time      timestamp    comment 开始时间,     name            string       comment 场景,     direction       string       comment 雷达朝向,     volume_sum      int          comment 指定时间段内通过路口的车辆总数,     volume_left     int          comment 指定时间段内通过路口的左转车辆总数,     volume_straight int          comment 指定时间段内通过路口的直行车辆总数,     volume_right    int          comment 指定时间段内通过路口的右转车辆总数,     volume_turn     int          comment 指定时间段内通过路口的掉头车辆总数 ) comment 转向比数据表——动态分区——5分钟周期 partitioned by (day string)   --分区字段不能是表中已经存在的数据可以将分区字段看作表的伪列。 stored as orc                --表存储数据格式为orc ; 2、海豚执行DWS层建表语句工作流 对于刚部署的服务器由于Hive没有建库建表、而且手动建表效率低因此通过海豚调度器直接执行建库建表的.sql文件 1海豚的资源中心加建库建表的SQL文件 2海豚配置DWS层建表语句的工作流不需要定时一次就行 3、海豚配置DWS层每日动态加载数据的工作流指定分区名 1海豚配置DWS层每日动态加载数据的工作流需要定时每日一次 #! /bin/bash source /etc/profile nowdatedate --date0 days ago %Y%m%d yesdatedate -d yesterday %Y-%m-%d hive -e use hurys_dc_dws; set hive.exec.dynamic.partitiontrue; set hive.exec.dynamic.partition.modenonstrict; set hive.exec.max.dynamic.partitions.pernode1000; set hive.exec.max.dynamic.partitions1500; insert  overwrite  table  dws_evaluation_1hour  partition(day$yesdate) select        dwd_ev.device_no,        lane_no,        cycle,        create_time,        concat(substr(create_time, 1, 14), 00:00) start_time,        dwd_te.name,        dwd_rc.direction,        dwd_rl.lane_direction,        dwd_ev.volume,        queue_len_max,        sample_num,        stop_avg,        delay_avg,        stop_rate,        travel_dist,        travel_time_avg from hurys_dc_dwd.dwd_evaluation as dwd_ev     right join hurys_dc_dwd.dwd_radar_lane as dwd_rl               on dwd_rl.device_nodwd_ev.device_no and dwd_rl.lane_numdwd_ev.lane_no     right join hurys_dc_dwd.dwd_device_team as dwd_dt               on dwd_dt.device_nodwd_ev.device_no     right join hurys_dc_dwd.dwd_team as dwd_te               on dwd_te.id dwd_dt.team_id     right join hurys_dc_dwd.dwd_radar_config as dwd_rc              on dwd_rc.device_nodwd_ev.device_no where dwd_ev.create_time is not null  and day $yesdate group by dwd_ev.device_no, lane_no, cycle, create_time, dwd_te.name, dwd_rc.direction, dwd_rl.lane_direction, dwd_ev.volume, queue_len_max, sample_num, stop_avg, delay_avg, stop_rate, travel_dist, travel_time_avg 2工作流定时任务设置注意与其他工作流的时间间隔 3注意点 3.3.1 动态加载数据的SQL需要指定分区名day$yesdate只加载前一天的数据 剩余数仓部分待续
http://www.hkea.cn/news/14333733/

相关文章:

  • 建筑毕业设计代做网站简单网站的制作
  • 多用户商城网站建设方案国外手机主题网站
  • 云南澄江县建设局网站南宁网络推广软件
  • 东仓建设网站宁夏银川网站建设
  • 排名轻松seo 网站医院网站开发公司
  • 免费门户网站模板下载视频剪辑课程
  • 做网站需要准备的东西腾讯企业邮箱app下载
  • 上海网站建设的档案网站建设论文
  • 网站建设空间杭州app开发公司普悦科技
  • 网站建设 学习 长沙wordpress如何生成单页的网站地图
  • wordpress仿seowhy基础指南模板关键词优化的最佳方法
  • 重庆网站设计制作案例邯郸购物网站建设
  • 赣州网站建设信息免费个人网站建设
  • 江苏优化网站公司做网站是不是要拍法人的照片
  • 工程咨询公司加盟合作小璇seo优化网站
  • 注册域名后怎么做网站六盘水市城乡建设局网站
  • 三合一企业网站模板东营最新公告今天
  • 旅游网站建设和实现wordpress下拉菜单的阴影怎么改
  • 网站做成app需要多少钱网页制作素材代码
  • 企业网站 报价徐州网络公司排名
  • 网站后台分模块做网站如何用代码把字体变大
  • 图书网站开发介绍wordpress 4.8漏洞
  • 备案网站建设承诺书有多少做汽车的网站
  • 优设网网站设计评价客户关系管理系统功能
  • 成都大学网站建设特色建设银行网站上交医保
  • 网站初期建设的成本来源禅城教育网站建站
  • 美食网站首页模板建设部特种作业证网站查询
  • 中国建设银行网站运营模式培训总结
  • 阿里云网站建设方案书中山市网站建设demo
  • 太平洋建设集团招标网站做网站的公司主要工作是什么