当前位置: 首页 > news >正文

小区服务网站怎么做咸阳做网站排名

小区服务网站怎么做,咸阳做网站排名,专门做海产品的网站,新东方在线教育平台官网在实际使用Datax的时候#xff0c;比较常用的是同步业务数据#xff08;mysql中的数据#xff09;到HDFS来实现数仓的创建#xff0c;那么怎么实现呢#xff1f;我们一步步来实现#xff08;基于Datax 3.0.0#xff09; 1、检查环境#xff0c;需要安装完一个Datax比较常用的是同步业务数据mysql中的数据到HDFS来实现数仓的创建那么怎么实现呢我们一步步来实现基于Datax 3.0.0 1、检查环境需要安装完一个Datax一个mysql安装hadoop以及hive 2、在mysql中创建源表并在原表中插入数据我们的目标是把源表的mysql数据同步到HDFS中我们当前测试表如下 源数据库test 源表结构 CREATE TABLE test (   id bigint(20) NOT NULL AUTO_INCREMENT,   name varchar(100) DEFAULT NULL,   score decimal(10,0) DEFAULT NULL,   update_time datetime NOT NULL,   PRIMARY KEY (id) ) ENGINEInnoDB AUTO_INCREMENT3 DEFAULT CHARSETutf8 插入数据如下 3、在datax同步之前需要在hive上创建数据库和表否则会报错创建语句如下注意分隔符用\001用来避免数据中含有分隔符ORC是最后存储hive的格式我们创建表的时候也要是ORC格式目前datax插入HDFS只支持用户配置为text或orc。 create database test CREATE TABLE IF NOT EXISTS test.test(id int comment 主键,name string comment 名称, score double comment fen , update_time string comment time) COMMENT Employee details  ROW FORMAT DELIMITED FIELDS TERMINATED BY \001 LINES TERMINATED BY \n STORED AS ORC ; 4、我们在安装Datax的服务器上创建json文件我们文件创建在/opt/datax/job目录下开发者可自定义保存文件路径 vim mysql2hdfs.json 文件内容如下需要修改的或者重要的已标红大家直接修改即可 {     job: {         content: [             {                 reader: {                     name: mysqlreader,                     parameter: {                         username: root,                         password: root,                         connection: [                             {                                 querySql: [                                     select id,name,score,update_time from test;                                 ],                                 jdbcUrl: [                                     jdbc:mysql://node01:3306/datax                                 ]                             }                         ]                     }                 },                 writer: {                     name: hdfswriter,                     parameter: {                         column: [                             {                                 name: id,                                 type: bigint                             },                             {                                 name: name,                                 type: string                             },                             {                                 name: score,                                 type: double                             },                             {                                 name: update_time,                                 type: string                             }                         ],                         defaultFS: hdfs://node01:8020,                         fieldDelimiter: ,,                         fileName: test,                         fileType: orc,                         path: /user/hive/warehouse/test.db/test,                         writeMode: append                     }                 }             }         ],         setting: {             speed: {                 channel: 1             }         }     } }   注意类型如下 标红解释如下 jdbcUrl数据库的jdbcurl链接 usernamemysql用户名 passwordmysql用户登陆密码 querySqlmysqlreader中的参数用作自定义sql根据sql的灵活编写实现数据的增量、全量、特定列数据的同步注意需要sql和mysqlwriter中的column字段数量、名称、类型需要对应上 defaultFSHadoop hdfs文件系统namenode节点地址。格式hdfs://ip:端口例如hdfs://127.0.0.1:9000 fieldDelimiterhdfswriter写入时的字段分隔符 fileName:HdfsWriter写入时的文件名实际执行时会在该文件名后添加随机的后缀作为每个线程写入实际文件名fileType:文件的类型目前只支持用户配置为text或orcpath:存储到Hadoop hdfs文件系统的路径信息HdfsWriter会根据并发配置在Path目录下写入多个文件。为与hive表关联请填写hive表在hdfs上的存储路径。例Hive上设置的数据仓库的存储路径为/user/hive/warehouse/ 已建立数据库test表hello则对应的存储路径为/user/hive/warehouse/test.db/hellowriteMode:hdfswriter写入前数据清理处理模式有以下3种          1 append写入前不做任何处理DataX hdfswriter直接使用filename写入并保证文件名不冲突。          2nonConflict如果目录下有fileName前缀的文件直接报错。          3truncate如果目录下有fileName前缀的文件先删除后写入。 5、执行Datax首先去到Datax的bin目录然后执行 python /opt/datax/bin/datax.py /opt/datax/job/mysql2hdfs.json 6、看到如下则证明执行成功 7、在hive种查询数据
http://www.hkea.cn/news/14404933/

相关文章:

  • 深圳建设局网站首页阿里云服务器网站建设
  • 网站做一个多少钱招聘网最新招聘信息网
  • linux建站和wordpress广州数商云
  • 网站优化潍坊目前网站是做响应式的好吗
  • 如何查看网站服务器类型win10优化大师
  • 海丰县建设局网站广东网页制作推广
  • 服装网站建设环境分析深圳国内网站建设
  • 动漫网站怎么做好玩的页游
  • 青岛贸易公司 网站制作网页制作简单
  • 百度做商务网站多少钱黄页88网站关键词怎么做
  • 做网站建设一年能赚多少钱浏览器打开网站404
  • 徐州网站建设公司官网蓝色风格企业网站模板
  • 园区网互联及网站建设昭通网站建设兼职
  • 微网站预约网站开发在线医疗网站建设
  • 如何挖掘和布局网站关键词网站建设的费用记什么科目
  • 宿松做网站宝安中心区房价
  • 在线医疗网站建设为什么网站关键词没有排名
  • 找外包公司做网站的好处和坏处google广告在wordpress
  • 大英县住房和城乡建设局网站企业网络维护
  • 房地产网站建设招商网站程序0day
  • 房地产网站系统湛江建站程序
  • 建设一个网站需要哪些方面的开支网站设计版权
  • 网站登录验证码显示不出来绵阳 网站设计
  • 企业网站建设需注意点济南建站培训
  • 制作网站培训学校建设银行官方网站登
  • 如何建立属于自己的网站WordPress资讯网站
  • 西安百度网站快速优化中国500强企业
  • 对网站建设课程的心得体会谷歌浏览器下载安装2022最新版
  • 虚拟网站鸿扬家装
  • 网站地图样式佛山seo外包平台