当前位置: 首页 > news >正文

山东手机版建站系统信息社区网站源码

山东手机版建站系统信息,社区网站源码,网站资料上传教程,php大型网站开发视频教程一、目的 对于Flume的复制和多路复用拓扑结构#xff0c;进行一个小的开发测试 二、复制和多路复用拓扑结构 #xff08;一#xff09;结构含义 Flume 支持将事件流向一个或者多个目的地。 #xff08;二#xff09;结构特征 这种模式可以将相同数据复制到多个channe…一、目的 对于Flume的复制和多路复用拓扑结构进行一个小的开发测试 二、复制和多路复用拓扑结构 一结构含义 Flume 支持将事件流向一个或者多个目的地。 二结构特征 这种模式可以将相同数据复制到多个channel 中或者将不同数据分发到不同的 channel 中sink 可以选择传送到不同的目的地 三、需求案例 一案例需求 使用 Flume-1 监控文件变动Flume-1 将变动内容传递给 Flume-2Flume-2 负责存储到 HDFS。同时 Flume-1 将变动内容传递给 Flume-3Flume-3 负责输出到 LocalFileSystem。 二需求分析 四、前期准备 一安装好Hadoop、Hive、Flume等工具 二查看Hive的日志在Linux系统中的文件路径 [roothurys23 conf]# find / -name hive.log /home/log/hive312/hive.log 三在HDFS中创建文件夹flume2即Hive日志写入的HDFS文件 四在/opt/flume目录下创建 flume3 文件夹 [roothurys23 ~]# cd /opt/flume/[roothurys23 flume]# mkdir flume3 [roothurys23 flume]# ll 总用量 0 drwxr-xr-x 2 root root   6 12月 12 14:41 flume3 drwxr-xr-x 3 root root 102 12月  5 16:08 upload 五、创建flume的任务文件 一创建任务文件1     flume-file-flume.conf 配置1个接收日志文件的source和两个channel、两个sink分别输送给 flume-flume-hdfs 和 flume-flume-dir。 [roothurys23 conf]# vi flume-file-flume.conf # Name the components on this agent a1.sources r1 a1.sinks k1 k2 a1.channels c1 c2 # 将数据流复制给所有 channel a1.sources.r1.selector.type replicating # Describe/configure the source a1.sources.r1.type execa1.sources.r1.command tail -F /home/log/hive312/hive.log a1.sources.r1.shell /bin/bash -c # Describe the sink # sink 端的 avro 是一个数据发送者 a1.sinks.k1.type avroa1.sinks.k1.hostname hurys23 a1.sinks.k1.port 4141 a1.sinks.k2.type avroa1.sinks.k2.hostname hurys23 a1.sinks.k2.port 4142 # Describe the channel a1.channels.c1.type memory a1.channels.c1.capacity 1000 a1.channels.c1.transactionCapacity 100 a1.channels.c2.type memory a1.channels.c2.capacity 1000 a1.channels.c2.transactionCapacity 100 # Bind the source and sink to the channel a1.sources.r1.channels c1 c2 a1.sinks.k1.channel c1 a1.sinks.k2.channel c2 注意 1、配置文件中的各项参数需要调式这里只是为了演示实现目的、打通路径即可实际在项目中操作时需要调试参数。 2、a1.sources.r1.command tail -F /home/log/hive312/hive.log         为hive.log在Linux中的路径 3、a1.sinks.k1.hostname hurys23                                                     hurys23 为服务器名字 二创建任务文件2       flume-flume-hdfs.conf 配置上级 Flume 输出的 Source输出是到 HDFS 的 Sink。 [roothurys23 conf]# vi flume-flume-hdfs.conf # Name the components on this agent a2.sources r1 a2.sinks k1 a2.channels c1 # Describe/configure the source # source 端的 avro 是一个数据接收服务 a2.sources.r1.type avroa2.sources.r1.bind hurys23 a2.sources.r1.port 4141 # Describe the sink a2.sinks.k1.type hdfsa2.sinks.k1.hdfs.path hdfs://hurys23:8020/flume2/%Y%m%d/%H #上传文件的前缀 a2.sinks.k1.hdfs.filePrefix flume2- #是否按照时间滚动文件夹 a2.sinks.k1.hdfs.round true #多少时间单位创建一个新的文件夹 a2.sinks.k1.hdfs.roundValue 1 #重新定义时间单位 a2.sinks.k1.hdfs.roundUnit hour #是否使用本地时间戳 a2.sinks.k1.hdfs.useLocalTimeStamp true #积攒多少个 Event 才 flush 到 HDFS 一次 a2.sinks.k1.hdfs.batchSize 100 #设置文件类型可支持压缩 a2.sinks.k1.hdfs.fileType DataStream #多久生成一个新的文件 a2.sinks.k1.hdfs.rollInterval 30 #设置每个文件的滚动大小大概是 128M a2.sinks.k1.hdfs.rollSize 134217700 #文件的滚动与 Event 数量无关 a2.sinks.k1.hdfs.rollCount 0 # Describe the channel a2.channels.c1.type memory a2.channels.c1.capacity 1000 a2.channels.c1.transactionCapacity 100 # Bind the source and sink to the channel a2.sources.r1.channels c1 a2.sinks.k1.channel c1 注意 1、a2.sinks.k1.hdfs.path hdfs://hurys23:8020/flume2/%Y%m%d/%H    为写入的HDFS文件路径 2、a2.sources.r1.bind hurys23                                                                hurys23 为服务器名字 三创建任务文件3       flume-flume-dir.conf 配置上级 Flume 输出的 Source输出是到本地目录的 Sink。 [roothurys23 conf]# vi flume-flume-dir.conf # Name the components on this agent a3.sources r1 a3.sinks k1 a3.channels c2 # Describe/configure the source a3.sources.r1.type avroa3.sources.r1.bind hurys23 a3.sources.r1.port 4142 # Describe the sink a3.sinks.k1.type file_rolla3.sinks.k1.sink.directory /opt/flume/flume3 # Describe the channel a3.channels.c2.type memory a3.channels.c2.capacity 1000 a3.channels.c2.transactionCapacity 100 # Bind the source and sink to the channel a3.sources.r1.channels c2 a3.sinks.k1.channel c2 注意 1、a3.sources.r1.bind hurys23                                        hurys23 为服务器名字 2、a3.sinks.k1.sink.directory /opt/flume/flume3               在Linux中的本地路径 3、/opt/flume/flume3    这个输出的本地目录必须是已经存在的目录如果该目录不存在并不会自动创建新的目录 六、分别启动Flume任务文件 一首先启动   a3    flume-flume-dir.conf [roothurys23 flume190]# bin/flume-ng agent -n a3  -f /usr/local/hurys/dc_env/flume/flume190/conf/flume-flume-dir.conf 二其次启动   a2    flume-flume-hdfs.conf [roothurys23 flume190]# bin/flume-ng agent -n a2  -f /usr/local/hurys/dc_env/flume/flume190/conf/flume-flume-hdfs.conf 三最后启动   a1    flume-file-flume.conf [roothurys23 flume190]# bin/flume-ng agent -n a1  -f /usr/local/hurys/dc_env/flume/flume190/conf/flume-file-flume.conf 七、Flume任务运行执行状况 一a1  a1任务运行截图 采集hive的log日志文件发送给flume2、flume3 二a2   写入的HDFS文件状况 根据时间戳自动生成20231212文件夹、15文件夹及其flume2-文件 三a3  写入的Linux本地文件状况 在Linux的 /opt/flume/flume3目录下自动生成相关文件 [roothurys23 flume3]# ll 总用量 188 -rw-r--r-- 1 root root      0 12月 12 15:07 1702364829999-1 -rw-r--r-- 1 root root   1922 12月 12 15:07 1702364829999-2 -rw-r--r-- 1 root root 163250 12月 12 15:08 1702364829999-3 -rw-r--r-- 1 root root  23162 12月 12 15:08 1702364829999-4 -rw-r--r-- 1 root root      0 12月 12 15:09 1702364829999-5 Flume复制和多路复用拓扑结构的开发案例测试成功简单来看a1是sourcea2、a3是sink 这种结构其实也挺常见的就先到这里Flume玩法还真挺多的
http://www.hkea.cn/news/14301442/

相关文章:

  • 网站空间续费多钱一年电商设计是做什么的工作
  • 基于python的网站开发百度手机网站生成
  • 企业网站html源代码效果图网址大全
  • 河北常见网站建设价格wordpress回复查看
  • 建设厅网站查询新浪短网址链接
  • 学校怎么创建网站宁波seo行业公司推荐
  • 怎么制作微信购物网站湖南seo优化价格
  • 户户通行业网站广州白云区哪里封了
  • 接单网站开发哪个网站可以做兼职ppt
  • tp5企业网站开发视频湖北今天发生的重大新闻
  • 江苏省工程建设标准网站济阳做网站多少钱
  • 杭州seo整站优化7天酒店网站建设优势
  • 培训如何优化网站广州 网站建设网络推广网页设计
  • 艺术设计类网站网站工程和网络工程有什么区别
  • 做钓鱼网站犯法吗网络建设需求
  • 网站能带来什么php网站 更改logo
  • 哈尔滨专业网站建设公司汕头第一网e京网
  • 上海千途网站建设网站加速器
  • 做平面设计都在那个网站找免费素材?梧州单身相亲网站
  • 直播型网站开发标书制作公司网站
  • 源码买卖网站网页设计基本流程
  • 网站建设内容方向广州建设交易中心官网
  • 怎样做视频网站的外链深圳建站模板
  • 南京便宜网站建设江门网站制作报价
  • 网站建设美化中期报告企业建设网站的资金策划
  • 怎么样用ppt做网站如何建设企业微网站
  • 企业网站页面设计广州工作室做网站
  • 杭seo网站建设排名百度投流
  • 搜索网站排行榜建设三库一平台
  • 设计网站首页1市场营销专业课程