当前位置: 首页 > news >正文

捕鱼网站怎么做网站开发一个人可以完成吗

捕鱼网站怎么做,网站开发一个人可以完成吗,免费设计房屋装修软件,新开传奇网站曾劲松一.MapReduce 1.1定义#xff1a;是一个分布式运算程序的编程框架 1.2核心功能#xff1a;将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序#xff0c;并发运行在一个Hadoop集群上。 1.3优点 1#xff09;易于编程 它简单的实现一些接口#…一.MapReduce 1.1定义是一个分布式运算程序的编程框架 1.2核心功能将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序并发运行在一个Hadoop集群上。 1.3优点 1易于编程 它简单的实现一些接口就可以完成一个分布式程序这个分布式程序可以分布到大量廉价的PC机器上运行正是因为这个特点使MapReduce编程变得非常流行 2良好扩展性 可以通过简单地增加机器来扩展它的计算能力。 3高容错性 MapReduce设计的初衷就是使程序能够部署在廉价的PC机器上这就要求它具有很高的容错性。比如其中一台机器挂了它可以把上面的计算任务转移到另外一个节点上运行不至于这个任务运行失败而且这个过程不需要人工参与而完全是由Hadoop内部完成的。 4适合PB级以上海量数据地离线处理 可以实现上千台服务器集群并发工作提供数据处理能力。 1.4缺点 1不擅长实时计算 无法像MySQL一样在毫秒或者秒级内返回结果 2不擅长流式计算 流式计算的输入数据是动态的而MapReduce的输入数据集是静态的不能动态变化。这是因为MapReduce自身的设计特点决定了数据源必须是静态的。 3不擅长有向无环图计算 每个MapReduce作业的输出结果都会写入到磁盘会造成大量的磁盘IO导致性能非常的低下。 1.5MapReduce核心思想 1分布式的运算程序往往需要分成至少2个阶段。 2第一个阶段的MapTask并发实例完全并行运行互不相干。 3第二个阶段的ReduceTask并发实例互不相干但是他们的数据依赖于上一个阶段的所有MapTask并发实例的输出。 4MapReduce编程模型只能包含一个Map阶段和一个Reduce阶段如果用户的业务逻辑非常复杂那就只能多个MapReduce程序串行运行。 总结分析WordCount数据流走向深入理解MapReduce核心思想。 1.6 MapReduce进程 一个完整的MapReduce程序在分布式运行时有三类实例进程 1MrAppMaster负责整个程序的过程调度及状态协调。 2MapTask负责Map阶段的整个数据处理流程。 3ReduceTask负责Reduce阶段的整个数据处理流程。 1.7常用数据反序列类型 1.8 编程规范 编写程序可分为Mapper、Reducer和Driver三部分。 Mapper阶段 1自定义的Mapper要继承自己的父类 2Mapper的业务逻辑写在map方法中 3Mapper的输入、输出数据是K-V对的形式 4map方法Map Task进程对每一个k-V调用一次 Reducer阶段 1自定义的Reduce要继承自己的父类 2业务逻辑写在reduce方法中 3Reduce的输入数据类型对应Mapper的输出数据类型 4ReduceTask进程对每一组相同k的k,v组调用一次reduce()方法 Driver阶段 相当于YARN集群的客户端用于提交我们整个程序到YARN集群提交的是封装了MapReduce程序相关运行参数的job对象。 二、Hadoop序列化 2.1 序列化和反序列化 序列化就是把内存中的对象转换成字节序列或其他数据传输协议以便于存储到磁盘持久化和网络传输。  反序列化就是将收到字节序列或其他数据传输协议或者是磁盘的持久化数据转换成内存中的对象。 2.2为何不使用Java的序列化 Java的序列化是一个重量级序列化框架Serializable一个对象被序列化后会附带很多额外的信息各种校验信息Header继承体系等不便于在网络中高效传输。 2.3 Hadoop序列化的特点 1紧凑高效使用存储空间 2快速读写数据的额外开销小 3互操作支持多语言的交互 2.4 实现bean对象序列化 1必须实现Writable接口FlowBean继承Writable接口 2反序列化时需要反射调用空参构造函数所以必须有空参构造 public FlowBean() { super(); } 3重写序列化方法 Override public void write(DataOutput out) throws IOException { out.writeLong(upFlow); out.writeLong(downFlow); out.writeLong(sumFlow); } 4重写反序列化方法 Override public void readFields(DataInput in) throws IOException { upFlow in.readLong(); downFlow in.readLong(); sumFlow in.readLong(); } 5反序列化的顺序和序列化的顺序相同 6要想把结果显示在文件中需要重写toString()可用\t分开方便后续用。 7如果需要将自定义的bean放在key中传输则还需要实现Comparable接口因为MapReduce框中的Shuffle过程要求对key必须能排序。 Override public int compareTo(FlowBean o) { //设置从大到小排序 return this.sumFlow o.getSumFlow() ? -1 : 1; } 3.InputFormat数据输入 3.1 MapTask并行度决定机制 数据块Block是HDFS物理上把数据分成一块一块。数据块是HDFS存储数据单位。 数据切片数据切片只是在逻辑上对输入进行分片并不会在磁盘上将其切分成片进行存储。数据切片是MapReduce程序计算输入数据的单位一个切片会对应启动一个MapTask。
http://www.hkea.cn/news/14272322/

相关文章:

  • 学校资源网站建设目标工作单位
  • 动漫做暧视频在线观看网站网络规划设计师和系统架构师哪个好考
  • 贾汪网站开发php建站模板
  • 长沙网站se0推广优化公司国外浏览器搜索引擎入口
  • 网站开发需要懂哪些wordpress中文文档
  • 东营网站建设公司 网络易东营市建设项目工伤保险是哪个网站
  • 网站seo整站优化网络组网方案
  • 奢侈品电商网站首页设计陕西建设网官网登录入口
  • 网站开发人员工具种类w7自己做网站
  • 深圳建设厅网站首页网上商店建设前准备
  • 南浔建设网站百度制作的wordpress工具
  • 企业网站建设的文章怎么搜索整个网站内容
  • 网站建设公司包括哪些内容建设论坛网站用什么cms
  • 网站方案讲解技巧网页美工兼职
  • 怎么把在微企点做响应式网站网站建设的重要性与价值
  • 青岛如何做网站seowordpress 标签特效
  • 设计网站推荐 zoo我想网
  • 软件服务网站设计费如何做分录wordpress自动排版的编辑器
  • 东莞建设网官方网站首页wordpress男同
  • 湖北网站建设公司哪家好关键词优化seo公司
  • 旅社网站建设手机网站可以做英文版本吗
  • 公司网站建设计划阳明拍卖公司网站
  • 商丘网站制作的流程吉林省住房建设安厅网站
  • 环保设计院的网站建设建网站提供下载
  • 哪个网站做头像比较好开发公司项目下半年计划
  • 前端学习网站建设教程微信嵌入网站开发
  • 电子商务网站建设的知识点制作网站的公司
  • 手表网站欧米茄报价网站建设实训教程
  • 新建网站seo优化怎么做电子商务网站后台模板
  • 建设银行招标网站中煤矿山建设集团网站