当前位置：首页 > news >正文

外国网站学习做任务升级推广营销网络

news 2026/4/6 12:44:56

外国网站学习做任务升级,推广营销网络,简述网站建设流程,.net做的网站怎么样上一篇文章： 大数据 - Hadoop系列《三》- HDFS（分布式文件系统）概述-CSDN博客目录 12.1 针对MapReduce的设计构思 1. 如何对付大数据处理场景 2. 构建抽象编程模型 3. 统一架构、隐藏底层细节 12.2 分布式计算概念 12.3 MapReduce定义…

上一篇文章：

大数据 - Hadoop系列《三》- HDFS（分布式文件系统）概述-CSDN博客

12.1 针对MapReduce的设计构思

1. 如何对付大数据处理场景

2. 构建抽象编程模型

3. 统一架构、隐藏底层细节

12.2 分布式计算概念

12.3 MapReduce定义

12.4 MR的优点：

1）🥙MapReduce易于编程

2）🥙良好的扩展性

3）🥙高容错性

4）🥙适合海量数据计算（TB/PB)

12.5 MR的缺点

1) 🥙不擅长实时计算

2) 🥙不擅长流式计算

3）🥙不擅长DAG（有向无环图）计算

12.1 针对MapReduce的设计构思

1. 如何对付大数据处理场景

对相互间不具有计算依赖关系的大数据计算任务，实现并行最自然的办法就是采取MapReduce分而治之的策略。
首先Map阶段进行拆分，把大数据拆分成若干份小数据，多个程序同时并行计算产生中间结果；然后是Reduce聚合阶段，通过程序对并行的杰哥进行最终的汇总计算，得出最终的结果。
不可拆分的计算任务或相互间有依赖关系的数据无法进行并行计算。

2. 构建抽象编程模型

MapReduce借鉴了函数式语言中的思想，用Map和Reduce两个函数提供了高层的并行编程抽象模型。
- map:对一组数据元素进行某种重复式的处理。
- reduce:对Map的中间结果进行某种进一步的结果整理。

MapReduce中定义了如下的Map和Reduce两个抽象的编程接口，由用户去编程实现：
- map:(k1;v1)->(k2,v2)
- reduce:(k2;[v2])->(k3,v3)

通过以上两个编程接口，大家可以看出MapReduce处理的数据类型是<key,value>键值对

3. 统一架构、隐藏底层细节

如何提供统一的计算框架，如果没有统一封装底层细节，那么程序员则需要考虑诸如数据存储、划分、分发、结果收集、错误恢复等诸多细节；为此，MapReduce设计并提供了统一的计算框架，为程序员隐藏了绝大多数系统层面的处理细节。
MapReduce最大的亮点在于通过抽象模型和计算框架把需要做什么（what need to do)与具体怎么做（how to do)分开了，为程序员提供了一个抽象和高层的编程接口和框架。
程序员仅需要关心其应用层的具体计算问题，仅需编写少量的处理应用本身计算问题的业务程序代码。
至于如何具体完成这个并行计算任务所相关的诸多系统层细节被隐藏起来，交给计算框架去处理；从分布代码的执行，到大到数千小到单个节点集群的自动调度使用。