当前位置: 首页 > news >正文

如何诊断网站seo做标书需要用到哪些网站查资料

如何诊断网站seo,做标书需要用到哪些网站查资料,大型网站订单系统怎么设计,软件开发工具的基础我们都知道Spark是弹性分布式数据集#xff0c;数据会存储在多台机器上#xff0c;那么如何确保在分布式数据计算中#xff0c;数据不丢失就是其中的关键的部分。本文主要讲解一下Spark中的容错机制。 Spark 主要提供了3个层面的数据容错机制。分别是 调度层#xff0c;RDD…         我们都知道Spark是弹性分布式数据集数据会存储在多台机器上那么如何确保在分布式数据计算中数据不丢失就是其中的关键的部分。本文主要讲解一下Spark中的容错机制。 Spark 主要提供了3个层面的数据容错机制。分别是 调度层RDD血统层, Checkpoint 层。在这3大层面中包括Spark RDD容错的4大核心要点. (调度层)Stage输出失败上层调度器DAGScheduler重试。(调度层)Spark计算中Task内部任务失败底层调度器重试。(血统层)RDD Lineage血统中窄依赖宽依赖计算。(Checkpoint层)Checkpoint 缓存。 调度层 DAG生成层 Stage 输出失败上层调度器DAGScheduler 会进行重试 详细源码详见 Spark大数据商业实战三部曲p58 Task计算层 Spark计算过程中计算内部某个Task任务出现失败底层调度器会对此Task进行若干次重试默认4次 详细源码详见 Spark大数据商业实战三部曲p58 血统层 SparkRDD 实现基于Lineage的容错机制基于RDD的各项transformation 构成compute chain, 在部分计算结果丢失的时候可以根据Lineage重新恢复计算。 窄依赖  在子RDD的分区丢失需要重算父RDD分区时。父RDD相应分区的所有数据都是子RDD分区的数据并不存在冗余计算。 宽依赖 丢失一个RDD分区重算的每个父RDD的每个分区的所有数据并不是都丢给丢失的RDD的子RDD分区用的会有一部分数据相当于对应的是未丢失的子RDD分区中需要的数据这样就会产生冗余计算开销和巨大的性能浪费。 Checkpoint层 Spark checkpoint 通过将RDD写入Disk作为检查点是Spark lineage容错的辅助lineage过长会造成容错成本过高这时在中间阶段做检查点容错如果之后有节点出现问题而丢失分区从做检查点的RDD开始重做Lineage, 就会减少开销。 checkpoint 主要适用于以下两种情况 DAG中的Lineage过长如果重算开销太大如PageRank, ALS等尤其适合于在宽依赖上作checkpoint,这个时候就可以避免为Lineage重新计算而带来的冗余计算。
http://www.hkea.cn/news/14370524/

相关文章:

  • 回收手表的网站衡阳sem优化
  • 网站存在的缺陷云南软件开发公司
  • 网站媒体作风建设年工作总结兰州市城关区建设局网站
  • 广东省备建设项目影响备案网站烟台网站建设的方法有哪些
  • 百度建网站多少钱wordpress插件 地图
  • 专业的佛山网站建设价格建筑工程 网络图
  • 福州建站免费模板制作宣传片视频
  • 建设部网站投诉如何注册网站建设费用:做个网站要多少钱?
  • 贵阳查房子备案的网站免费的crm软件
  • 东莞网站如何制作新能源汽车价格表2021
  • seo体系网站的建设及优化网站 例
  • 云平台网站叫什么wordpress建站多用户
  • 佛山网站建设计简单好看个人主页网站模板
  • 做 爱 网站小视频服装线上结合线下的推广方案
  • 做网站机构wordpress关闭文章摘要
  • WordPress做的网站源代码wordpress ip 跳转
  • 二级网站的建设长春seo网站排名
  • 如何做x响应式网站上海注销公司需要什么资料和流程
  • 名师工作室网站建设 意义wordpress导入演示
  • 淘宝搜索框去什么网站做如何扁平化设计网站
  • 外贸网站如何推广上海市云企业有限公司
  • 烟台网站设计公司推荐中国空间站现在有几个人
  • 低成本门户网站开发有哪些网站是用php做的
  • 怎么用视频做网站首页医院网站源码下载
  • php网站开发参考文献wordpress开发插件
  • 宜昌做网站要什么条件网站开发系统架构图
  • vps主机上新增网站泰安最好的网站建设公司
  • 做二手房网站wordpress问答社区主题
  • 杭州好的做网站公司wordpress图片主题免费下载
  • 在线名片制作网站开发设计网络