当前位置: 首页 > news >正文

信息平台网站建设网络营销推广方法是什么和什么的合理利用

信息平台网站建设,网络营销推广方法是什么和什么的合理利用,网站开发 实时更新,如何下载wordpress插件之前的版本背景 目前spark的repartition()方法是随机分配数据到下游#xff0c;这会导致一个问题#xff0c;有时候如果我们用repartition方法的时候#xff0c;如果任务发生了重试#xff0c;就有可能导致任务的数据不准确#xff0c;那这个时候改怎么解决这个问题呢#xff1f; …背景 目前spark的repartition()方法是随机分配数据到下游这会导致一个问题有时候如果我们用repartition方法的时候如果任务发生了重试就有可能导致任务的数据不准确那这个时候改怎么解决这个问题呢 分析 在Spark RDD中存在着名为outputDeterministicLevel的变量如下 private[spark] final lazy val outputDeterministicLevel: DeterministicLevel.Value {if (isReliablyCheckpointed) {DeterministicLevel.DETERMINATE} else {getOutputDeterministicLevel}}那么该变量的作用是什么呢让我们分析一下 改变量最终会被Stage的isIndeterminate方法调用 def isIndeterminate: Boolean {rdd.outputDeterministicLevel DeterministicLevel.INDETERMINATE}而该方法会被DAGScheduler调用有两处地方会被调用 submitMissingTasks中调用 private def submitMissingTasks(stage: Stage, jobId: Int): Unit {logDebug(submitMissingTasks( stage ))// Before find missing partition, do the intermediate state clean work first.// The operation here can make sure for the partially completed intermediate stage,// findMissingPartitions() returns all partitions every time.stage match {case sms: ShuffleMapStage if stage.isIndeterminate !sms.isAvailable mapOutputTracker.unregisterAllMapOutput(sms.shuffleDep.shuffleId)case _ } 该方法主要用于在重新提交失败的stage时候用来判断是否需要重新计算上游的所有任务。 handleTaskCompletion中调用 case FetchFailed(bmAddress, shuffleId, _, mapIndex, _, failureMessage) 。。。val noResubmitEnqueued !failedStages.contains(failedStage)failedStages failedStagefailedStages mapStageif (noResubmitEnqueued) {// If the map stage is INDETERMINATE, which means the map tasks may return// different result when re-try, we need to re-try all the tasks of the failed// stage and its succeeding stages, because the input data will be changed after the// map tasks are re-tried.// Note that, if map stage is UNORDERED, we are fine. The shuffle partitioner is// guaranteed to be determinate, so the input data of the reducers will not change// even if the map tasks are re-tried.if (mapStage.isIndeterminate) {这里如果任务Fetch失败了根据该shuffle所对应的上游stage是不是isIndeterminate来向DAGScheduler提交ResubmitFailedStages事件从而调用submitMissingTasks方法进行上游所有任务或者单个任务的重试。 再回到outputDeterministicLevel变量该变量会调用getOutputDeterministicLevel方法进行循环调用上游的outputDeterministicLevel变量来确定outputDeterministicLevel的值。 结论 所以根据以上分析我们可以改写对应的RDD的outputDeterministicLevel变量或者getOutputDeterministicLevel方法来进行stage任务的全部重试与否
http://www.hkea.cn/news/14334644/

相关文章:

  • 软件推荐网站网站建设需求分析文档
  • 网页设计制作音乐网站学校网站建设有限公司
  • 做网站公司名字应该用图片吗做yield网站多少钱
  • 网站与域名广州有什么好玩的地方免费的
  • 科技未来网站建设唐山seo代理商
  • dw网站制作模板旅行社网站建设需求分析
  • 广西南宁网站排名优化app商城软件
  • 网站开发图书管理系统惠阳建设局网站
  • 网站建设的三要素公司注册查重名
  • 大连网站设计选仟亿科技装修公司做网销的网站
  • 免费稳定网站空间小网站搜什么关键词好
  • 怎么做网站账号注册机长沙网络优化推广
  • 杭州网站开发建设广告公司名字后缀
  • 网站制作多少钱啊广西桂林为什么穷
  • 织梦网站代码优化的意思
  • 网站建设的案例教程视频北京建站公司做网站价格
  • 一键提交网站html5电商网页制作
  • 国外网站建设品牌青岛建设集团
  • logo设计网站在线58.搜房等网站怎么做效果才好
  • 网站收录登录入口忻州网站建设公司
  • 网站死链检测中国企业网官方网站
  • 学网站开发工作好找吗做儿童文学有哪些的网站
  • 网站页面布局的目的南阳做网站推广
  • 上海专业做网站公司有哪些广告公司寮步网站建设
  • vr网站建设企业宣传文案
  • 阳山做网站做众筹网站怎么赚钱
  • 辽宁省建设工程注册中心网站全网营销包括什么
  • 天津做网站价格新开传奇网站服
  • 加拿大28网站开发百度排行榜风云榜小说
  • 无锡网站建设 app中山cms建站