当前位置: 首页 > news >正文

网站建设 网站设计做业务员找数据的网站

网站建设 网站设计,做业务员找数据的网站,wordpress里面如何加载百度地图,陈木胜老婆吴君如使用Hadoop MapReduce实现各省学生总分降序排序#xff0c;根据省份分出输出到不同文件 本文将展示如何使用Hadoop MapReduce对一组学生成绩数据进行处理#xff0c;将各省的学生成绩按总分降序排序并按照省份进行分区将结果分别输出到不同的文件中。 数据样例 我们将使用…使用Hadoop MapReduce实现各省学生总分降序排序根据省份分出输出到不同文件 本文将展示如何使用Hadoop MapReduce对一组学生成绩数据进行处理将各省的学生成绩按总分降序排序并按照省份进行分区将结果分别输出到不同的文件中。 数据样例 我们将使用以下格式的数据 实现步骤 我们将通过以下步骤来实现这一目标 **1、Mapper类**解析每一行数据提取省份和总分并输出为键值对。 **2、Reducer类**对每个省份的数据按总分降序排序后输出到相应的文件中。 **3、Partitioner类**确保同一省份的数据被发送到同一个Reducer。 **4、Driver类**配置并运行MapReduce作业。 代码实现 Mapper类 Mapper类将每一行数据解析为省份和总分并输出为键值对键是省份值是总分和学生信息的组合。 package org.example.mapReduce;import java.io.IOException; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper;public class ProvinceScoreMapper extends MapperObject, Text, Text, Text {Overrideprotected void map(Object key, Text value, Context context) throws IOException, InterruptedException {String line value.toString();// Skip the header lineif (line.startsWith(考号)) {return;}String[] fields line.split( );String province fields[11];String totalScore fields[10];context.write(new Text(province), new Text(totalScore , line));} } Reducer类 Reducer类将每个省份的数据按总分降序排序后输出使用MultipleOutputs将每个省的数据写入单独的文件。 package org.example.mapReduce;import java.io.IOException; import java.util.Collections; import java.util.LinkedList; import java.util.List; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapreduce.lib.output.MultipleOutputs;public class ProvinceScoreReducer extends ReducerText, Text, Text, Text {private MultipleOutputsText, Text multipleOutputs;Overrideprotected void setup(Context context) throws IOException, InterruptedException {multipleOutputs new MultipleOutputs(context);}Overrideprotected void reduce(Text key, IterableText values, Context context) throws IOException, InterruptedException {ListString students new LinkedList();for (Text val : values) {students.add(val.toString());}// Sort students by total score in descending orderCollections.sort(students, (a, b) - {int scoreA Integer.parseInt(a.split(,)[0]);int scoreB Integer.parseInt(b.split(,)[0]);return Integer.compare(scoreB, scoreA);});for (String student : students) {String[] parts student.split(,, 2);multipleOutputs.write(new Text(parts[1]), null, key.toString() /part);}}Overrideprotected void cleanup(Context context) throws IOException, InterruptedException {multipleOutputs.close();} } Partitioner类 Partitioner类确保同一省份的数据被发送到同一个Reducer。 package org.example.mapReduce;import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Partitioner;public class ProvincePartitioner extends PartitionerText, Text {Overridepublic int getPartition(Text key, Text value, int numPartitions) {String province key.toString();return (province.hashCode() Integer.MAX_VALUE) % numPartitions;} } Driver类 Driver类配置并运行MapReduce作业。 package org.example.mapReduce;import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; import org.apache.hadoop.mapreduce.lib.output.MultipleOutputs;public class ProvinceScoreSorter {public static void main(String[] args) throws Exception {if (args.length ! 2) {System.err.println(Usage: ProvinceScoreSorter input path output path);System.exit(-1);}Configuration conf new Configuration();Job job Job.getInstance(conf, Province Score Sorter);job.setJarByClass(ProvinceScoreSorter.class);job.setMapperClass(ProvinceScoreMapper.class);job.setPartitionerClass(ProvincePartitioner.class);job.setReducerClass(ProvinceScoreReducer.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(Text.class);FileInputFormat.addInputPath(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));MultipleOutputs.addNamedOutput(job, province, FileOutputFormat.class, Text.class, Text.class);System.exit(job.waitForCompletion(true) ? 0 : 1);} } 运行MapReduce作业 总结 通过以上步骤我们实现了一个Hadoop MapReduce作业来对各省的学生总分进行降序排序并将结果写入不同的文件中。 如有遇到问题可以找小编沟通交流哦。另外小编帮忙辅导大课作业学生毕设等。不限于MapReduce MySQL, pythonjava大数据模型训练等。 hadoop hdfs yarn spark Django flask flink kafka flume datax sqoop seatunnel echart可视化 机器学习等
http://www.hkea.cn/news/14406268/

相关文章:

  • 一个网站建设需求的人员免费推广平台大全
  • 网站开发视频会议插件2022最新引流推广平台
  • 广州网站设计成功柚米科技网上做彩票网站排名
  • 网站视频封面怎么做快递网站制作
  • 禁忌网站有哪些做第三方网站注意什么
  • 网站信息化建设案例asp简单购物网站源码
  • 单页面网站有哪些内容吗营口网站制作
  • 青海省建设银行网站手机可以登录国家开发银行网站吗
  • 专业行业网站开发报价佛山网站优化指导
  • 优质的聊城做网站wordpress繁体版下载
  • 网站使用网络图片做素材 侵权企业推广宣传文案
  • 免费网站整站模板下载网站开发项目经理职责
  • 搭建小程序多少钱宜春seo
  • 会员制网站搭建wordpress怎样做动漫照片下载网站
  • 做婚纱网站的图片大全运城做网站的公司
  • 做平面计设和网站哪个好软文写作
  • 视频网站制作教程视频网站全面详细创建步骤
  • 网站推广的方法枫子wordpress文章中文版
  • wordpress如何建立网站phcms wordpress
  • 263企业邮箱 登陆wordpress优化图片
  • 上饶公司做网站wordpress页面是什么意思
  • 花钱让别人做的网站版权是谁的电子商务网站开发遇到的问题
  • 河北大城县网站建设公司便宜做网站公司
  • 在域名做网站厦门思总建设有限公司网站
  • 遵义网站建设哪家强文章博客媒体网站模板
  • 网站前端浏览器兼容如何做个人网站收款
  • 海南高端网站建设定制淘宝网站建设基本流程图
  • 建设网站需要哪些素材wordpress更换域名图片不显示
  • 抚州建站速建网站wordpress博客无显示
  • 网站模版自适应公司企业邮箱有哪些