java 代码修改 reduce 个数

问答 闭关修炼中 ⋅ 于 2017-07-05 18:31:59 ⋅ 最后回复由 青牛 2017-07-07 00:19:21 ⋅ 4484 阅读

file

通过java代码修改reduce个数,如上图所示,通过 System.out.println(job.getNumReduceTasks()); 显示出来的也是 2 个reduce,但是输出目录下面只有一个输出文件,如下图所示。

file

回复数量: 4
  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2017-07-06 01:02:32

    数据太少了?

  • BigDataSince2017
    2017-07-06 09:17:14

    @青牛 感谢青牛老师的回答,我想应该不是数据太少,我加了1000多个整数在input文件里。

    工作环境:在CentOS7桌面,使用Intellij IDEA集成开发环境,使用项目管理工具Maven添加依赖。hadoop是 伪分布部署。

    我在网上查到有人说是需要在集群部署才可以使用多个reduce,不知对不对?

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2017-07-06 12:38:34

    @BigDataSince2017 本地模式也可以生成多个文件的

  • 青牛 国内首批大数据从业者,就职于金山,担任大数据团队核心研发工程师
    2017-07-07 00:19:21

    @BigDataSince2017 本地模式的reduce也可以设置多个,只不过是多个线程,不像集群是多个进程。所以也可以生成多个文件,建议去看一下我分享的教程

暂无评论~~
  • 请注意单词拼写,以及中英文排版,参考此页
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`, 更多语法请见这里 Markdown 语法
  • 支持表情,可用Emoji的自动补全, 在输入的时候只需要 ":" 就可以自动提示了 :metal: :point_right: 表情列表 :star: :sparkles:
  • 上传图片, 支持拖拽和剪切板黏贴上传, 格式限制 - jpg, png, gif,教程
  • 发布框支持本地存储功能,会在内容变更时保存,「提交」按钮点击时清空
Ctrl+Enter