海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

449 关注者
2251 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2251)
  • 请问 1T 左右的数量 用 MapReduce 跑 job 数设置为多少合适呢?

    设置了reduce为20就是有20个patient分区。数据不倾斜并且集群资源允许的情况设置越多的reducer数越快

  • hbase 插入数据一直卡住的问题?

    @DDDH 试试

    file

  • hbase 数据插入 阻塞 入库数据入不进去?

    使用批量put试试

  • 请问 1T 左右的数量 用 MapReduce 跑 job 数设置为多少合适呢?

    @ling775000 你说的是一个大任务分成几部小任务去跑吗?

  • hbase 插入数据一直卡住的问题?

    超时了,ZK的timeout时间设置长点

  • 用 sparkstreaming 消费kafka的数据,怎么将数据写入到hdfs的输入流,采用追加的方式写入?

    追加写入那就每个partation写不同的文件

  • kafka 启动消费者, 一直报这个,请问是个怎么情况,怎么解决?如图

    图没有啊

  • spark 通过 Phoenix 读取 hbase 数据的问题?

    用maven构建的项目吗?

  • 请问 1T 左右的数量 用 MapReduce 跑 job 数设置为多少合适呢?

    reducer数是吗?这个看你干什么了,如果shuffle数据是均匀的那20个就够,如果不均匀多少个都没用

  • shell 脚本?

    features和train.name是变量吗?

  • oraceln 能在数据库里面查到数据但是无法获取元数据?

    了解的账号权限有问题不?

  • 大数据平台开发是不是 java 后台也要搞呢?

    报表工具、数据产出工具,还有那些后台管理系统,权限系统限制数据访问什么的,搞什么不都得有个后台系统吗

  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • «
  • 1
  • 2
  • ...
  • 125
  • 126
  • 127
  • 128
  • 129
  • 130
  • 131
  • ...
  • 145
  • 146
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2