海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

449 关注者
2251 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2251)
  • impala 中 cast 函数进行数据类型的转换导致结果错误?

    可能是java浮点数计算的问题

  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • spark 中用 hiveContext.sql 对 hive 版本有要求吗?

    有啊

  • oracle sql 提数?

    行转列呗?

  • 信息被删除或无权限查看
  • spark2.1.0 兼容 hive1.1.0 吗?

    这个你得自己编译spark了。编译spark时指定hive版本为1.1

  • 请问如何设置 kafka 的偏移量,采用 DStream 时没设置偏移量,每次启动从新消费,存在重复消费?

    @歌唱祖国 checkpoint可以保存这个offset,或都你自己找个地记下来,下次启动的时候当参数传进去。你工作咋这么积极那?过完年就开工了?

  • spark 大量数据读写问题?

    @ruiqi 是的,但是你要重弄表了,把region分多点,然后改成手动分region

  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • 请问如何设置 kafka 的偏移量,采用 DStream 时没设置偏移量,每次启动从新消费,存在重复消费?
    val value: ConsumerStrategy[String,String] = ConsumerStrategies.Subscribe(topicSet,kafkaParams,offset)
    val lines: InputDStream[ConsumerRecord[String, String]] = KafkaUtils.createDirectStream(streamingContext,LocationStrategies.PreferConsistent,value)
    
  • 请问如何设置 kafka 的偏移量,采用 DStream 时没设置偏移量,每次启动从新消费,存在重复消费?

    你说的是创建之前设置offset吗?

  • spark 大量数据读写问题?

    @ruiqi 程序猿都是夜猫子

  • spark 大量数据读写问题?

    @ruiqi 你们要是没做过优化的话,绝对不会是1S的。那个页面是没等你看到GC时间变长,regionserver就挂了

  • «
  • 1
  • 2
  • ...
  • 123
  • 124
  • 125
  • 126
  • 127
  • 128
  • 129
  • ...
  • 145
  • 146
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2