海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

449 关注者
2251 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2251)
  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • sparksqlselect.join.group 是会对应生成什么样的 rdd.再划分 stage 的?

    select 对应map
    join对应union intersection 或join
    group对应groupByKey

  • spark-phoenix 一直出现一个 bug?

    这个不是异常 源码中是logger.info出来的信息 不是bug

  • scan 查出来的 row 是 rowkey 吗?

    这个还真看不出来

  • spark 读取 MongoDB,进行计算,MongoDB 游标超时如何解决?

    除了你说的两种方法,还有两种方法
    1、 find() 时传入 timeout=False 来禁用 10 分钟超时
    2、find(match).batchSize(10000) 设置每次查出来一个batchSize 保证这个batchSize的数据spark 10分钟能处理完 这样spark就会在10分钟内继续连接db而不会超时了

  • 求 spark 大神帮忙看下,用 scala 操作 dataframe 转 rdd 的时候,row 对象的取值问题?

    row.getAsRow.getAsString

  • Hive 为什么不支持日期格式?

    解决方法很简单 把oracle的日期型转为字符 读到hive中 对应hive的string就好 select的时候把string转为时间

  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • 如何用 PYTHON 在不调用库的情况下实现 ping 命令?

    为啥不调用库?

  • python 查找 dataframe 的目标索引,后利用 For 循环删除行为什么不好使?

    python不允许边迭代边删除这种操作 很多语言都不能这么做

  • 请问我哪俩个地方出问题了?

    童鞋 我实在看不清楚 能不能整个高清图?

  • «
  • 1
  • 2
  • ...
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • ...
  • 145
  • 146
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2