海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

447 关注者
2249 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2249)
  • JavaDStream 转为 JavaRDD?

    一般是这样处理
    javaDstream.foreachRDD(new VoidFunction<JavaRDD>() {
    public void call(JavaRDD o) throws Exception {
    System.out.println("自定义的处理逻辑");
    }
    });

  • JavaDStream 转为 JavaRDD?

    转不了,dstream里面包含了rdd,只能通过dstream的foreachRDD方法访问rdd

  • sparksql 读取 kafka 报错?

    Windows的问题很多都是权限问题不是代码问题 建议你在linux系统上调试一下

  • spark jobserver 需要另外安装的吗,该怎么安装,它的作用是什么?

    spark-jobserver提供了一个用于提交和管理Apache Spark作业(job)、jar文件和作业上下文(SparkContext)的RESTful接口,
    是一个与spark项目本地独立的额外的项目,你可以理解为很多spark的管理和配置都可以用api的方式进行使用

  • 信息被删除或无权限查看
  • 测试工具 TeraSort 如何支持可压缩??

    TeraSort的输出是正确的吗

  • cdh 集群 python3 用 pyhive 操作 hive,请问如何能够实现呢?

    hive.server2.authentication=CUSTOM

  • cdh 集群 python3 用 pyhive 操作 hive,请问如何能够实现呢?

    hive配置中增加hive.server2.authentication = NOSASL
    建立Connection(host="myserver", auth='NOSASL')

  • Python3 操作 hive,pip 安装 sasl 失败,已经安装 gcc,请问如何能够完成第三方库的安装?

    联网环境下# yum install python-pip gcc gcc-c++ python-virtualenv cyrus-sasl-devel

  • 信息被删除或无权限查看
  • 为什么 mapreduce 压缩失效?

    SequenceFileOutputFormat.setOutputCompressionType(job, SequenceFile.CompressionType.BLOCK);
    试试

  • 执行命令 yum install -y gcc gcc-c++ pcre-devel zlib-devel 出现如下错误?求大佬解决

    最终目的是为了装c++吗 还是装python的包?

  • hive 查询经过压缩后有 100GB 的.gz 格式的文件数据,使用 select * from 能够查询出来,为何不能做计算?

    @歌唱祖国 去具体计算节点上看一下yarn的日志

  • storm topology 作业的监控和告警,有什么好的方案?

    一般的方法是检查上游数据是否有积压,还有是看storm进程在不在

  • spark Dataset.createTempView 作用是什么?

    createTempView是个逻辑概念,你可以理解为一个视图,这个视图可以屏蔽底层具体的sql语句,注册了以后直接操作datas就相当于直接执行sql了

  • «
  • 1
  • 2
  • ...
  • 104
  • 105
  • 106
  • 107
  • 108
  • 109
  • 110
  • ...
  • 145
  • 146
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2