青牛

第 12 位会员
注册于 2016-12-24 21:53:20
活跃于 2024-04-02 22:38:12


  • 信息被删除或无权限查看
  • 使用 jdbc 连接 hive 出错 hadoop is not allowed to impersonate hadoop???? at 2018-11-09 09:14:54

    贴一下报错信息把

  • 大数据存储中小文件怎么存储? at 2018-11-08 16:43:45

    @ruiqi 2t 这个数据量的话 还是hdfs比较好 可以考虑把一定量的小数据压缩为一个文件

  • 大数据存储中小文件怎么存储? at 2018-11-07 17:29:13

    看一下FastDFS

  • 信息被删除或无权限查看
  • 信息被删除或无权限查看
  • Elasticsearch 集群异常? at 2018-11-05 15:47:57

    @Xibaibai 可以是读 没毛病 是一台机器上的多个节点部署 还是多台机器部署的 没有具体描述的问题就像“我想知道咋赚钱”一样难回答

  • Elasticsearch 集群异常? at 2018-11-05 08:49:43

    I/O is overloaded 一般是磁盘写队列负载太高了 要看是什么进程 什么节点的写操作量太大 一般的解决思路是先找进程 再找代码

  • spark 加载 opencv 报错? at 2018-11-01 08:55:00

    缺少jar包把
    bytedeco.javacpp-presets" % "opencv" % ("2.4.9-" + javacppVersion) classifier "",
    "org.bytedeco.javacpp-presets" % "opencv" % ("2.4.9-" + javacppVersion) classifier "linux-x86_64",
    "org.bytedeco" % "javacpp" % javacppVersion ,
    "net.imagej" % "ij" % "1.49d"
    这些包都有吗

  • flume 收集的数据是否有序? at 2018-10-31 11:19:42

    1、分布式环境下 flume不提供多点排序功能
    2、flume所在的kafka集群能接收到数据 说明flume端应该没问题
    sources.selector.type=replicating 好像少这个参数配置吧 将同样的数据无差异sink到多个输出端,所以通道是复制模式

  • JavaDStream 转为 JavaRDD? at 2018-10-29 17:40:04

    一般是这样处理
    javaDstream.foreachRDD(new VoidFunction<JavaRDD>() {
    public void call(JavaRDD o) throws Exception {
    System.out.println("自定义的处理逻辑");
    }
    });

  • JavaDStream 转为 JavaRDD? at 2018-10-29 17:38:30

    转不了,dstream里面包含了rdd,只能通过dstream的foreachRDD方法访问rdd

  • sparksql 读取 kafka 报错? at 2018-10-24 13:49:46

    Windows的问题很多都是权限问题不是代码问题 建议你在linux系统上调试一下

  • spark jobserver 需要另外安装的吗,该怎么安装,它的作用是什么? at 2018-10-24 13:48:28

    spark-jobserver提供了一个用于提交和管理Apache Spark作业(job)、jar文件和作业上下文(SparkContext)的RESTful接口,
    是一个与spark项目本地独立的额外的项目,你可以理解为很多spark的管理和配置都可以用api的方式进行使用

  • 信息被删除或无权限查看