海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

451 关注者
2256 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2256)
  • Java 为什么解释执行时不直接解释源码?

    字节码才是机器能识别的代码,机器只认识二进制代码101010010 这种,编程语言是面向人的 人开发的时候用的 实际机器执行的时候执行的都是二进制 字节码就是很接近二进制的编码

  • junit 如何测试有 scanner 等待控制台输入的程序?

    1、java自带解决问题1的api 这个不用自己写
    2、可以写成循环,每次得到控制台输入执行处理 处理完了再等待输入

  • 海牛 Hadoop 系列教程(一):服务器基础环境

    @darklich 这里有全部视频 http://www.hainiubl.com/topics/37162

  • HBase 和 Hive 的差别是什么,各自适用在什么场景中?

    HBase 和 Hive 与MySQL、Oracle 最大的区别可能就是处理的数据量不一样了,比如你有TB以下量级的数据可能MySQL、Oracle 可以搞定 TB以上HBase 和 Hive更划算 更快
    还有一点就是MySQL、Oracle一般适合事务性数据库也就是增删改查比较多的场景,Hive尤其适合数据仓库,进行大量的查询,不支持修改,HBase实时性比较好,增删改都行,对查询支持不是很友好

  • Hadoop 和 BI 如何结合?搭建一个基于 Hadoop+Hive 的数据仓库,它的前端展现如何实现?如何实现 BI?

    Hive—+hadoop本身就是标准的离线bi系统,不太清楚你说的结合是什么意思,前端展现一般都是自己开发,根据公司的业务需求自己开发

  • Linux 服务器日志统计有什么比较好的工具或开源软件?

    简单的需求flume 就可以 要是想做的复杂一些 可以考虑Elasticsearch、Logstash、Kibana三件套 企业中一般用后者比较多

  • HDFS+Hive 能干什么?

    HDFS主要是数据存储 你可以理解为硬盘,Hive是计算框架 你们应该学过数据库查询语言把 hive就可以理解为sql

  • 日志采集系统 flume 和 kafka 有什么区别及联系,它们分别在什么时候使用,什么时候又可以结合?

    区别主要是场景不同,他们都可以做日志收集的工作,flume是一个集中式的方法,就是把多个机器的日志收集到一个节点,
    kafka通过消息传递日志,这两个方案在企业中都很常用,一般为了不让日志产生堆积,flume收集完了,用kafka发到指定hdfs是比较好的选择

  • Hadoop,Hive,Kafka,Flume,Hbase,Spark 等 是部署在一个集群上面吗?

    依据数据和计算尽量靠近的考虑
    Hadoop,Hive,Spark 一般在一个集群中 其他的随意

  • Flume 为什么在 HDP 技术栈中被移除,有什么替代的框架吗?

    Flume一般都是收集系统日志用,替代的框架也有 可以自己手写一个服务,或是脚本也行 把多台机器的日志发送到一个集中存储的地方

  • Spark/Tez 这些并行计算框架为何不用有环图做执行计划?

    从你提这个问题看来你还是不明白什么是迭代计算,spark支持迭代计算也就是你说的循环,但是循环操作未必要用有环图来表示和执行

  • Golang 运行时占用的内存非常少,为什么没能在大数据领域里对常常 OOM 的 Java 发起冲击?

    Java的基础广泛,适合不同机器不同环境 大数据背景下用java编写分布式框架OOM其实只能对少数机器产生影响,况且现在机器的内存成本不高 所以内存已经不能限制一个语言的发展了

  • zookeeper 在 kafka 中扮演着什么角色?

    kafka有多台机器的话 可能有一台会挂点 不止kafka 很多分布式存储和计算的系统 都会有节点挂掉,那怎么样知道哪个节点挂了 并找出新的可以胜任已经挂掉的节点的工作的节点呢 这就是zookeeper要解决的问题

  • Redis 和 zookeeper 有什么联系吗?

    没啥联系啊 一个是存储 一个是分布式管理

  • ZooKeeper 可以作为分布式存储系统么?

    能做分布式存储 但是不能存大量数据 因为zk的能做分布式的前提其实是读取数据的时间非常快 如果做存储 读取时间变慢 整个分布式协调就会出错

  • «
  • 1
  • 2
  • ...
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • ...
  • 146
  • 147
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2