青牛主题列表_海汼部落 | IT学习->实战为王

字节码才是机器能识别的代码，机器只认识二进制代码101010010 这种，编程语言是面向人的人开发的时候用的实际机器执行的时候执行的都是二进制字节码就是很接近二进制的编码

1、java自带解决问题1的api 这个不用自己写
2、可以写成循环，每次得到控制台输入执行处理处理完了再等待输入

@darklich 这里有全部视频 http://www.hainiubl.com/topics/37162

HBase 和 Hive 与MySQL、Oracle 最大的区别可能就是处理的数据量不一样了，比如你有TB以下量级的数据可能MySQL、Oracle 可以搞定 TB以上HBase 和 Hive更划算更快
还有一点就是MySQL、Oracle一般适合事务性数据库也就是增删改查比较多的场景，Hive尤其适合数据仓库，进行大量的查询，不支持修改，HBase实时性比较好，增删改都行，对查询支持不是很友好

Hadoop 和 BI 如何结合？搭建一个基于 Hadoop+Hive 的数据仓库，它的前端展现如何实现？如何实现 BI？

Hive—+hadoop本身就是标准的离线bi系统，不太清楚你说的结合是什么意思，前端展现一般都是自己开发，根据公司的业务需求自己开发

Linux 服务器日志统计有什么比较好的工具或开源软件？

简单的需求flume 就可以要是想做的复杂一些可以考虑Elasticsearch、Logstash、Kibana三件套企业中一般用后者比较多

HDFS+Hive 能干什么？

HDFS主要是数据存储你可以理解为硬盘，Hive是计算框架你们应该学过数据库查询语言把 hive就可以理解为sql

日志采集系统 flume 和 kafka 有什么区别及联系，它们分别在什么时候使用，什么时候又可以结合？

区别主要是场景不同，他们都可以做日志收集的工作，flume是一个集中式的方法，就是把多个机器的日志收集到一个节点，
kafka通过消息传递日志，这两个方案在企业中都很常用，一般为了不让日志产生堆积，flume收集完了，用kafka发到指定hdfs是比较好的选择

Hadoop，Hive，Kafka，Flume，Hbase，Spark 等是部署在一个集群上面吗？

依据数据和计算尽量靠近的考虑
Hadoop，Hive，Spark 一般在一个集群中其他的随意

Flume 为什么在 HDP 技术栈中被移除，有什么替代的框架吗？

Flume一般都是收集系统日志用，替代的框架也有可以自己手写一个服务，或是脚本也行把多台机器的日志发送到一个集中存储的地方