简单的需求flume 就可以 要是想做的复杂一些 可以考虑Elasticsearch、Logstash、Kibana三件套 企业中一般用后者比较多
- Linux 服务器日志统计有什么比较好的工具或开源软件?
- HDFS+Hive 能干什么?
- 日志采集系统 flume 和 kafka 有什么区别及联系,它们分别在什么时候使用,什么时候又可以结合?
- Hadoop,Hive,Kafka,Flume,Hbase,Spark 等 是部署在一个集群上面吗?
- Flume 为什么在 HDP 技术栈中被移除,有什么替代的框架吗?
- Spark/Tez 这些并行计算框架为何不用有环图做执行计划?
- Golang 运行时占用的内存非常少,为什么没能在大数据领域里对常常 OOM 的 Java 发起冲击?
- zookeeper 在 kafka 中扮演着什么角色?
- Redis 和 zookeeper 有什么联系吗?
- ZooKeeper 可以作为分布式存储系统么?
-
信息被删除或无权限查看
- 数据挖掘时,当正负样本不均,代码如何实现改变正负样本权重?
- Spark 如何获得当前 alive 节点的个数?
- 为什么 Spark 比 MapReduce 快?
- HDFS 中元数据和数据为什么要分离?