- spark 底层是 rdd,flink 底层是怎样的数据结构来维护运算?
- flink 消费 kafka,保证数据不丢失且只消费一次语义,也要像 sparkstreaming 一样手动管理 offset 吗?
- 请问 flume client 是一定要有的角色吗?
- threadlocal 和线程局部变量区别是什么?
- 请问 Linux 里全选的快捷键是什么呢?
- 请问如何去理解 MPP 架构呢?
- 请问 BI 开发工程师是做什么的?
- 毕业两年,在深圳做大数据开发能拿多少呢?
- 能讲讲数据仓库建模是什么个概念吗?他具体作用体现在哪儿?
- 请问现在找大数据工作用啥软件呢?
- 请问 Scala 里面 mapValues (""+_+""),这个 (""+_+"") 是什么意思呢?
- 请问 impala 计算方式不走 mr、rdd ,那他怎么个分布式并行计算的呢?
- 大数据开发和大数据分析有什么区别呢?
- impala 不用 mr 底层用执行计划树 请问这个执行计划树怎么去理解呢?
- 请问时间复杂度这个怎么去通俗易懂的去理解呢?