青牛主题列表_海汼部落 | IT学习->实战为王

创始人

青牛

第 12 位会员

451 关注者

2255 评论

308 话题

WeChat
Website
公司
城市

在 hive 中建模可不可以用一张大表？

可以啊你把经常查的做成一张大表就行了
信息被删除或无权限查看
信息被删除或无权限查看
Java 中的 Collection 为什么设计成接口而非抽象类？

接口是对抽象类更高层次的抽象接口更具有广泛可用性
如何在 spark 中集成 lightGBM，做大批量数据建模？

看一下lightGBM有没有on spark版本的如果是训练的数据一般不会选这么多数据
Hadoop 单机模式搭建和伪分布式搭建的区别主要有哪些？

单机模式在一台单机上运行，没有分布式文件系统，而是直接读写本地操作系统的文件系统。
伪分布模式（也是在一台单机上运行，但用不同的Java进程模仿分布式运行中的各类结点伪分布模式在“单节点集群”上运行Hadoop，其中所有的守护进程都运行在同一台机器上。
信息被删除或无权限查看
hive 中创建外部表时 location 如何指定数个位置？

这个貌似不行你可以同时加载两个位置为两个表然后取判断这两个表哪个表的数据是空
Hadoop 单机模式搭建和伪分布式搭建的区别主要有哪些？

单机模式在一台单机上运行，没有分布式文件系统，而是直接读写本地操作系统的文件系统。
伪分布模式（也是在一台单机上运行，但用不同的Java进程模仿分布式运行中的各类结点伪分布模式在“单节点集群”上运行Hadoop，其中所有的守护进程都运行在同一台机器上。
python colorama 模块不能正常输出颜色怎么解决？
map/reduce 过程，如何用 map/reduce 实现两个数据源的联合统计？

reduce的时候统计就可以了，两个数据源的联合统计也是需要合在一起统计
多 hive 表关联成一张大表，表的大小差距比较大，如何提效？

具体情形是什么样的？什么场景多少数据为什么多个关联
Pycharm 默认中文字体怎么变了？

挺好看得如果没法改就删除了重新下载一个pycharm试试
python 的浮点型数据计算为什么会出错？

计算机中的浮点数都是近似的不能准确表示所以适当的留一下小数点后的位数的数目
Hadoop 除了 Hbase 是否支持其它数据库？

Oracle、SQL、Mongodb这些对实时性要求比较强的和hadoop的设计初衷有些不一样，这些实时数据处理是OLTP的场景，hadoop是OLAP的数据场景，所以你可以认为不支持替代，但是可以和hadoop配合使用