海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

449 关注者
2251 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2251)
  • 如何在 spark 中集成 lightGBM,做大批量数据建模?

    看一下lightGBM有没有on spark版本的 如果是训练的数据一般不会选这么多数据

  • Hadoop 单机模式搭建和伪分布式搭建的区别主要有哪些?

    单机模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统。
    伪分布模式(也是在一台单机上运行,但用不同的Java进程模仿分布式运行中的各类结点 伪分布模式在“单节点集群”上运行Hadoop,其中所有的守护进程都运行在同一台机器上。

  • 信息被删除或无权限查看
  • hive 中创建外部表时 location 如何指定数个位置?

    这个貌似不行 你可以同时加载两个位置为两个表 然后取判断这两个表哪个表的数据是空

  • Hadoop 单机模式搭建和伪分布式搭建的区别主要有哪些?

    单机模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统。
    伪分布模式(也是在一台单机上运行,但用不同的Java进程模仿分布式运行中的各类结点 伪分布模式在“单节点集群”上运行Hadoop,其中所有的守护进程都运行在同一台机器上。

  • python colorama 模块不能正常输出颜色怎么解决?

    file

  • map/reduce 过程,如何用 map/reduce 实现两个数据源的联合统计?

    reduce的时候统计就可以了,两个数据源的联合统计也是需要合在一起统计

  • 多 hive 表关联成一张大表,表的大小差距比较大,如何提效?

    具体情形是什么样的?什么场景 多少数据 为什么多个关联

  • Pycharm 默认中文字体怎么变了?

    挺好看得 如果没法改就删除了 重新下载一个pycharm试试

  • python 的浮点型数据计算为什么会出错?

    计算机中的浮点数都是近似的 不能准确表示 所以适当的留一下小数点后的位数的数目

  • Hadoop 除了 Hbase 是否支持其它数据库?

    Oracle、SQL、Mongodb这些对实时性要求比较强的和hadoop的设计初衷有些不一样,这些实时数据处理是OLTP的场景,hadoop是OLAP的数据场景,所以你可以认为不支持替代,但是可以和hadoop配合使用

  • 为什么说 Hadoop 是一个生态系统?

    生态系统,顾名思义就是很多组件组成的一个生态链,经过多年的发展,Hadoop生态系统不断完善和成熟,目前已经包括了多个子项目,除了核心的HDFS和MapReduce以外,Hadoop生态系统还包括要ZoopKer、HBase、Hive、Pig、Mahout、Sqoop、Flume、Ambari等功能组件。这些组件几乎覆盖了目前业界对数据处理的所有场景。

  • python 定义一个类,类里有一个实例属性是关于时间的,怎么样写才能让这个属性根据时间变化?

    time.localtime()不就是当地时间吗

  • zookeeper 完全分布式配置时,集群会使用什么端口?

    端口自己定就行了 不被占用就可以 最好有规律可循

  • Flink 批处理完成后,我怎么得到通知?

    集群模式提交不起作用?是没有调用还是调用报错了?

  • «
  • 1
  • 2
  • ...
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • ...
  • 145
  • 146
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2