海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

447 关注者
2249 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2249)
  • spark 伪分布式模式的性能怎么样? 能否替换传统数据处理里的某些场景?

    spark的强大之处在于分布式 伪分布式学习可以 但是谈不上性能

  • Linux 平台完全分布模式下 Hadoop 实例 wordcount 在 eclipse 编写运行权限问题?

    看一下系统配置的tmp目录在哪里 保证hadoop用户对这个目录有读写权限

  • Fuzzy C-means 与 Gaussian Mixture Model 聚类的区别?修改

    解决软划分的主要方法就是Fuzzy C-means 与 Gaussian Mixture Model 他们共同的特点就是可以动态调整K的个数,不必人工指定,解决k均值容易收敛到局部最优,效果受初始值影响很大,易受噪声点影响的问题,区别主要是优化函数,思想和算法不一样

  • Spark 中的 CNN 如何实现分布式计算的?

    CNN和RNN这种深度学习算法最好不要用spark搞 不然报错了你根本没法解决

  • spark streaming 任务如何切分,是按照 duration 切分么?

    是的 按照时间窗口

  • Spark SQL 如何管理 select 权限,貌似任何用户都可以查询任何一张表?

    权限系统需要系统设计 框架考虑不到这一层问题

  • 信息被删除或无权限查看
  • spark 读取 hive 的问题?

    报什么错误 贴一下

  • 请问谁有海牛教学视频里面的 hosts_op 脚本可以分享一下吗?

    视频配套笔记、源码、使用软件:可加微信:18613807937 索要

  • spark 当中,被 cache 的 RDD 的引用是否可以存到 HashMap 里?

    你这个代码咋没有action操作?

  • 为什么 hadoop 的 shuffle 阶段需要对数据进行排序?

    不用全局排序的时候自然不需要排序 但是具体场景中很少能避免全局排序 所以框架设计的思路是提高shuffle的性能 而不是去掉shuffle

  • 信息被删除或无权限查看
  • 'module' object has no attribute 'open_client'怎样解决?

    pip upgrade model

  • heidisql 导入 CSV 文件后,为何数据都是 null 呢?

    最好先把excel文件保存成csv文件 再导入csv文件

  • 为什么只有 root 用户可以 SSH 连接,普通用户不行?

    1、安装hadoop的时候用普通用户安装
    2、把ssh命令执行权限给普通用户

  • «
  • 1
  • 2
  • ...
  • 92
  • 93
  • 94
  • 95
  • 96
  • 97
  • 98
  • ...
  • 145
  • 146
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2