海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

449 关注者
2251 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2251)
  • hadoop 伪分布模式,我有三个模拟节点,在其中一个节点上,配置了 hdfs 和 yarn,这样就行了吗?

    三个节点都得装

  • 如何实际使用 mimikittenz 在 PowerShell 运行并读出数据?

    对微软的东西确实不了解 除了office

  • 请问 Spark 如何利用 GPU 资源计算?

    这个场景必然用TensorFlow啊

  • 机器学习的回归分析相比于传统的分析方法精度有没有提高?

    传统的分析方法指的是什么?这个要看具体场景 泛泛的谈论哪个好哪个不好没啥意义

  • Spark 中如何正确使用多线程保存数据到 Hive?

    spark本身就是分布式多进程的 为啥要多线程保存 没意义啊

  • phoenix、impala、spark sql 访问 hbase 数据库哪种工具性能最优?

    我们一般用sparksql或是hive 因为我们没有事务性操作 都是olap 数据仓库的操作

  • sparksql error cleaning broadcast?

    报的是网络错误啊 集群环境有问题吧 和spark sql没啥关系

  • HIVE 中如何将一个分区表的某些字段插入另一个分区表的各个分区?

    写三个insert into A(分区) as select * from B 这种方法就可以了

  • Python 中有什么类库可以实时获取浏览器中某个网页实时传回来的值?

    了解一下python的抓包工具吧 这个最好直接抓返回的报文吧

  • [python] 我的正则表达式有问题?为啥就是抠不出来!?

    来个例子,应该和你的需求差不多 自己稍微改一下就行了
    import re
    str = "a123b"
    print re.findall(r"a(.+?)b",str)#
    输出['123']

  • 迁移学习 transfer learning 中,为什么数据集的边缘分布不匹配会降低预测效果?

    你可以简单的理解为模型偏差有点大,泛化能力比较弱

  • hadoop 伪分布模式,我有三个模拟节点,在其中一个节点上,配置了 hdfs 和 yarn,这样就行了吗?

    都要安装hdfs和yarn

  • kafka 新版消费者为什么要使用单线程?

    新版只指的是哪个版本?每个分区只能由该组内的一个消费者消费,这个保证了内部处理的逻辑简单,易用,这并不是说消费者就是单线程的,是在一定的约束下是单线程

  • python 怎样获得软件运行时的实时数据?

    这个最好用java来做 java有很多底层的api是获得虚拟机信息的,通过虚拟机信息可以得到类和对象的统计信息 你可以看看java虚拟机那本书 讲得很详细

  • spark 读取 sql 文件并创建 Graphx 图如何操作?

    解析sql中的表名就行了

  • «
  • 1
  • 2
  • ...
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • ...
  • 145
  • 146
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2