海汼部落
  • 首页
  • 课程
  • 实战
  • 云平台
  • 部落
  • 公告
  • 分享
  • 问答
    登 录 注册
创始人

青牛

第 12 位会员

449 关注者
2251 评论
308 话题

  • WeChat
  • Website
  • 公司
  • 城市
  • Ta 发布的话题
  • Ta 发表的回复
  • Ta 关注的用户
  • Ta 赞过的话题
  1. 个人中心
  2. Ta 发表的回复(2251)
  • Python 如何高效省时将几十亿行数据中的某一列保存到另一文件中?

    1、你的读写的数据存在哪里?
    2、是用什么方法写的?
    澄清一下上面的问题

  • Python 中 /,//,*,**,%运算符的作用各是什么?

    / 是除法,//是取模,*是乘法,**是乘方,%是取模的余数

  • MySQL 一张表根据时间做了分区和子分区后,存百亿数据会不会有问题?

    存储不会有问题,问题在于你怎么查询

  • kafka 在量化交易程序中有用吗?

    量化交易很多场景,具体指的是哪一种,实时性高的时候一般用不上

  • PostgreSQL 为什么删除了数据库以后,里面的表还在?

    找个图形化结果的工具可以看到表和库的关系 像是pgAdmin等

  • JAVA 安装时为什么要手动配环境变量?

    java是静态类型语言,需要编译和解释执行两种环境,如果基于java的开发也就是我们通常所说的jdk环境,还有运行时环境jre,如果只需要运行,有很多集成环境直接可以用jar,之所以手工配置是增加了更多的灵活性,python是动态类型的语言,一个环境就够了,所以可以很自动的配置

  • Sql 批量查询某一字段,如果某一值没有则整个结果就不返回任何记录,请问有什么合适的函数能替代 IN 吗?

    SELECT id FROM table_a WHERE id IN(1,2,3) and id IN(9999) 这么写可以吗

  • MySQL 千万数据 count + where 查询慢如何解决?

    把sql和sql的执行计划及索引结构发出来看一下把

  • spark 如何和 yarn 结合的?

    yarn提供了一套自己的调度机制,如果想被yarn调度起来需要自定义开发很多组件,spark也是自己开发了适应于yarn调度的接口,才能部署为spark on yarn,这个内容比较多,推荐一篇文章给你看下吧https://blog.csdn.net/u010039929/article/details/74934306

  • python 如何实现查询 sql 数据库并生成 HTML 文件?

    !/usr/bin/env python -- coding: utf-8 --

    import MySQLdb as mdb

    连接数据库

    conn = mdb.connect('localhost', 'root', 'root')

    也可以使用关键字参数

    conn = mdb.connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='test', charset='utf8')

    也可以使用字典进行连接参数的管理

    config = {
    'host': '127.0.0.1',
    'port': 3306,
    'user': 'root',
    'passwd': 'root',
    'db': 'test',
    'charset': 'utf8'
    }
    conn = mdb.connect(**config)
    连接完数据库就可以执行sql了
    然后把查询出来的结果拼装成html就可以了

  • 大数据技术平台有哪些?

    大数据平台一般指的是具体的平台比如某个商业公司用的某个基于大数据开发的平台,大数据技术平台一般指的是一系列技术构建成的平台,也可以用别的技术,这些技术栈统称为大数据技术平台技术栈,这个虽然有点拗口,但是不要太在意这些概念。

  • Hive MetaStore 引入的背景是什么?为什么要使用 Hive MetaStore?

    MetaStore的引入很重要,主要解决了客户端访问hive元数据的管理问题,客户端连接metastore服务,metastore再去连接MySQL数据库来存取元数据。有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL数据库的用户名和密码,只需要连接metastore 服务即可。这样既可以保证安全又可以保证高效。

  • spark 的核心设计思想是什么?

    spark的出现其实是一个生态系统的成长过程,Spark是基于内存计算的大数据并行计算框架,也就是说他的思想是要在内存中处理大规模数据,同时还要兼顾处理数据处理的实时性,同时保证了高容错性和高可伸缩性,当然这个前提是要在廉价的分布式集群上解决这个问题,这就是设计的初衷,也是设计的主要思想,至于rdd只是一个抽象而已。

  • Hadoop,Hive,Kafka,Flume,Hbase,Spark 等 是部署在一个集群上面吗?

    但从环境上来说可以部署在一起,也可以分开,可以按功能分开部署,这样有利于维护,就像你非要把数据库和web应用部署在同一台机器上是一个道理

  • ZooKeeper 是不是 Hadoop 体系实现 HA 的命门所在?

    1、zk是命门
    2、因为仓库一般是内网 没有啥攻击 就像你说所有数据都存在oracle 、oracle挂了不都完了吗一样

  • «
  • 1
  • 2
  • ...
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • ...
  • 145
  • 146
  • »

为技术学习者提供一个动手实战、分享创造、结识伙伴、协同互助的平台。    

  京公网安备 11011402010672号        京ICP备17041118号-2