青牛主题列表_海汼部落 | IT学习->实战为王

创始人

青牛

第 12 位会员

451 关注者

2255 评论

308 话题

WeChat
Website
公司
城市

Hive MetaStore 引入的背景是什么？为什么要使用 Hive MetaStore?

MetaStore的引入很重要，主要解决了客户端访问hive元数据的管理问题，客户端连接metastore服务，metastore再去连接MySQL数据库来存取元数据。有了metastore服务，就可以有多个客户端同时连接，而且这些客户端不需要知道MySQL数据库的用户名和密码，只需要连接metastore 服务即可。这样既可以保证安全又可以保证高效。
spark 的核心设计思想是什么？

spark的出现其实是一个生态系统的成长过程，Spark是基于内存计算的大数据并行计算框架，也就是说他的思想是要在内存中处理大规模数据，同时还要兼顾处理数据处理的实时性,同时保证了高容错性和高可伸缩性,当然这个前提是要在廉价的分布式集群上解决这个问题，这就是设计的初衷，也是设计的主要思想，至于rdd只是一个抽象而已。
Hadoop，Hive，Kafka，Flume，Hbase，Spark 等是部署在一个集群上面吗？

但从环境上来说可以部署在一起，也可以分开，可以按功能分开部署，这样有利于维护，就像你非要把数据库和web应用部署在同一台机器上是一个道理
ZooKeeper 是不是 Hadoop 体系实现 HA 的命门所在？

1、zk是命门
2、因为仓库一般是内网没有啥攻击就像你说所有数据都存在oracle 、oracle挂了不都完了吗一样
pyspark 自定义 transform 如何导出成 PMML？

这个方法目前存在什么问题吗还是满足不了业务的需求？
2 个 hdfs 集群，flink 怎么把数据写入另一个集群？

flink 写数据的时候写两份就行了如果不用保证集群的数据实时一致，为了不影响flink的性能，你可以写另外的一个任务，把一个集群的数据直接拷贝给另一个集群
Python 如何操作.dll 文件？

import ctypes
from ctypes import *
dll=cdll.LoadLibrary('C:\xxx.dll')
floatAdd=dll.floatAdd #加载函数对象
floatAdd.argtypes=[c_float,c_float]
floatAdd.restype=c_float
print floatAdd(1.4,3.45)
MySQL 中，order by 语句和 select 语句哪个先执行？

这要看order by的位置一般讲order by是最后执行的如果它在sql语句的最后面，有先于select执行的例子可以发出来一起探讨一下
多个线程读写 zookeeper 节点上数据过程中，读操作需要加锁么？

setData和getData在api中有好多同名的方法你指的是哪一个？
用 java 怎么写 multi-threaded client server chat?
public class server implements Runnable {// 服务端
static List socketList=new ArrayList();
// 读取 In
static Socket socket = null;
static ServerSocket serverSocket = null;
public server() {// 构造方法
try {
serverSocket = new ServerSocket(9999);
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) {
Scanner input = new Scanner(System.in);
System.out.println("****服务端*****");
server t = new server();
int count = 0;
while (true) {
try {
// System.out.println("端口9999等待被连接......");
socket = serverSocket.accept();
count++;
System.out.println("第" + count + "个客户已连接");
socketList.add(socket);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
Print p = new Print(socket);
Thread read = new Thread(t);
Thread print = new Thread(p);
read.start();
print.start();
}
}
@Override
public void run() {
// 重写run方法
try {
Thread.sleep(1000);
BufferedReader in = new BufferedReader(new InputStreamReader(socket
.getInputStream()));
while (true) {
String jieshou = in.readLine();
System.out.println( jieshou);
for (int i = 0; i < socketList.size(); i++) {
Socket socket=socketList.get(i);
PrintWriter out = new PrintWriter(socket.getOutputStream());
if (socket!=this.socket) {
out.println(jieshou);
}else{
out.println("(你)"+jieshou);
}
out.flush();
}
}
} catch (Exception e) {
```
        e.printStackTrace();
    }
}
```
}
class Print implements Runnable {
static List socketList=new ArrayList();
Scanner input = new Scanner(System.in);
public Print(Socket s) {// 构造方法
try {
socketList.add(s);
} catch (Exception e) {
e.printStackTrace();
}
}
@Override
public void run() {
try {
Thread.sleep(1000);
while (true) {
String msg = input.next();
for (int i = 0; i < socketList.size(); i++) {
Socket socket=socketList.get(i);
PrintWriter out = new PrintWriter(socket.getOutputStream());
// System.out.println("对客户端说：");
out.println("服务端说："+msg);
out.flush();
}
}
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
}
//client.java
package Socket;
import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.io.PrintWriter;
import java.net.Socket;
import java.util.Scanner;
public class client implements Runnable {// 客户端
static Socket socket = null;
Scanner input = new Scanner(System.in);
static String name=null;
public static void main(String[] args) {
int x=(int)(Math.random()*100);
client.name="client"+x;
System.out.println("****客户端"+x+"*****");
try {
socket = new Socket("127.0.0.1", 9999);
System.out.println("已经连上服务器了");
} catch (Exception e) {
e.printStackTrace();
}
client t = new client();
Read r = new Read(socket);
Thread print = new Thread(t);
Thread read = new Thread(r);
print.start();
read.start();
}
@Override
public void run() {
try {
Thread.sleep(1000);
PrintWriter out = new PrintWriter(socket.getOutputStream());
while (true) {
String msg = input.next();
out.println(name+"说:"+msg);
out.flush();
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
class Read implements Runnable {
static Socket socket = null;
public Read(Socket socket) {
this.socket = socket;
}
@Override
public void run() {
try {
Thread.sleep(1000);
BufferedReader in = new BufferedReader(new InputStreamReader(socket
.getInputStream()));
while (true) {
System.out.println( in.readLine());
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
————————————————
原文链接：https://blog.csdn.net/qq_29606255/article/details/78679815
hadoop streaming,但是当-file 指定路径的 mapper.py,就报错?是什么原因？

把整个命令贴一下
请问通过 jdbc 精确查询 MySQL 数据库怎么写？

public static void main(String[] args) {
System.out.println("MySQL JDBC Example.");
Connection conn = null;
String url = "jdbc:mysql://...:3306/test?autoReconnect=true&useSSL=false";
String driver = "com.mysql.jdbc.Driver";
String userName = "root";
String password = "XXXXXXXX";
Statement stmt = null;
ResultSet rs = null;
try {
Class.forName(driver);
conn = DriverManager.getConnection(url, userName, password);
stmt = conn.createStatement();
String sql = "select * from AAA";
rs = stmt.executeQuery(sql);
while (rs.next()) {
int id = rs.getInt("emp_id");
String name = rs.getString("name");
System.out.println("id = " + id + ", name = " + name);
}
// 关闭资源
rs.close();
stmt.close();
conn.close();
} catch (Exception e) {
e.printStackTrace();
} finally {
if (rs != null) {
try {
rs.close();
} catch (SQLException sqlEx) { } // ignore
}
if (stmt != null) {
try {
stmt.close();
} catch (SQLException sqlEx) { } // ignore
}
}
}
请问 conda.exe 与 python.exe 区别大吗？

不是一个东西 conda.exe是conda的环境启动 python.exe是启动python用的这两个都没关系
Python 中 asyncio 与 gevent 有什么区别?

gevent是第三方库，通过greenlet实现协程，其基本思路是：
当一个greenlet遇到IO操作时，就自动切换到其他的greenlet，等到IO操作完成，再在适当的时候切换回来继续执行。
asyncio是Python 3.4版本引入的标准库，直接内置了对异步IO的支持，不需要第三方的支持，
asyncio的编程模型就是一个消息循环。我们从asyncio模块中直接获取一个EventLoop的引用，然后把需要执行的协程扔到EventLoop中执行，就实现了异步IO。很多异步io操作这两个库都可以用，只是他们在不同场景下的效率和易用性可能有区别，当然这个得进行深入的测试和研究，单就现在普通的场景来说区别并不大
多个线程读写 zookeeper 节点上数据过程中，读操作需要加锁么？

setData和getData在api中有好多同名的方法你指的是哪一个？