pandas 比较灵活 可以认为什么都能干
kettle/Informatica 更侧重数据表的处理 对sql语句支持比较好
- 进行 ETL 的时候,用 pandas 和 kettle/Informatica 有什么不同?
- java 泛型上界通配符为什么不可以 set?
- 我的这代码为什么报错?
- 数据库或者 MySQL 如何实现表 A 中某个字符串中的子字符串替换为表 B 中的对应的值?
- Python 中如何实现训练集与测试集按顺序划分,而不是随机划分呢?
- python 中 for 循环的值怎么表示与之前的值相等?
- Python 中类的 call 函数是如何执行的?
- spark 底层是 rdd,flink 底层是怎样的数据结构来维护运算?
- 覆盖索引为什么没有回表呢?
- springmvc 返回一个类和我自己将这个类转为 JSON 格式字符串返回有区别吗?
- Springboot 集成 Swagger2 生成接口文档的时,如何处理通用泛型类返回?
- spark 读取 oracle 后,其中有个字段是 xml 的,怎么解析 xml 中的标签啊,求大佬?
- 设置了 pythonpath 环境变量,程序中无法读出来,这是什么原因?
- 为什么会报这个错误?
- 1000 节点的大数据集群 (hadoop,spark) 需要做哪些优化?