伪分布式就一台linux,是不是性能没有什么提高,只是用来学习的啊?
如果有两万个数据进行聚类,是不是和不在spark上运行一样啊??
可能用spark运行会更慢
`单行代码`
关注海牛部落大数据技术社区