1.常用的转换
假设rdd的元素是: {1,2,2,3}

应用于pairRdd



假设rdd的元素是:{1, 2, 3},other元素是:{3, 4, 5}

2.常用操作接口
假设rdd的元素是:{1, 2, 3, 3}


3.创建RDD
有两种方式:读取外部数据集,以及在驱动器程序中对一个集合进行并行化
parallelize      集合并行化
textFile          本地文件或者HDFS文件


4.map()函数 和 take()函数
map(func)
take(num)



           回复帖子,然后刷新页面即可查看隐藏内容
      
  版权声明:原创作品,允许转载,转载时务必以超链接的形式表明出处和作者信息。否则将追究法律责任。来自海汼部落-青牛,http://hainiubl.com/topics/192