主要内容
◆ 理解Scala的面向对象和函数式编程概念
◆ 深入理解Scala的集合API
◆ 学习RDD和数据帧等Spark核心概念
◆ 使用Spark SQL和GraphX分析结构化与非结构化数据
◆ 使用Spark结构化流来开发具备可扩展性和容错能力的流式应用
◆ 学习分类、回归、降维和推荐系统等机器学习最佳实践,以便使用Spark ML和Spark MLlib中的流行算法来建立预测模型
◆ 建立聚类模型,以便聚类大量数据
◆ 理解Spark应用的调优、调试和监控技术
◆ 使用独立服务器模式、Mesos和YARN模式在集群上部署Spark应用
下载地址
https://pan.baidu.com/s/1cXqzaOD1EnYSaqFxediDLg
- 如需提取码:[打开微信]->[扫描下方二维码]->[关注数据与人] 回复”4795″ 获取提取码
- 坚持电子书籍资源共享,感谢认同!