- 资源介绍
资源名称:Spark大数据处理技术 完整pdf
第1章 Spark系统概述 1
1.1 大数据处理框架 1
1.2 Spark大数据处理框架 3
1.2.1 RDD表达能力 3
1.2.2 Spark子系统 4
1.3 小结 7
第2章 Spark RDD及编程接口 9
2.1 Spark程序“Hello World” 9
2.2 Spark RDD 12
2.2.1 RDD分区(partitions) 13
2.2.2 RDD优先位置(preferredLocations) 13
2.2.3 RDD依赖关系(dependencies) 15
2.2.4 RDD分区计算(compute) 19
2.2.5 RDD分区函数(partitioner) 20
2.3 创建操作 23
2.3.1 集合创建操作 23
2.3.2 存储创建操作 23
2.4 转换操作 26
2.4.1 RDD基本转换操作 26
2.4.2 键值RDD转换操作 35
2.4.3 再论RDD依赖关系 43
2.5 控制操作(control operation) 46
2.6 行动操作(action operation) 47
2.6.1 集合标量行动操作 47
2.6.2 存储行动操作 52
2.7 小结 56
第3章 Spark运行模式及原理 57
3.1 Spark运行模式概述 57
3.1.1 Spark运行模式列表 57
3.1.2 Spark基本工作流程 58
3.1.3 相关基本类 59
3.2 Local模式 62
3.2.1 部署及程序运行 62
3.2.2 内部实现原理 63
3.3 Standalone模式 64
3.3.1 部署及程序运行 64
3.3.2 内部实现原理 67
3.4 Local cluster模式 68
3.4.1 部署及程序运行 68
资源截图:
猜你喜欢
-
Kafka并不难学!入门、进阶、商业实战
2020-07-21 -
可视化数据挖掘:数据可视化和数据挖掘的技术与工具
2020-07-21 -
云计算核心技术剖析
2020-07-21 -
千锋Linux云计算网络管理实战教程
2020-07-21 -
OpenStack架构文档汇总
2020-07-21 -
云计算与Azure平台实战
2020-07-21 -
思科UCS统一计算系统培训视频教程
2020-07-21 -
Shell编程从入门到实战(二)【2019千锋Linux】
2020-07-21 -
Hadoop构建数据仓库实践
2020-07-21 -
Spark MLlib机器学习实践(第2版)
2020-07-21
-
北航云计算架构师高端班北航云计算前世、今生和未来视频教程
2020-07-21 -
zookeeper笔记和搭建
2020-07-21 -
大数据技术丛书《数据挖掘与数据化运营实战:思路、方法、技巧与应用》
2020-07-21 -
分布式计算开源框架Hadoop入门实践
2020-07-21 -
深度剖析Hadoop HDFS
2020-07-21 -
炼数成金Hadoop视频
2020-07-21 -
实战Matlab之并行程序设计 (刘维著) 中文
2020-07-21 -
Hadoop权威指南(第4版)(修订升级版) 中文完整pdf
2020-07-21 -
Docker进阶与实战
2020-07-21 -
大数据技术丛书:Apache Kylin权威指南 高清pdf
2020-07-21
猜你在找
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
源码库 » Spark大数据处理技术 完整pdf