极客时间-吴磊-零基础入门 Spark(完结)

  • 发布时间:
    2025-06-09 19:19:51
  • 文件大小:
    共计 117 个文件,合计:797.08MB
  • 资源来源:
    夸克网盘夸克网盘
  • 资源售价:
    积分5积分
・本站会员获取资源无需消耗积分。
・获取资源后可以在「个人中心」24 小时内无理由退积分。
为防止资源链接失效,请及时转存文件。
资源详情
《极客时间-吴磊-零基础入门Spark(完结)》是一门由前FreeWheel机器学习研发经理吴磊主讲的高品质课程。课程从Spark的基础知识讲起,通过实战案例深入剖析Spark的核心原理,涵盖RDD、Spark SQL、Spark MLlib、Structured Streaming等多个模块。帮助学员零基础上手Spark,掌握大数据处理和分析技能,适合大数据从业者及爱好者学习。
📢 以下文件由夸克网盘用户[慈祥*星星]于2024-10-15分享(只展示部分的文件和文件夹)
极客时间-吴磊-零基础入门 Spark(完结)797.08MB
01-开篇词(1讲)19.11MB
开篇词丨入门Spark,你需要学会“三步走”.html3.21MB
开篇词丨入门Spark,你需要学会“三步走”.m4a12.37MB
开篇词丨入门Spark,你需要学会“三步走”.pdf3.53MB
02-基础知识(1讲)253.98MB
01丨Spark:从“大数据的HelloWorld”开始.html4.82MB
01丨Spark:从“大数据的HelloWorld”开始.m4a14.48MB
01丨Spark:从“大数据的HelloWorld”开始.pdf5.04MB
02丨RDD与编程模型:延迟计算是怎么回事?.html2.63MB
02丨RDD与编程模型:延迟计算是怎么回事?.m4a13.81MB
02丨RDD与编程模型:延迟计算是怎么回事?.pdf4.03MB
03丨RDD常用算子(一):RDD内部的数据转换.html2.47MB
03丨RDD常用算子(一):RDD内部的数据转换.m4a15.87MB
03丨RDD常用算子(一):RDD内部的数据转换.pdf3.65MB
04丨进程模型与分布式部署:分布式计算是怎么回事?.html2.51MB
04丨进程模型与分布式部署:分布式计算是怎么回事?.m4a13.54MB
04丨进程模型与分布式部署:分布式计算是怎么回事?.pdf3.41MB
05丨调度系统:DAG、Stages与分布式任务.html3.08MB
05丨调度系统:DAG、Stages与分布式任务.m4a18.68MB
05丨调度系统:DAG、Stages与分布式任务.pdf5.19MB
06丨Shuffle管理:为什么Shuffle是性能瓶颈?.html2.38MB
06丨Shuffle管理:为什么Shuffle是性能瓶颈?.m4a14.41MB
06丨Shuffle管理:为什么Shuffle是性能瓶颈?.pdf3.73MB
07丨RDD常用算子(二):Spark如何实现数据聚合?.html2.5MB
07丨RDD常用算子(二):Spark如何实现数据聚合?.m4a13.55MB
07丨RDD常用算子(二):Spark如何实现数据聚合?.pdf4.11MB
08丨内存管理:Spark如何使用内存?.html3.04MB
08丨内存管理:Spark如何使用内存?.m4a13.43MB
08丨内存管理:Spark如何使用内存?.pdf4.24MB
09丨RDD常用算子(三):数据的准备、重分布与持久化.html2.81MB
09丨RDD常用算子(三):数据的准备、重分布与持久化.m4a16.93MB
09丨RDD常用算子(三):数据的准备、重分布与持久化.pdf4.42MB
10丨广播变量&累加器:共享变量是用来做什么的?.m4a11.77MB
10丨广播变量-累加器:共享变量是用来做什么的?.html2.04MB
10丨广播变量-累加器:共享变量是用来做什么的?.pdf2.73MB
11丨存储系统:数据到底都存哪儿了?.html2.86MB
11丨存储系统:数据到底都存哪儿了?.m4a10.79MB
11丨存储系统:数据到底都存哪儿了?.pdf5.19MB
12丨基础配置详解:有哪些配置项是你必须要关注的?.html2.13MB
12丨基础配置详解:有哪些配置项是你必须要关注的?.m4a15.29MB
12丨基础配置详解:有哪些配置项是你必须要关注的?.pdf2.43MB
03-Spark SQL (4讲)231.04MB
13丨让我们从《小汽车摇号分析》开始.html2.89MB
13丨让我们从《小汽车摇号分析》开始.m4a12.6MB
13丨让我们从《小汽车摇号分析》开始.pdf4.4MB
14丨DataFrame与SparkSQL的由来.html3.44MB
14丨DataFrame与SparkSQL的由来.m4a14.88MB
14丨DataFrame与SparkSQL的由来.pdf5.7MB
15丨数据源与数据格式:DataFrame从何而来?.html3.11MB
15丨数据源与数据格式:DataFrame从何而来?.m4a18.06MB
15丨数据源与数据格式:DataFrame从何而来?.pdf4.46MB
16丨数据转换:如何在DataFrame之上做数据处理?.html3.35MB
16丨数据转换:如何在DataFrame之上做数据处理?.m4a17.13MB
16丨数据转换:如何在DataFrame之上做数据处理?.pdf4.52MB
17丨数据关联:不同的关联形式与实现机制该怎么选?.html2.49MB
17丨数据关联:不同的关联形式与实现机制该怎么选?.m4a14.48MB
17丨数据关联:不同的关联形式与实现机制该怎么选?.pdf3.66MB
18丨数据关联优化:都有哪些Join策略,开发者该如何取舍?.html3.14MB
18丨数据关联优化:都有哪些Join策略,开发者该如何取舍?.m4a12.28MB
18丨数据关联优化:都有哪些Join策略,开发者该如何取舍?.pdf4.18MB
19丨配置项详解:哪些参数会影响应用程序执行性能?.html3.61MB
19丨配置项详解:哪些参数会影响应用程序执行性能?.m4a14.33MB
19丨配置项详解:哪些参数会影响应用程序执行性能?.pdf3.73MB
20丨Hive+Spark强强联合:分布式数仓的不二之选.html3.34MB
20丨Hive+Spark强强联合:分布式数仓的不二之选.m4a17.36MB
20丨Hive+Spark强强联合:分布式数仓的不二之选.pdf4.99MB
21丨SparkUI(上):如何高效地定位性能问题?.html5.55MB
21丨SparkUI(上):如何高效地定位性能问题?.m4a11.45MB
21丨SparkUI(上):如何高效地定位性能问题?.pdf6.46MB
22丨SparkUI(下):如何高效地定位性能问题?.html5.78MB
22丨SparkUI(下):如何高效地定位性能问题?.m4a13.07MB
22丨SparkUI(下):如何高效地定位性能问题?.pdf6.61MB
04-SparkMLlib(2讲)136.8MB
23丨SparkMLlib:从“房价预测”开始.html3.16MB
23丨SparkMLlib:从“房价预测”开始.m4a14.82MB
23丨SparkMLlib:从“房价预测”开始.pdf4.8MB
24丨特征工程(上):有哪些常用的特征处理函数?.html3.72MB
24丨特征工程(上):有哪些常用的特征处理函数?.m4a15.84MB
24丨特征工程(上):有哪些常用的特征处理函数?.pdf4.63MB
25丨特征工程(下):有哪些常用的特征处理函数?.html3.06MB
25丨特征工程(下):有哪些常用的特征处理函数?.m4a11.64MB
25丨特征工程(下):有哪些常用的特征处理函数?.pdf5.21MB
26丨模型训练(上):决策树系列算法详解.html2.41MB
26丨模型训练(上):决策树系列算法详解.m4a11.78MB
26丨模型训练(上):决策树系列算法详解.pdf4.73MB
27丨模型训练(中):回归、分类和聚类算法详解.html2.41MB
27丨模型训练(中):回归、分类和聚类算法详解.m4a10.44MB
27丨模型训练(中):回归、分类和聚类算法详解.pdf3.79MB
28丨模型训练(下):协同过滤与频繁项集算法详解.html2.72MB
28丨模型训练(下):协同过滤与频繁项集算法详解.m4a10.26MB
28丨模型训练(下):协同过滤与频繁项集算法详解.pdf4.34MB
29丨SparkMLlibPipeline:高效开发机器学习应用.html2.19MB
29丨SparkMLlibPipeline:高效开发机器学习应用.m4a12.8MB
29丨SparkMLlibPipeline:高效开发机器学习应用.pdf2.06MB
05-特别放送(1讲)23.07MB
用户故事丨小王:保持空杯心态,不做井底之蛙.html4.78MB
用户故事丨小王:保持空杯心态,不做井底之蛙.m4a6.24MB
用户故事丨小王:保持空杯心态,不做井底之蛙.pdf12.05MB
06-StructuredStreaming(1讲)97.83MB
30丨StructuredStreaming:从“流动的WordCount”开始.html3.31MB
30丨StructuredStreaming:从“流动的WordCount”开始.m4a11.57MB
30丨StructuredStreaming:从“流动的WordCount”开始.pdf4.01MB
31丨新一代流处理框架:Batchmode和Continuousmode哪家强?.html3.7MB
31丨新一代流处理框架:Batchmode和Continuousmode哪家强?.m4a11.03MB
31丨新一代流处理框架:Batchmode和Continuousmode哪家强?.pdf5.17MB
32丨Window操作&Watermark:流处理引擎提供了哪些优秀机制?.html2.97MB
32丨Window操作&Watermark:流处理引擎提供了哪些优秀机制?.m4a13.2MB
32丨Window操作&Watermark:流处理引擎提供了哪些优秀机制?.pdf4.73MB
33丨流计算中的数据关联:流与流、流与批.html1.95MB
33丨流计算中的数据关联:流与流、流与批.m4a13.56MB
33丨流计算中的数据关联:流与流、流与批.pdf2.85MB
34丨Spark+Kafka:流计算中的“万金油”.html2.49MB
34丨Spark+Kafka:流计算中的“万金油”.m4a13.21MB
34丨Spark+Kafka:流计算中的“万金油”.pdf4.08MB
08-特别放送(1讲)22.21MB
用户故事丨小王:保持空杯心态,不做井底之蛙.html4.03MB
用户故事丨小王:保持空杯心态,不做井底之蛙.m4a6.24MB
用户故事丨小王:保持空杯心态,不做井底之蛙.pdf11.94MB
09-结束语(2讲)12.98MB
结束语丨进入时间裂缝,持续学习.html2.52MB
结束语丨进入时间裂缝,持续学习.m4a6.6MB
结束语丨进入时间裂缝,持续学习.pdf3.87MB
赠品61.3KB
大额流量卡免费领.png1.8KB
外卖红包免费领.JPG59.48KB
自学吧【】--学知识-长见识一网打尽.txt24B
网站声明:
1. 该网盘资源的安全性和完整性需要您自行判断,点击下载地址直接跳转到网盘官方页面。本站链接通过程序自动收集互联网公开分享链接,本站不储存、复制、传播任何网盘文件,也不提供下载服务。
2. 本站遵守相关法律法规,坚决杜绝一切违规不良信息,如您发现任何涉嫌违规的网盘信息,请立即向网盘官方网站举报,并及时反馈给我们进行屏蔽删除。
3. 本站高度重视知识产权保护和个人隐私保护,如有网盘链接侵犯您的合法权益,请立即向网盘官方网站举报,并参见本站《版权说明》提供书面材料联系我们屏蔽删改。
资源评论 AUP主 M管理员