2021贺岁大数据入门spark3.0入门到精通
本课程中使用官方在2020年9月8日发布的Spark3.0系列最新稳定版:Spark3.0.1。共课程包含9个章节:Spark环境搭建,SparkCore,SparkStreaming,SparkSQL,StructuredStreaming,Spark综合案例,Spark多语言开发,Spark3.0新特性,Spark性能调优 。
课程目录
Spark-day01
00-[了解]-课程内容介绍.mp4
01-[了解]-Spark发展历史和特点介绍.mp4
02-[掌握]-Spark环境搭建-local本地模式.mp4
03-[掌握]-Spark环境搭建-Standalone集群模式.mp4
04-[掌握]-Spark环境搭建-Standalone-HA集群模式.mp4
05-[细心]-Spark环境搭建-On-Yarn-原理和准备工作.mp4
06-[理解]-Spark环境搭建-On-Yarn-两种模式.mp4
07-[掌握]-Spark环境搭建-On-Yarn-两种模式演示.mp4
08-[补充]-Spark环境搭建-spark-shell和spark-submit.mp4
09-[掌握]-Spark代码开发-准备工作.mp4
10-[重点]-Spark代码开发-入门案例.mp4
11-[重点]-Spark代码开发-OnYarn.mp4
12-[理解]-Spark代码开发-WordCount图解.mp4
13-[总结]-总结和作业.mp4
Spark-day02
01-[理解]-RDD理论详解.mp4
02-[掌握]-RDD的创建.mp4
03-[掌握]-RDD的操作分类和基本操作演示.mp4
04-[掌握]-RDD的分区操作.mp4
05-[掌握]-RDD的重分区操作.mp4
06-[掌握]-RDD的聚合操作.mp4
07-[面试题]-RDD的聚合reduceByKey和groupByKey.mp4
08-[掌握]-RDD的关联.mp4
09-[掌握]-RDD的排序.mp4
10-[掌握]-RDD的缓存-持久化.mp4
11-[掌握]-RDD的Checkpoint.mp4
12-[掌握]-共享变量-广播变量和累加器.mp4
13-[掌握]-外部数据源-多种数据格式.mp4
14-[了解]-外部数据源-操作JDBC-写.mp4
15-[了解]-外部数据源-操作JDBC-读.mp4
Spark-day03
01-[理解]-spark内核原理-依赖关系.mp4
02-[理解]-spark内核原理-DAG和Stage.mp4
03-[理解]-spark内核原理-名词解释.mp4
04-[理解]-spark内核原理-job提交流程.mp4
05-[理解]-spark内核原理-web-UI查看.mp4
06-[了解]-搜狗搜索日志分析-需求和分词测试.mp4
07-[了解]-搜狗搜索日志分析-代码实现.mp4
08-[了解]-流式计算应用场景.mp4
09-[了解]-流式计算实现模式.mp4
10-[了解]-SparkStreaming介绍-特点-流程-原理.mp4
11-[理解]-SparkStreaming数据抽象-DStream.mp4
12-[掌握]-SparkStreaming案例1-WordCount.mp4
13-[掌握]-SparkStreaming案例2-状态管理.mp4
14-[扩展]-SparkStreaming案例3-状态恢复.mp4
15-[重难点]-SparkStreaming案例4-窗口计算.mp4
Spark-day04
01-[掌握]-SparkStreaming案例5-topN.mp4
02-[掌握]-SparkStreaming案例6-自定义输出.mp4
03-[了解]-SparkStreaming整合Kafka前置说明-连接方式和API版本.mp4
04-[重点]-SparkStreaming整合Kafka-代码实现-1-自动提交偏移量.mp4
05-[掌握]-SparkStreaming整合Kafka-代码实现-2-手动提交偏移量.mp4
06-[扩展]-SparkStreaming整合Kafka-代码实现-3-手动提交偏移量到MySQL.mp4
07-[了解]-SparkSQL概述-数据分析方式.mp4
08-[了解]-SparkSQL概述-官方介绍-数据格式.mp4
09-[理解]-SparkSQL数据抽象.mp4
10-[掌握]-SparkSQL实战-1-加载数据成为分布式表.mp4
11-[掌握]-SparkSQL实战-2-RDD转DF-1-使用样例类.mp4
12-[掌握]-SparkSQL实战-2-RDD转DF-2-指定类型+列名.mp4
13-[掌握]-SparkSQL实战-2-RDD转DF-3-自定义Schema.mp4
14-[掌握]-SparkSQL实战-3-RDD-DF-DS-相互转换.mp4
15-[掌握]-SparkSQL实战-4-花式查询.mp4
16-[掌握]-SparkSQL实战-5-WordCount.mp4
Spark-day05
01-[掌握]-SparkSQL案例-6-多数据源支持.mp4
02-[掌握]-SparkSQL案例-7-电影数据分析.mp4
03-[掌握]-SparkSQL案例-8-SparkSQL-UDF.mp4
04-[掌握]-SparkSQL整合Hive-1-SparkSQL命令行.mp4
05-[掌握]-SparkSQL整合Hive-2-SparkSQL代码中操作Hive.mp4
06-[掌握]-SparkSQL分布式SQL引擎.mp4
07-[了解]-StructuredStreaming引入.mp4
08-[了解]-StructuredStreaming介绍.mp4
09-[理解]-StructuredStreaming编程模型和数据抽象.mp4
10-[掌握]-StructuredStreaming-Source-Socket.mp4
11-[了解]-StructuredStreaming-Source-Rate.mp4
12-[了解]-StructuredStreaming-Source-File.mp4
13-[掌握]-StructuredStreaming-Operation.mp4
14-[掌握]-StructuredStreaming-输出模式.mp4
15-[掌握]-StructuredStreaming-输出位置.mp4
16-[掌握]-StructuredStreaming-ForeachBatch.mp4
17-[掌握]-StructuredStreaming-连续处理和Checkpoint.mp4
Spark-day06
01-[了解]-StructuredStreaming整合Kafka官方说明.mp4
02-[掌握]-StructuredStreaming整合Kafka-案例1-实时ETL.mp4
03-[掌握]-StructuredStreaming整合Kafka-案例2-物联网设备实时分析.mp4
04-[掌握]-StructuredStreaming-基于事件时间的窗口计算-水位线解决数据延迟到达问题.mp4
05-[掌握]-StructuredStreaming-流去重.mp4
06-[了解]-Spark综合案例-流程分析和业务模块划分.mp4
07-[了解]-Spark综合案例-环境搭建和数据发送.mp4
08-[掌握]-Spark综合案例-实时数据分析-代码实现-1-数据加载和转换.mp4
09-[掌握]-Spark综合案例-实时数据分析-代码实现-2-业务需求代码实现.mp4
10-[理解]-Spark综合案例-实时推荐易错题-需求分析和模型准备.mp4
11-[掌握]-Spark综合案例-实时推荐易错题-代码实现-1-加载数据和模型.mp4
12-[掌握]-Spark综合案例-实时推荐易错题-代码实现-2-给用户推荐并存储推荐结果.mp4
Spark-day07
01-[理解]-Spark综合案例-学生答题情况离线分析-需求分析.mp4
02-[理解]-Spark综合案例-学生答题情况离线分析-代码实现-1.mp4
03-[理解]-Spark综合案例-学生答题情况离线分析-代码实现-2.mp4
04-[补充]-推荐系统概述.mp4
05-[补充]-推荐算法分类.mp4
06-[补充]-推荐算法-ALS-数学基础补充.mp4
07-[补充]-推荐算法-ALS-案例需求和算法思想.mp4
08-[补充]-推荐算法-ALS-电影推荐案例-代码实现.mp4
09-[补充]-推荐算法-ALS-在易错题推荐案例中的模型实现.mp4
10-[了解]-Spark3.0诞生背景.mp4
11-[了解]-Spark3.0新特性-动态分区裁剪.mp4
12-[了解]-Spark3.0初体验-代码演示.mp4
12-[了解]-Spark3.0新特性-自适应查询执行优化.mp4
13-[了解]-Spark3.0新特性-加速器感知调度.mp4
14-[了解]-Spark3.0新特性-更好的API扩展.mp4
15-[了解]-Spark3.0新特性-更好的SQL支持和SparkR的向量化读写.mp4
16-[理解]-Spark3.0初体验-静态分区裁剪.mp4
17-[理解]-Spark3.0初体验-动态分区裁剪.mp4
18-[注意]-Spark3.0初体验-参数设置和注意事项.mp4
19-[理解]-Spark3.0初体验-结果对比.mp4
20-[了解]-Spark生态与未来.mp4
Spark-day08
01-[了解]-Spark多语言开发-说明.mp4
02-[掌握]-Spark多语言开发-JavaSpark-SparkCore.mp4
03-[掌握]-Spark多语言开发-JavaSpark-SparkStreaming.mp4
04-[掌握]-Spark多语言开发-JavaSpark-SparkSQL.mp4
05-[掌握]-Spark多语言开发-JavaSpark-StructuredStreaming.mp4
06-[了解]-Spark多语言开发-JavaSpark-线性回归算法-房价预测案例.mp4
07-[了解]-Spark多语言开发-JavaSpark-线性回归算法-房价预测案例-代码实现.mp4
08-[了解]-Spark多语言开发-PySpark-SparkCore.mp4
09-[了解]-Spark多语言开发-PySpark-SparkStreaming.mp4
10-[了解]-Spark多语言开发-PySpark-SparkSQL.mp4
11-[了解]-Spark多语言开发-PySpark-StructuredStreaming.mp4
12-[了解]-Spark多语言开发-PySpark-决策树算法-相亲决策案例-需求-原理.mp4
13-[了解]-Spark多语言开发-PySpark-决策树算法-相亲决策案例-代码实现.mp4
14-[了解]-Spark性能优化-9项基本原则.mp4
15-[了解]-Spark性能优化-N多配置参数.mp4
16-[了解]-Spark性能优化-数据倾斜.mp4
17-[了解]-Spark性能优化-shuffle优化.mp4
18-[了解]-Spark性能优化-内存管理.mp4
资料
更多知识
-
OpenClaw养虾记实操系列,手把手教你部署本地优先的龙虾,深度定制你的专属养虾黑科技
课程介绍:龙虾(OpenClaw)不是普通的聊天机器人,而是你的个人智能助理。不需要高配电脑,不需要懂编程代码,只要你会用手机聊天,就能指挥它在后台搞定杂活、智能协作、生成方案。为什么你需要这只“龙虾
努ぐ努ノ
84 阅读
-
Cursor快速入门到精通,全面掌握Cursor降本增效,把Cursor变成日常开发里的实用帮手
课程介绍你是否有过这样的困扰:在用代码工具时总觉得效率不够高?想尝试AI编程工具,却不知道从哪里入手配置?或是已经用上了Cursor,却只用到了基础功能?如果这些是你正在面对的问题,这门课正好适合你—
莫小言′
53 阅读
-
快手数字人带货最新玩法,新手一天也能300+,无脑操作,看完直接上手揭秘
项目介绍:快手大家都知道他是一个短视频平台,目前的流量也能排个一二名的,我们主要是靠数字人进行直播带货,不需要真人出境,你只需要选好品,把直播间搭建好一天24小时用数字人在那里直播带货就可以,完全不封
不愿失去
32 阅读
-
拼多多年费会员,实经验分享操,时长拉满,干货拉满(更新1月)
课程介绍:课程来自纪主任的拼多多年费会员。看了课程之后,才发现自己以前的操作思路还有很多细节要完善优化,甚至底层逻辑完全不对需要重来,学了正确的方法之后才懂得什么叫做“稳定盈利”,所以,有可能你觉得“
冷夕颜
62 阅读
-
某大佬亲授公众号流量主实战教学:多赛道玩法全覆盖,小白轻松变现,每月多挣5k+
项目介绍:做公众号流量主,从来不需要过硬的文笔,也不需要全职投入,核心是跟对资深大佬、选对蓝海赛道、掌握多赛道玩法。本次课程由圈内深耕公众号多年的资深大佬亲授,摒弃市面上过时的单一玩法、空泛理论,主打
小偏执i
67 阅读
-
老邓电商·淘宝开店运营教程直通车,从基础到进阶,提升店铺流量,转化率和整体运营效率(更新3月)
课程介绍:主要内容:直通车、引力魔方、赛马测款、达摩盘人群推广等多个核心内容。通过详细的案例分析和实操演示,帮助学员掌握店铺诊断、爆款拉升、动销计划、人群精准投放等关键技能。课程内容从基础到进阶,适合
许她画里成妆
53 阅读
-
2026短视频IP+AI破局大课3月线下课,把自己做成产品,把Ai变成军团,把IP做成体系
3天2夜4位导师4场私密夜话12大案例路演把自己做成产品,把Ai变成军团,把IP做成体系,IP+AI,才是超级个体的终极组合。2026,一起破局!为什么这场大课你必须要来?因为一件事已经发生了:AI已
不与君同
31 阅读
-
2026外贸业务员实操课程,这两节课帮你快速打通外贸全流程,实现首单突破
课程介绍:这两节课帮你快速打通外贸全流程!第一节课拆解前期准备,从选品、供应商对接,到公司注册、进出口权备案,手把手教你搞定基础搭建;第二节课聚焦核心获客与成交,分享谷歌、社媒低成本获客技巧,配套开发
矜持在于妩媚
49 阅读
撰写回复