pyspark教程《PySpark-大数据开发》视频教学
内容介绍:
Spark是大数据体系的明星产品,是一款高性能的分布式内存迭代计算框架,可以处理海量规模的数据。本课程基于Python语言学习Spark3.2开发,课程的讲解注重理论联系实际,高效快捷,深入浅出,让初学者也能快速掌握。让有经验的工程师也能有所收获。学习完成后可以胜任高级级别的大数据相关岗位。
内容目录:
0-导学视频
PySpark导学.mp4 368.43M
第一部分-Spark基础入门
1-第一章
01-课程导入.mp4 5.67M
Spark基础入门-第一章-1.1-Spark简单介绍.mp4 46.18M
Spark基础入门-第一章-1.2-Spark风雨十年.mp4 61.13M
Spark基础入门-第一章-1.3-Spark和Hadoop的对比.mp4 75.02M
Spark基础入门-第一章-1.4-Spark四大特点.mp4 64.85M
Spark基础入门-第一章-1.5-Spark框架模块.mp4 57.79M
Spark基础入门-第一章-1.6-Spark运行模式.mp4 59.03M
Spark基础入门-第一章-1.7-Spark的架构角色.mp4 88.17M
Spark基础入门-第一章-总结.mp4 11.04M
2-第二章
Spark基础入门-第二章-2.1-课程服务器环境.mp4 43.60M
Spark基础入门-第二章-2.2-Local模式基本原理.mp4 88.65M
Spark基础入门-第二章-2.3-在Linux上服务器上安装Anaconda.mp4 268.55M
Spark基础入门-第二章-2.4-Spark Local模式部署.mp4 514.95M
3-第三章
Spark基础入门-第三章-3.1-StandAlone的运行原理.mp4 23.39M
Spark基础入门-第三章-3.2-StandAlone部署.mp4 624.20M
Spark基础入门-第三章-3.3-StandAlone程序测试.mp4 271.91M
Spark基础入门-第三章-3.4-Spark程序运行层次划分.mp4 255.49M
Spark基础入门-第三章-3.5-总结.mp4 34.76M
4-第四章
Spark基础入门-第四章-4.1-StandAlone HA模式的运行原理.mp4 63.25M
Spark基础入门-第四章-4.2-StandAlone 部署和测试.mp4 251.35M
Spark基础入门-第四章-4.3-总结.mp4 29.79M
5-第五章
Spark基础入门-第五章-5.1-Spark On YARN的运行原理.mp4 90.03M
Spark基础入门-第五章-5.2-Spark On YARN 部署和测试.mp4 214.69M
Spark基础入门-第五章-5.3-两种部署模式的区别.mp4 100.92M
Spark基础入门-第五章-5.4-两种部署模式的演示和总结.mp4 157.93M
Spark基础入门-第五章-5.5-两种模式任务提交流程.mp4 125.57M
Spark基础入门-第五章-5.6-总结.mp4 38.74M
6-第六章
Spark基础入门-第六章-6.1-框架和类库.mp4 42.43M
Spark基础入门-第六章-6.2-PySpark类库介绍.mp4 56.00M
Spark基础入门-第六章-6.3-PySpark安装.mp4 156.69M
Spark基础入门-第六章-6.4-总结.mp4 9.07M
7-第七章
Spark基础入门-第七章-7.1-本机配置Python环境.mp4 189.34M
Spark基础入门-第七章-7.2-PyCharm本地和远程解释器配置.mp4 106.98M
Spark基础入门-第七章-7.3-编程入口SparkContext对象以及WordCount演示.mp4 248.97M
Spark基础入门-第七章-7.4-WordCount代码流程解析.mp4 134.60M
Spark基础入门-第七章-7.5-提交WordCount到Linux集群运行.mp4 144.23M
Spark基础入门-第七章-7.6-总结.mp4 23.75M
8-第八章
Spark基础入门-第八章-8.1-Spark运行角色回顾.mp4 72.42M
Spark基础入门-第八章-8.2-分布式代码执行分析.mp4 156.84M
Spark基础入门-第八章-8.3-Python On Spark执行原理.mp4 135.93M
Spark基础入门-第八章-总结.mp4 11.95M
第二部分-SparkCore
1-第一章
SparkCore-第一章-1.1-什么是RDD.mp4 22.11M
SparkCore-第一章-1.2-RDD五大特性-特性1.mp4 15.74M
SparkCore-第一章-1.3-RDD五大特性-特性2.mp4 61.14M
SparkCore-第一章-1.4-RDD的五大特性-特性3.mp4 26.84M
SparkCore-第一章-1.5-RDD的五大特性-特性4.mp4 42.87M
SparkCore-第一章-1.6-RDD的五大特性-特性5.mp4.mp4 53.15M
SparkCore-第一章-1.7-WordCount结合RDD特性进行执行分析.mp4 205.30M
SparkCore-第一章-1.8-总结.mp4 21.49M
2-第二章
SparkCore-第二章-1-RDD的创建-1.mp4 31.39M
SparkCore-第二章-10-RDD算子-filter.mp4 37.06M
SparkCore-第二章-11-RDD算子-distinct.mp4 53.73M
SparkCore-第二章-12-RDD算子-union.mp4 31.62M
SparkCore-第二章-13-RDD算子-join.mp4 86.96M
SparkCore-第二章-14-RDD算子-intersection.mp4 29.46M
SparkCore-第二章-15-RDD算子-glom.mp4 9.26M
SparkCore-第二章-16-RDD算子-groupByKey.mp4 55.64M
SparkCore-第二章-17-RDD算子-sortBy.mp4 100.83M
SparkCore-第二章-18-RDD算子-sortByKey.mp4 78.44M
SparkCore-第二章-19-RDD算子-案例.mp4 146.47M
SparkCore-第二章-2-RDD的创建-2.mp4 210.02M
SparkCore-第二章-20-RDD算子-案例-提交到YARN执行.mp4 340.44M
SparkCore-第二章-21-RDD算子-countByKey.mp4 58.40M
SparkCore-第二章-22-RDD算子-reduce.mp4 53.11M
SparkCore-第二章-23-RDD算子-fold.mp4 57.46M
SparkCore-第二章-24-RDD算子-take-first-count-top.mp4 41.78M
SparkCore-第二章-25-RDD算子-takeSample.mp4 73.94M
SparkCore-第二章-26-RDD算子-takeOrdered.mp4 40.16M
SparkCore-第二章-27-RDD算子-foreach.mp4 72.47M
SparkCore-第二章-28-RDD算子-saveAsTextFile.mp4 118.39M
SparkCore-第二章-29-RDD算子-mapPartitions.mp4 86.75M
SparkCore-第二章-3-RDD算子概念和分类.mp4 67.11M
SparkCore-第二章-30-RDD算子-foreachPartition.mp4 37.86M
SparkCore-第二章-31-RDD算子-partitionBy.mp4 74.59M
SparkCore-第二章-32-RDD算子-repartition-coalesce.mp4 95.14M
SparkCore-第二章-33-RDD算子-面试题-groupByKey和reduceByKey的区别.mp4 56.50M
SparkCore-第二章-34-总结.mp4 10.35M
SparkCore-第二章-4-转换算子-map.mp4 104.95M
SparkCore-第二章-5-转换算子-flatMap.mp4 56.42M
SparkCore-第二章-6-转换算子-reduceByKey.mp4 21.36M
SparkCore-第二章-7-RDD算子-mapValues.mp4 40.74M
SparkCore-第二章-8-WordCount案例回顾.mp4 53.72M
SparkCore-第二章-9-RDD算子-groupBy.mp4 81.39M
3-第三章
SparkCore-第三章-1-RDD的数据是过程数据概念.mp4 52.26M
SparkCore-第三章-2-RDD的缓存.mp4 323.24M
SparkCore-第三章-3-RDD的CheckPoint.mp4 138.09M
SparkCore-第三章-4-总结.mp4 20.77M
4-第四章
SparkCore-第四章-1-jieba库入门使用.mp4 146.29M
SparkCore-第四章-2-案例需求1开发.mp4 373.43M
SparkCore-第四章-3-案例需求2开发.mp4 227.51M
SparkCore-第四章-4-案例需求3开发.mp4 140.39M
SparkCore-第四章-5-提交代码到YARN集群运行.mp4 153.12M
SparkCore-第四章-6-作业和总结.mp4 8.88M
5-第五章
SparkCore-第五章-1-广播变量.mp4 354.61M
SparkCore-第五章-2-累加器.mp4 213.12M
SparkCore-第五章-3-广播变量累加器综合案例.mp4 287.43M
SparkCore-第五章-4-总结.mp4 3.17M
6-第六章
SparkCore-第六章-1-DAG.mp4 86.26M
SparkCore-第六章-2-宽窄依赖和阶段划分.mp4 73.07M
SparkCore-第六章-3-内存迭代计算.mp4 217.51M
SparkCore-第六章-4-Spark并行度.mp4 86.48M
SparkCore-第六章-5-Spark任务调度.mp4 168.34M
SparkCore-第六章-6-Spark运行概念名词解释和层级梳理.mp4 90.16M
SparkCore-第六章-7-总结.mp4 14.97M
第三部分-SparkSQL
1-第一章
SparkSQL-第一章-SparkSQL基础入门.mp4 32.28M
2-第二章
SparkSQL-第二章-1-SparkSQL和Hive的异同以及SparkSQL的数据抽象.mp4 141.30M
SparkSQL-第二章-2-SparkSession执行环境入口构建和SparkSQL HelloWorld.mp4 142.14M
SparkSQL-第二章-3-总结.mp4 5.56M
3-第三章
SparkSQL-第三章-1-DataFrame对象的构成.mp4 18.96M
SparkSQL-第三章-10-DSL风格入门API.mp4 200.05M
SparkSQL-第三章-11-SQL风格入门API.mp4 73.21M
SparkSQL-第三章-12-WordCount案例.mp4 216.29M
SparkSQL-第三章-13-电影评分案例编程.mp4 530.20M
SparkSQL-第三章-14-SparkSQL Shuffle阶段分区数参数设定.mp4 108.97M
SparkSQL-第三章-15-异常数据处理API.mp4 300.02M
SparkSQL-第三章-16-DataFrame数据写出.mp4 153.07M
SparkSQL-第三章-17-DataFrame使用JDBC协议读写数据库(MySQL).mp4 176.64M
SparkSQL-第三章-18-总结.mp4 9.53M
SparkSQL-第三章-2-DataFrame创建-1.mp4 194.59M
SparkSQL-第三章-3-DataFrame创建-2.mp4 92.99M
SparkSQL-第三章-4-DataFrame创建-3.mp4 64.56M
SparkSQL-第三章-5-DataFrame创建-4-基于Pandas的DF转换为SparkSQL的DF对象.mp4 6.96M
SparkSQL-第三章-6-标准API读取text数据源构建DataFrame.mp4 69.29M
SparkSQL-第三章-7-标准API读取json构建DataFrame.mp4 32.21M
SparkSQL-第三章-8-标准API读取jcsv构建DataFrame.mp4 50.80M
SparkSQL-第三章-9-标准API读取jparquet构建DataFrame.mp4 65.29M
4-第四章
SparkSQL-第四章-1-UDF创建演示.mp4 228.18M
SparkSQL-第四章-2-注册返回值是数组类型的UDF.mp4 131.32M
SparkSQL-第四章-3-返回字典类型的UDF定义.mp4 145.40M
SparkSQL-第四章-4-拓展-通过RDD代码模拟UDAF效果.mp4 101.60M
SparkSQL-第四章-5-窗口函数的演示.mp4 170.80M
SparkSQL-第四章-6-总结.mp4 4.74M
5-第五章
SparkSQL-第五章-1-Catalyst优化器.mp4 54.68M
SparkSQL-第五章-2-SparkSQL执行流程及本章总结.mp4 42.14M
6-第六章
SparkSQL-第六章-SparkOnHive原理和配置及总结.mp4 334.22M
7-第七章
SparkSQL-第七章-分布式SQL的执行引擎原理和配置.mp4 309.39M
第四部分-案例
案例-案例背景及需求1开发.mp4 81.98M
案例-需求2开发.mp4 411.11M
案例-需求3开发.mp4 71.42M
案例-需求4开发.mp4 235.69M
第五部分-Spark新特性及核心回顾
Spark新特性及核心回顾-1-1-HashShuffleManager.mp4 101.99M
Spark新特性及核心回顾-1-2-SortShuffleManager.mp4 86.46M
Spark新特性及核心回顾-1-3-总结.mp4 18.48M
Spark新特性及核心回顾-2-1-3.0新特性-AQE.mp4 176.45M
Spark新特性及核心回顾-2-2-新特性-动态分区裁剪.mp4 47.10M
Spark新特性及核心回顾-2-3-新特性-koalas库.mp4 303.84M
Spark新特性及核心回顾-2-4-总结.mp4 24.25M
Spark新特性及核心回顾-3-Spark概念总结.mp4 60.94M
PySpark-资料
更多知识
-
阿冲文字组拆解进阶课
课程目录:第一节直播 .mp4第二节 .mp4第三节课 .mp4第四节-学习方法梳理 .mp4
笑中含恨╮
81 阅读
-
2026全新AI漫剧课程:覆盖创作全链路,教你写作分镜剪辑配音一站式打造漫剧作品
2026全新AI漫剧课程:覆盖创作全链路,教你写作分镜剪辑配音一站式打造漫剧作品一、课程内容简介本课程围绕AI漫剧基础全流程展开教学,从行业生态认知入手,系统讲解AI写作、小说转剧本、AI绘图、分镜脚
回眸一笑泪倾城
47 阅读
-
26年拼多多最新起店流程,从0-1让你全方位学习和了解
3月10日更新:拼多多2026最新线上课,从0-1让你全方位学习和了解!课程目录:2026.3.23号运营篇-26年最新版活动课程(二).mp42026.3.8运营篇-26年最新版活动课程(一).mp
无节奏不成方圆
69 阅读
-
叶建平:从0到1全面搭建企业财务管理体系
课程目录:1--财务观念篇_先导片 没有财务思维,再努力也赚不到钱.mp42--财务观念篇_第1章第1节 财务就是会计吗?.mp43--财务观念篇_第1章第2节 财务能给公司做什么?.mp44--财务
殇魂破
43 阅读
-
AI实战技能课,真正掌握AI领域的核心能力,把AI从”听懂了”变成”能用,能做,能交付,能复用
课程介绍:这不是一门”讲概念”的AI课,而是一门以结果为导向的实战技能课。课程核心目标很明确:帮助你真正掌握AI领域的核心能力,把AI从”听懂了”变成”能用,能做,能交付,能复用”。无论你是个人想提升
网名大全
87 阅读
-
AI亲人复活变身教学,最近超级火爆的项目,涨粉超级快,私域引流代做服务,收徒等
课程介绍最近网上这种账号超级火爆,帮助亲人复活。或者人物替换等。目前全网涨粉超级快,还可以私域引流代做服务。收徒等。今天云天就分享一下这个教程。课程目录飞书图文教学,简单易操作,一学就会
杀戮浪者
71 阅读
-
风翮设计思维觉醒课
课程目录:001.开篇_成为高手的第一步 .mp4002.第一章_成功设计的关键_《什么才是好设计》 .mp4003.第一章_成功设计的关键_《重识形状颜色》 .mp4004.第一章_成功设计的关键_
梦夏
41 阅读
-
吴梓境:资本思维翻转财富—人人都需要的资本思维课
课程目录:1_先导片.mp42_1、为什么人人都需要“资本思维”?普通人改变财富命运的机会.mp43_2、如何拥有资本思维?5步看清经济形势和赚钱风口.mp44_3、什么时候才能轮到我有钱?从房地产行
我陪着你走
52 阅读
撰写回复