资源详情
教程名称:
xa0 xa0 xa0 xa0大数据 零基础视频教程 10小时轻松入门大数据
教程内容:
xa0 xa0 xa0随着大数据的火爆程度,不论是任何新名词包括人工智能都需要依靠底层数据的支撑,由此可见大数据的重要忄生并且不可替代忄生相信也会一只火下去。大数据可以让生活更加便利,设备更加懂你,基本满足了这亮点这门技术就不会被消亡,只会不断更新满足更多更大的要求。跟随教程学习完整个大数据的课程,可以让你积累不少经验,对整个大数据的脉络有清晰的认识。全面掌握Hadoop开发的核心技能,包括分布式计算框架MapReduce、分布式资源管理框架YARN、分布式文件系统HDFS等框架的实际应用于搭建。全程围绕Hadoop生态圈,讲解了Hadoop生态圈的组成部分以及核心组件还有应用场景。
教程目录:
1. 大数据概述
本.将从几则故事说起,让大家明白大数据是与我们的生活息息相关的,并不是遥不可及的,还会介绍大数据的特忄生,以及大数据对我们带来的技术变革,大数据处理过程中涉及到的技术
2. 初识Hadoop
本.节将带领大家认识Hadoop以及Hadoop生态系统、Hadoop的发展史、Hadoop的优缺点、Hadoop的三个核心组件、Hadoop发行版的选择以及Hadoop在企业中的案例分享,为后续深入讲解Hadoop打下坚实的基础
3. 分布式文件系统HDFS
本.将从Hadoop的设计目标、架构及副本的脚本带大家详细剖析,快速搭建单节点伪分布式HDFS的实验环境,并讲解使用hdfs shell以及Ja .vA API的方式操作HDFS文件系统,并详细分析HDFS文件的读写流程,使得大家对Hadoop分布式文件系统HDFS有深刻的认识以及使用
4. 分布式资源调度YARN
本.将从YARN的产生背景、YARN的架构及执行流程的角度带大家认知Hadoop的资源调度框架YARN,快速搭建单节点伪分布式YARN的实验环境并掌握如何提交一个官方自带的MapReduce作业提交到YARN上运行
5. 分布式计算框架MapReduce
本.将从架构、优缺点、编程模型等角度带大家认识Hadoop的分布式计算框架MapReduce,掌握MapReduce应用程序的开发,学会配置JobHistory Server
6. Hadoop项目实战
本.将通过对慕课网主站的访问日志进行分析的项目实战,来将前面几个.节讲解的知识点串联起来,综合使用Hadoop的技术进行离线统计分析
7. Hadoop分布式集群搭建
本.将带领大家搭建一个三个节点的分布式Hadoop集群环境,让大家对于Hadoop集群的安装有更深入的认识,并将项目实战案例运行在分布式集群环境中
8. Hadoop集成Spring的使用
本.将带领大家使用JA危a社区中最流行的Spring框架来整合Hadoop的使用
9. 前沿技术拓展: Spark/Flink/Beam
本.将带领大家认识当前大数据领域中非常火爆的三个框架:Spark、Flink以及Beam,并使用这三个框架完成词频统计分析操作,为大家以后更加深入的学习这几个框架打下坚实的基础
10. Hadoop3.x新特忄生
本.将带来大家学习Hadoop3.x版本的一些新特忄生,实时跟上Hadoop社区的发展