资源详情
大规模数据处理实战》由蔡元楠所作,蔡元楠是Google Brain资深工程师,《大规模数据处理实战》课程作者。本专栏课程通过实战带给你Google一线工程师的大数据架构实战经验。 已有7009 人已学习 · 共37讲 r n t大规模数据处理实战》 6 大模块 模块一 直通硅谷大规模数据处理技术 r n t这一模块从现有大规模数据处理技术中的问题入手,带你讨论新技术应有的特点和它可以解决的问题,并告诉你为什么会这样设计,最终用一个实战体验带你巩固顶层设计的知识。 模块二 实战学习大规模数据处理基本功 r n t万丈高楼平地起,在上手应用技术之前,有些基础知识你还需要掌握透彻。这一模块将庖丁解牛硅谷应用实例来讲解分布式系统中的核心知识点、现有的数据处理模式和架构等,为你的后续学习打好必备基础。 模块三 抽丝剥茧剖析Apache Spark设计精髓 r n t打好基础后,模块三的任务是深入拆解Apache Spark。通过实际案例,带你上手Spark这个围绕速度、易用忄生和复杂分析构建的大数据处理框架,同时引导你深入思考Spark的设计哲学。 模块四 Apache Beam为何能一统江湖 r n t模块四的内容会重点讲述Apache Beam的应用场景、模型和运行流程,教会你为什么它是这么设计的?优点在哪里?怎么解决实际问题? 模块五 决战 Apache Beam 真实硅谷案例 r n t破解“知易行难”的方法就是实战。模块五将先带你了解Beam独一无二的运行模型和应用示例,再用最实际的硅谷一线大厂案例来教会你使用Apache Beam,真正解决你工作中可能会遇到的问题。 模块六 大规模数据处理的挑战与未来 r n t数据量不会停止增长,5G时代即将到来,未来的数据处理技术又会面临哪些机遇与挑战?大规模数据处理在深度学习领域又是如何应用的?这一模块跟你一起探讨。 r n t《大规模数据处理实战》课程目录 r n t0.从这里开始,帯你走上硅谷一线系统架构师之路 模块一:直通硅谷大规模数据处理技术 r n t1.为什么MapReduce会被硅谷一线公司淘汰? r n t2. MapReduce后谁主沉浮:怎样设计下一代数据处理技术? r n t3.大规模数据处理初体验:怎样实现大型电商热销榜? 模块二:实战学习大规模数据处理基本功 r n t4.分布式系统(上):如何用服务等级协议SLA来评估你的系统? r n t5.分布式系统(下):架构师不得不知的三大指标 r n t6.如何区分批处理还是流处理? r n t7.Workflow设计模式:让你在大规模数据世界中君临天下 r n t8.发布/订阅模式:流处理架构中的瑞士军刀 r n t9. CAP定理:三选二,架构师必须学会的取舍 r n t10.Lambda架构:Twitte「千亿级实时数据分析架构背后的倚天剑 r n t11.Kappa架构:使用Kafka锻造的屠龙刀 模块三:抽丝剥茧剖析Apache Spark设计精髓 r n t12. Spark的独有优势:为什么世界需要Spark? r n t13.弹忄生分布式数据集:Spark大厦的地基为何如此设计(上) r n t14.弹忄生分布式数据集:Spark大厦的地基为何如此设计(下) r n t15.Spark SQL: Spark数据查询的利器 r n t16.如何用Spark DataFrame API进行实时数据分析? r n t17.Spark Streaming: Spark 的实时流计算 API r n t18. WordCount:从零开始运行你的第一个Spark应用 r n t19.综合案例实战:力口州房屋信息的线忄生回归模型&成年人收入的预测模型 r n t20.更多、更快、更好、更省:实例解析Spark应用程序忄生能优化 r n t21.深入对比Flink与Spark:帮你的系统设计两开花 模块四:Apache Beam为何能一统江湖 r n t22.Apache Beam的前世今生 r n t23.站在Google的眉膀上学习Beam编程模型 r n t24. PCollection:为何Beam要如此抽象封装数据? r n t25. Beam数据转换操作的抽象方法 r n t26. Pipeline: Beam如何抽象多步骤的数据流水线? r n t27. Pipeline I/O: Beam数据中转的设计模式 r n t28.如何设计好一个Beam Pipeline? r n t29.如何测试Beam Pipeline? 模块五:决战Apache Beam真实硅谷案例 r n t30. Apache Beam 实战冲刺:Beam 如何 run everywhere? r n t31.WordCount Beam Pipeline 实战 r n t32. Beam Window:打通流处理的任督二脉 r n t33.横看成岭侧成峰:再战Streaming WordCount r n t34. Amazon 热销榜 Beam Pipeline 实战 r n t35.Facebook游戏实时流处理Beam Rpeline实战(上) r n t36.Facebook游戏实时流处理Beam Rpeline实战(下) 模块六:大规模数据处理的挑战与未来 r n t37. 5G时代,如何处理实时超大规模物联网数据?
下载地址
链接:https://pan.baidu.com/s/11AsHhR5RfgkqcgzQHgZbzg 密码:ihxa 解压密码:未加密,无解压密码