资源详情
课程简介:
Python是一种面向对象、直译式计算机程序设计语言。也是一种功能强大而完善的通用型语言,已经具有十多年的发展历史,成熟且稳定。Python 具有脚本语言中最丰富和强大的类库,足以支持绝大多数日常应用。 Python语法简捷而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够很轻松的把用其他语言制作的各种模块(尤其是C/C++)轻松地联结在一起。
Python作为一门开源软件,最近几年在数据分析的领域上也大有作为,从12年13.3%的使用率到15年30.3%的使用率, Python已经逐渐成为数据分析与挖掘软件的后起之秀。作为一门编程语言,Python对于大部分的程序员来说可能会感到更亲切,而强大的扩展库支持,使得Python不仅仅在数据分析这一专业领域上有作为。与其他的专业统计软件相比,Python在非数据分析的领域中也得到很好的应用。
课程将从Python的基本使用方法开始,一步步讲解,从ETL到各种数据分析方法的使用,并结合实例,让学员能从中借鉴学习。
课程目录:
第一部分 Python基础
第一课:Python的概览——Python的基本介绍、安装与基本语法、变量类型与运算符
第二课:了解Python流程控制——条件、循环语句与其他语句
第三课:常用函数——函数的定义与使用方法、主要内置函数的介绍
第四课:NumPy基础——数组的创建、组合与分割
第二部分 数据分析的准备
第五课:了解数据——数据加载、储存与文件格式;异常值的清理与缺失值处理
第六课:数据清洗与初步分析——数据清理、转换、合并与重塑;数据汇总与描述统计;
第七课:绘图与可视化——基本绘图命令与图形概览、图形元素设定与实例:地震危机数据的可视化
第八课:数据聚合与分组处理——数据聚合、分组运算与转换、透视表与交叉表
第三部分 数据分析初探
第九课:假设检验——常用假设检验与实例分析
第十课:线忄生回归——线忄生回归模型、分析结果呈现与解读;实例:商品价格预测
第十一课: logistic回归——logistic回归模型讲解;实例:电信客户流失分析
第十二课:时间序列分析——时间序列基本处理、时间序列模型构建与结果解读;实例:未来股票价格预测
第四部分 深入数据分析
第十三课:分类算法——knn、决策树、贝叶斯分类器等算法介绍;实例:网页注册用户预测
第十四课:聚类算法——k-means算法介绍;实例:通信基站聚类分析
第十五课:降维方法——主成分分析与因子分析算法介绍;实例:地区经济指标评分