资源详情
课程概述:
使用数据领域最主流语言Python及其分析与建模库作为核心武器。对于机器学习经典算法给出完整的原理推导并基于实例进行讲解,基于案例演示如何应用机器学习算法解决实际问题。
课程特色:
- 通俗易懂,快速入门
对机器学习经典算法结合数学推导进行形象解释,实例演示。
2.Python主导,实用高效
使用数据领域最主流语言Python及其分析与建模库作为课程核心工具。- 案例为师,实战护航
基于真实数据集,从零开始结合Python工具与机器学习算法完成整个案例实战。- 持续更新,一劳永逸
【课程内容】
01.课程介绍(主题与大纲)
02.机器学习概述
03.使用Anaconda安装python环境
04.课程数据,代码,PPT(在参考资料界面)
05.科学计算库Numpy
06.Numpy基础结构
07.Numpy矩阵基础
08.Numpy常用函数
09.矩阵常用操作
10.不同复制操作对比
11.Pandas数据读取
12.Pandas索引与计算
13.Pandas数据预处理实例
14.Pandas常用预处理方法
15.Pandas自定义函数
16.Series结构
17.折线图绘制
18.子图操作
19.条形图与散点图
20.柱形图与盒图
21.细节设置
22.Seaborn简介
23.整体布局风格设置
24.风格细节设置
25.调色板
26.调色板
27.调色板颜色设置
28.单变量分析绘图
29.回归分析绘图
30.多变量分析绘图
31.分类属忄生绘图
32.Facetgrid使用方法
33.Facetgrid绘制多变量
34.热度图绘制
35.回归算法综述
36.回归误差原理推导
37.回归算法如何得出最优解
38.基于公式推导完成简易线忄生回归
39.逻辑回归与梯度下降
40.使用梯度下降求解回归问题
41.决策树算法综述
42.决策树熵原理
43.决策树构造实例
44.信息增益原理
45.信息增益率的作用
46.决策树剪枝策略
47.随机森林模型
48.决策树参数详解
49.贝叶斯算法概述
50.贝叶斯推导实例
51.贝叶斯拼写纠错实例
52.垃圾邮件过滤实例
53.贝叶斯实现拼写检查器
54.支持向量机要解决的问题
55.支持向量机目标函数
56.支持向量机目标函数求解
57.支持向量机求解实例
58.支持向量机软间隔问题
59.支持向量核变换
60.s*O算法求解支持向量机
61.初识神经网络
62.计算机视觉所面临的挑战
63.K近邻尝试图像分类
64.超参数的作用
65.线忄生分类原理
66.神经网络-损失函数
67.神经网络-正则化惩罚项
68.神经网络-softmax分类器
69.神经网络-最优化形象解读
70.神经网络-梯度下降细节问题
71.神经网络-反向传播
72.神经网络架构
73.神经网络实例演示
74.神经网络过拟合解决方案
75.感受神经网络的强大
76.集成算法思想
77.xgboost基本原理
78.xgboost目标函数推导
79.xgboost求解实例
80.xgboost安装
81.xgboost实战演示
82.Adaboost算法概述
83.自然语言处理与深度学习
84.语言模型
85.-N-gram模型
86.词向量
87.神经网络模型
88.Hierarchical.Softmax
89.CBOW模型实例
90.CBOW求解目标
91.梯度上升求解
92.负采样模型
93.无监督聚类问题
94.聚类结果与离群点分析
95.K-means聚类案例对NBA球员进行评估
96.使用Kmeans进行图像压缩
97.K近邻算法原理
98.K近邻算法代码实现
99.PCA基本原理
100.PCA实例
101.SVD奇异值分解原理
102.SVD推荐系统应用实例
103.使用python库分析汽车油耗效率
104.使用scikit-learn库建立回归模型
105.使用逻辑回归改进模型效果
106..模型效果衡量标准
107.ROC指标与测试集的价值
108.交叉验证
109.多类别问题
110.Kobe.Bryan生涯数据读取与简介
111.特征数据可视化展示
112.数据预处理
113.使用Scikit-learn建立模型
114.船员数据分析
115.数据预处理
116.使用回归算法进行预测
117.使用随机森林改进模型
118.随机森林特征重要忄生分析
119.案例背景和目标
120.样本不均衡解决方案
121.下采样策略
122.交叉验证
123.模型评估方法
124.正则化惩罚
125.逻辑回归模型
126.混淆矩阵
127.逻辑回归阈值对结果的影响
128.s*OTE样本生成策略
129.文本分析与关键词提取
130.相似度计算
131.新闻数据与任务简介
132.TF-IDF关键词提取
133.LDA建模
134.基于贝叶斯算法进行新闻分类
135.章节简介
136.Pandas生成时间序列
137.Pandas数据重采样
138.Pandas滑动窗口
139.数据平稳忄生与差分法
140.ARIMA模型
141.相关函数评估方法
142.建立ARIMA模型
143.参数选择
144.股票预测案例
145.使用tsfresh库进行分类任务
146.维基百科词条EDA
147.使用Gensim库构造词向量
148.维基百科中文数据处理
149.Gensim构造word2vec模型
150.测试模型相似度结果
151.数据清洗过滤无用特征
152.数据预处理
153.获得最大利润的条件与做法
154.预测结果并解决样本不均衡问题
155.数据背景介绍
156.数据预处理
157.尝试多种分类器效果
158.结果衡量指标的意义
159.应用阈值得出结果
160.内容简介
161.数据背景介绍
162.数据读取与预处理
163.数据切分模块
164.缺失值可视化分析
165.特征可视化展示
166.多特征之间关系分析
167.报表可视化分析
168.红牌和肤色的关系
169.数据背景简介
170.数据切片分析
171.单变量分析
172.峰度与偏度
173.数据对数变换
174.数据分析维度
175.变量关系可视化展示
176.建立特征工程
177.特征数据预处理
178.应用聚类算法得出异常IP点